KR20220051259A - 표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조 - Google Patents

표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조 Download PDF

Info

Publication number
KR20220051259A
KR20220051259A KR1020227010378A KR20227010378A KR20220051259A KR 20220051259 A KR20220051259 A KR 20220051259A KR 1020227010378 A KR1020227010378 A KR 1020227010378A KR 20227010378 A KR20227010378 A KR 20227010378A KR 20220051259 A KR20220051259 A KR 20220051259A
Authority
KR
South Korea
Prior art keywords
crispr
nuclease
sequence
nucleic acid
rna
Prior art date
Application number
KR1020227010378A
Other languages
English (en)
Inventor
에릭 이스틸룬운드
지강 짱
그레고리 디. 데비스
카차리 월터 벨러
제프리 이반 고던
Original Assignee
시그마-알드리치 컴퍼니., 엘엘씨
워싱턴 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시그마-알드리치 컴퍼니., 엘엘씨, 워싱턴 유니버시티 filed Critical 시그마-알드리치 컴퍼니., 엘엘씨
Publication of KR20220051259A publication Critical patent/KR20220051259A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/65Tetracyclines
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/002Vectors comprising a special translation-regulating system controllable or inducible

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

요약서
본원에서는 미생물 복합체 집단을 리모델링하기 위한 조성물 및 방법이 제공된다. RNA-유도된 뉴클레아제 시스템은 표적화된 원핵생물의 염색체 DNA에 있는 부위를 표적으로 하도록 공작되며, 이때 원핵생물의 혼합 집단 내에서 표적화된 원핵생물의 수준이 변조될 수 있다.

Description

표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조
관련된 출원
본 출원은 2019년 9월 30일자로 제출된 미국 가특허 출원 번호 62/908,130, 2019년 10월 1일자로 제출된 미국 가특허 출원 번호 62/909,078, 그리고 2020년 7월 16일자로 제출된 미국 가특허 출원 번호 63/052,825에 대해 우선권을 주장하며, 이들 각각은 본원에 참고자료로 편입된다.
서열 목록
본 출원은 EFS-Web을 통하여 ASCII 포멧으로 제출된 서열 목록을 포함하며, 이의 전문이 본 명세서의 참고자료에 편입된다. ASCII 사본은 2020년 xx일자로 생성되었으며, _.txt이름으로 불리며, 크기는 _바이트이다.
분야
본 명세서는 미생물총의 조성물을 리모델링하기 위한 조성물 및 방법에 관한 것이다.
미생물 집단의 조성과 발현된 기능을 제어하는 것은 의학, 생명 공학 및 환경 주기의 중요한 측면이다. 고전적인 항균 전략으로 어느 정도의 제어가 제공되지만, 밀접하게 관련된 미생물의 구별과, 미생물 집단의 조성을 세밀하게 제어할 수 있는, 일반화되고, 프로그래밍 가능한 전략은 여전히 찾기 힘들다. 최근의 발전은 RNA-유도된 뉴클레아제 시스템이 미생물 집단에서 특정 DNA 서열을 표적으로 하도록 설계될 수 있음을 나타낸다. 다종-박테리아 집단에서 특정 종을 표적으로 하고, 제거하기 위한 유사한 전략을 사용하는 것이 유익할 것이다.
특허 또는 출원 파일에는 컬러로 실행된 도면이 적어도 하나 포함되어 있다. 컬러 도면이 있는 이 특허 또는 특허 출원 간행물의 사본은 요청 및 필요한 요금 지불시, 특허청(Office)에서 제공한다.
도 1은 통합된, 유도성 CRISPR 시스템을 이용한 표적화된 미생물총 변조(modulation)를 도시한다. CRISPR 시스템(Cas9 엔도뉴클레아제 및 가이드 RNA)의 발현으로 염색체 파손을 초래하고, 궁극적으로 박테리아에서 세포 사멸로 이어진다. 따라서, 표적화 가이드 RNA와 함께, 통합된 CRISPR 카세트를 품고있는 특정 박테로이드(Bacteroides) 균주는 안하이드테트라사이클린 (aTc) 유도 시 혼합된 집단으로부터 제거될 수 있다.
도 2는 CRISPR 통합 벡터를 도해한 것이다. Cas9 단백질은 안하이드테트라사이클린 (aTc)-유도성 프로모터로부터 발현된다. 단일 가이드 RNA (N20-sgRNA 스캐폴드)는 P1 프로모터는 구성적으로 발현되며, 이때 20개 뉴클레오티드 프로토스페이서(protospacer) 서열 (N20)은 PAM이 존재할 때, (스트렙토코커스 피오게네스(Streptococcus pyogenes) CRISPR/Cas9) 경우에는 NGG임), 표적화된 DNA 절단(cleavage)을 명시한다.
도 3A-3C는 인간 장-으로부터 유래된 박테리아, 박테로이드( 테타이오타오미크론(Bacteroides thetaiotaomicron) (Bt)에서 CRISPR 시스템의 염색체 통합을 설명한다. 도 3A는 NBU2 통합 기전을 도시한다. 도 3B는 콘쥬게이션(conjugation)을 통하여 Bt로의 CRISPR 통합을 보여는다. 도 3C는 CRISPR 구성요소들(integrants)의 콜로니 PCR 스크리닝을 제시한다. PCR A: attBT2-1 유전자좌, 바깥쪽 프라이머; PCR B: attBT2-2 유전자좌, 바깥쪽 프라이머; PCR C: attBT2-1 유전자좌, 좌측 졍션; PCR D: attBT2-2 유전자좌, 좌측 졍션. M1-M4: 비-표적화, 제어 gRNA와 함께 4개의 Bt 콜로니; T1-T4: tdk-표적화 gRNA와 함께 4개의 Bt 콜로니; susC-표적화 gRNA와 함꼐 S1-S4: 4개의 Bt 콜로니.
도 4A-4B는 통합된 CRISPR 시스템을 이용한 개별 박테로이드(Bacteroides) 균주의 유도된 CRISPR 사멸을 도시한다. 도 4A는 혈액 한천 플레이트상에 결과를 제시한다. 선별된 CRISPR 구성요소들 (M1 및 T1)의 경우, TYG + Gm 200, Em 25의 튜브 배양물을 희석하였고, 각각 차례로 0 및 100 ng/ml 농도의 안하이드테트라사이클린 (aTc)이 보충된 BHI 혈액 한천 플레이트 (Gm 200, Em 25) 상에 도말하였다 (24h 튜브 배양물, 10-6 희석, 100μl 스프레드) 세포를 혐기적으로 37℃에서, 40h 동안 항온처리하였다. 도 4B는 TYG 액체 배지에서의 결과를 보여준다. 새로운 콜로니로부터 선별된 CRISPR 구성요소들 (M1, M2, T1, T3, S1, S2)을 TYG 배지에서OD600nm ~0.6이 되도록 37℃에서 혐기적으로 성장시키고, 1:100 희석물을 각각 차례로 0, 10 및 100 ng/ml 농도의 aTc가 보충된 새로운 TYG 액체 배지 (Gm 200, Em 25)에서 성장시켰다. 37℃에서 24h 동안 혐기성 조건 하에서 배양하는 동안 성장을 사정하였다.
도 5A-5C시험관내에서 혼합 집단에서 특정 박테로이드(Bacteroides) 균주의 표적화된, 유도성 CRISPR 사멸을 나타낸다. 새로운 콜로니로부터 선별된 CRISPR 구성요소들 (M1, T1, S1)을 OD600nm ~0.6이 되도록 37oC에서 6h 동안 혐기적으로 성장시켰다. 세포 배양물 (1:100 희석)의 동일 부피를 혼합하였고, 차례로 0, 10 및 100 ng/ml 농도의 aTc가 보충된 새로운 TYG 액체 배지 (Gm 200, Em 25)에 추가하였다. 이들 배양물을 혐기적으로 37℃에서, 24h 동안 항온처리하였다. 도 5A: OD600nm 측정. 도 5B: 차례로 0, 10 및 100 ng/ml 농도의 aTc로 처리된 배양물을 가이드 RNA 영역 (Cas9 및 NBU2 코딩 서열에 결합하는 프라이머, 앰플리콘 크기 1.5 kb)를 증폭시키는 PCR을 실행하였고, 이어서 Sanger DNA 서열화시켰다. aTc로 처리된 배양물은 오로지 비-표적화 제어 gRNA만을 갖는다. 도 5C: M1+S1_aTc100의 배양물을 희석시키고 (10-6), BHI 혈액 한천 플레이트 (Gm 200, Em 25) 상에 도말하였고, 37oC에서 40h 동안 항온처리하여, 단일 콜로니를 획득하였다. 5개의 선별된 단일 콜로니에 대해 가이드 RNA 영역을 증폭시키는 콜로니 PCR을 수행하였고, 한천 플레이트로부터 혼합물을 긁어낸 후(scrape), Sanger DNA 서열화를 함으로써, 성장된 모든 클론이 오로지 비-표적화, 제어 gRNA만을 품고 있음을 보여준다.
도 6박테로이드 불가투스(Bacteroides vulgatus) (Bv) 염색체 상의 CRISPR 통합을 실증한다. 각 콘쥬게이션으로부터 콜로니, Bv.M (VM1, VM2, VM3, VM4, VM5, VM6 및 VM7로 표지됨), 및 susC_Bv (V1, V2, V3, V4, V5로 표지됨)를 찍어내어 콜로니 PCR 스크리닝을 하였다. 0, Bv 야생형 균주; M, DNA 사다리(ladder). PCR A (바깥쪽 프라이머, 0.5 또는 0 kb)를 이용하여 attBv.3-1 유전자좌에서 통합을 스크리닝하였고; PCR B (바깥쪽 프라이머, 0.5 또는 0 kb)을 이용하여 attBv.3-2 유전자좌에서 통합을 스크리닝하였고, 그리고 PCR C (바깥쪽 프라이머, 0.6 또는 0 kb)을 이용하여 attBv.3-3 유전자좌에서 통합을 스크리닝하였다. PCR D (ermG 코딩 서열에 결합하는 바깥쪽 프라이머 및 내부 프라이머, 0.6 또는 0 kb: attBv.3-1 유전자좌 통합의 좌측 졍션)을 이용하여 선별된 클론의 경우 통합된 염색체 및 통합 플라스미드 서열의 졍션을 확인하였다. 좌측 패널: 비-표적화, 제어 가이드 RNA (M)와 함께 통합된 균주; 우측 패널: 표적화 susC_Bv 가이드 RNA와 함께 통합된 균주.
도 7A-7CB. 테타이오타오미크론(B. thetaiotaomicron) CRISPR-돌연변이체의 성장의 특징을 도시한다 . 도 7A: B. 테타이오타오미크론(B. thetaiotaomicron) VPI-5482 CRISPR 돌연변이를 공작하기 위한 플라스미그 디자인. 도 7B: 스크램블된 gRNA 또는 tdk 표적화 gRNA를 함유하는 Bt 돌연변이체는 혈액 한천 플레이트 ± 200 ng/mL aTc에서 배양하였다. 도 7C: 9ng/mL aTc를 함유하는 LYBHI 배지에서 성장시켰을 때, Bt CRISPR 돌연변이의 경우에 대해 OD600=0.2를 달성하는 데 필요한 시간의 상자 플롯.
도 8A-8DB. 테타이오타오미크론(B. thetaiotaomicron) 녹다운을 도시한다. 도 8A: 실험 기획. 화살표는 성인 남성 무균 C57Bl/6J 마우스에 컨소시엄의 위관영양 시간을 나타낸다; 각 수령 마우스에게 Tc를 투여하지 않을 때, 1-8일차 시점에 0.5% 에탄올 비히클을 제공하였다. 도 8B, 8C: 수평 막대로 표시된 각 처리 조건 및 Tc 노출에 대한 시간 경과에 따른 Bt 또는 B. 셀룰로실리티쿠스(B. cellulosilyticus) 상대적 풍도. 도 8D: 비히클 대조군 부분(arm)에 비교하여, 4-일 처리 부분에서 각 시점에서의 각 컨소시움 구성부(열)의 상대적 풍도의 정중값 (%)에서 차이를 도시하는 히트맵.
도 9A-BB. 테타이오타오미크론(B. thetaiotaomicron) 누락을 도시한다. 도 9A: 실험 기획. 화살표는 13-구성부 또는 12-구성부 컨소시엄의 도입 시기를 나타낸다. 도 9B: 13-구성부 (12 균주 + Bt) 공통체(community) 부분과 비교하여, 12-구성부 공통체 처리 부분에서 각 시점에서(줄) 각 컨소시움 구성부에 대한 상대적 풍도 정중값 (%) (열)의 차이를 도시하는 히트맵.
도 10은 안정적으로 유지된, 유도성 CRISPR 시스템을 이용하여 표적화된 미생물총 변조를 도시한다. CRISPR 시스템(Cas9 엔도뉴클레아제 및 가이드 RNA)의 발현으로 염색체 파손을 초래하고, 궁극적으로 박테리아에서 세포 사멸로 이어진다. 따라서, 표적화 가이드 RNA와 함께, 안정적으로 유지된 CRISPR 카세트를 품고있는 특정 박테로이드(Bacteroides) 균주는 안하이드테트라사이클린 (aTc) 유도 시 혼합된 집단으로부터 제거될 수 있다.
도 11A-D는 혈액 한천 플레이트의 사진들이다. 도 11A는 혈액 BHI 플레이트 상에서 aTc 유도와 함께, 또는 이러한 유도 없이(좌측은 aTc가 없고, 우측은 100 ng/ml aTc이 있음), 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)에서 pRepA-CRISPR 표적화 susC의 10-4 희석을 도시한다. 도 11B는 혈액 BHI 플레이트 상에서 aTc 유도와 함께, 또는 이러한 유도 없이(좌측은 aTc가 없고, 우측은 100 ng/ml aTc이 있음), 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)에서 pRepA-CRISPR 표적화 susC의 10-6 희석을 도시한다. 도 11C는 혈액 BHI 플레이트 상에서 aTc 유도와 함께, 또는 이러한 유도 없이(좌측은 aTc가 없고, 우측은 100 ng/ml aTc이 있음), 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)에서 비-표적화 pRepA-CRISPR의 10-4 희석을 도시한다. 도 11D는 혈액 BHI 플레이트 상에서 aTc 유도와 함께, 또는 이러한 유도 없이(좌측은 aTc가 없고, 우측은 100 ng/ml aTc이 있음), 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)에서 비-표적화 pRepA-CRISPR의 10-6 희석을 도시한다.
도 12는 통합된, 유도성 CRISPR 시스템을 이용한 표적이 되는 미생물총 변조를 실증한다. CRISPR 시스템 (Cas9 엔도뉴클레아제 및 가이드 RNA)의 발현으로 염색체 파괴가 되며, 궁극적으로 박테리아에서 세포 사멸로 이어진다. 이와 같이, 표적 가이드 RNA와 통합된 CRISPR 카세포를 품고 있는 특이적 박테로이드(Bacteroides) 균주는 안하이드로테트라사이클린(aTc)의 제자리 유도시, 혼합 집단으로부터 제거될 수 있다.
도 13A-B는 플라스미드 pNBU2-CRISPR.susC_BWH2-19는 t-RNA-Ser 유전자에서 attBWH2 부위 BcellWH2_RS22795에만 통합됨을 도시한다. 플라스미드 통합 부위의 5' 단부는 도 13A에 나타내고, 플라스미드 통합 부위의 3' 단부는 도 13B에 나타낸다.
도 14는 실시예 13에서 기술된 바와 같이, 24시간 성장-후 실시된 OD600nm 판독을 도시한다.
본 명세서는 풍부한 표적화된 균주의 선택적 녹다운에 의해 복합 미생물 집단의 리모델링에 사용될 수 있는 공작된 RNA-유도된 뉴클레아제 시스템을 제공한다. 구체적으로, RNA-유도된 뉴클레아제 시스템은 표적화된 원핵생물 종의 염색체 DNA에 있는 부위를 표적으로 삼도록 공작되며, 여기에서 용어 "원핵생물"이란 박테리아 및 고세균류 영역의 구성원을 지칭한다. 본원에 기술된 조성물 및 방법을 이용하여 살아있는 동물에서 미생물 공통체 구성을 생체외(ex vivo) 변조시킬 수 있다.
(I) 단백질-핵산 복합체
본 명세서의 한 측면은 원핵생물의 염색체와 연합된 공작된 RNA-유도된 뉴클레아제 시스템을 포함하는 단백질-핵산 복합체를 제공하며, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 이 염색체에 있는 부위로 표적화되고, 상기 박테리아 염색체는 서열 식별 번호: 1 (MNKADLISAVAAEAGLSKVDAKKAVEAFVSTVTKALQEGDKVSLIGFGTFSVAERSARTGINPSTKATITIPAKKVTKFKPGAELADAIK)의 아미노산 서열에 대해 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 HU 패밀리 DNA-결합 단백질을 인코드하고, 그리고 상기 박테리아 종의 염색체는 서열 식별 번호: 1의 아미노산 서열에 대해 적어도 50% 서열 동일성을 갖는 HU 패밀리 DNA-결합 단백질과 연합된다. 일반적으로, 상기 박테리아 종의 염색체 DNA를 표적으로 하는 RNA-유도된 뉴클레아제 시스템은 관심대상 유기체에 내인성인 자연 발생 RNA-유도된 뉴클레아제(가령, CRISPR) 시스템이 아니다.
RNA-유도된 뉴클레아제 시스템은 DNA 엔도뉴클레아제 (가령, CRISPR 뉴클레아제)를 포함하며, 이의 절단 활성은 RNA (가령, 가이드 RNA)에 의해 지시된다. 상기 원핵생물은 HU 패밀리 단백질을 발현시키고, 이는 해당 원핵생물의 염색체 DNA와 연합된다. 따라서, 본원에서 기술된 단백질-핵산 복합체는 DNA/단백질 복합체 (원핵생물 염색체 DNA 및 연합된 HU 패밀리 단백질)에 결합된 리보핵산단백질 복합체 (CRISPR 뉴클레아제/gRNA)를 포함한다.
(a) RNA-유도된 뉴클레아제 시스템
본원에서 기술된 단백질-핵산 복합체는 RNA-유도된 뉴클레아제 시스템을 포함하며, 이 시스템은 절단 활성이 RNA (가령, 가이드 RNA)에 의해 지시되는 DNA 엔도뉴클레아제를 포함한다. 하기에서 상술되는 바와 같이, gRNA는 심대상 핵산 (가령, 원핵생물 염색체)에서 특정 서열을 인지하고, 이를 표적으로 삼도록 공작될 수 있다.
일반적으로, RNA-유도된 엔도뉴클레아제는 클러스터된 규칙적으로 간격을 둔 짧은 회문 반복 (CRISPR) 뉴클레아제다. CRISPR 뉴클레아제는 박테리아성 또는 고세균류의 뉴클레아제일 수 있다. 일부 상황 하에서, CRISPR 뉴클레아제는 유형 I CRISPR 시스템, 유형 II CRISPR 시스템, 유형 III CRISPR 시스템, 유형 IV CRISPR 시스템, 유형 V CRISPR 시스템, 또는 유형 VI CRISPR 시스템의 것일 수 있다. 특정 구체예들에서, CRISPR 뉴클레아제는 단일-하위단위 작동체 시스템, 이를 테면, 유형 II, 유형 V, 또는 유형 VI 시스템의 것일 수 있다. 각종 구체예들에서, CRISPR 뉴클레아제는 유형 II Cas9 뉴클레아제, 유형 V Cas12 (예전에는 Cpf1로 불림) 뉴클레아제, 유형 VI Cas13 (예전에는 C2cd로 불림) 뉴클레아제, CasX 뉴클레아제, 또는 CasY 뉴클레아제일 수 있다.
CRISPR 뉴클레아제는 하기에서 유래될 수 있다:아크라요클로리스(Acaryochloris) 종., 아세토할로비움(Acetohalobium) 종., 아시다미노코쿠스(Acidaminococcus) 종., 아시디티오바실루스(Acidithiobacillus) 종., 아시도테르무스(Acidothermus) 종., 아케르만시아(Akkermansia) 종., 알리시클로바실러스(Alicyclobacillus) 종., 알로크로마티움(Allochromatium) 종., 아모니펙스(Ammonifex) 종., 아나베나(Anabaena) 종., 아르트로스피라(Arthrospira) 종., 바실러스(Bacillus) 종., 비피도박테리움(Bifidobacterium) 종., 부르크홀데리알레스(Burkholderiales) 종., 칼리디셀룰로시럽토르(Caldicelulosiruptor) 종., 캄필로박터(Campylobacter) 종., 칸디다투스(Candidatus) 종., 클로스트리디움(Clostridium) 종., 코리네박테리움(Corynebacterium) 종., 크로코스페라(Crocosphaera) 종., 시야노테세(Cyanothece) 종., 델타프로테오박테리움(Deltaproteobacterium) 종., 엑시구오박테리움(Exiguobacterium) 종., 피네골디아(Finegoldia) 종., 프란시셀라(Francisella) 종., 케테도노박터(Ktedonobacter) 종., 라치노스피라세에(Lachnospiraceae) 종., 락토바실러스(Lactobacillus) 종., 렙토트리키아(Leptotrichia) 종., 린바야(Lyngbya) 종., 마리노박터(Marinobacter) 종., 메타노홀라비움(Methanohalobium) 종., 미크로쉬라(Microscilla) 종., 미크로롤레우스(Microcoleus) 종., 미크로시스티스(Microcystis) 종., 미코플라스마(Mycoplasma) 종., 나트라네로비우스(Natranaerobius) 종., 네이세리아(Neisseria) 종., 나투러타푸럭토(Nitratifractor) 종., 니트로소코쿠스(Nitrosococcus) 종., 노카르디옵시스(Nocardiopsis) 종., 노둘라리아(Nodularia) 종., 노스톡(Nostoc) 종., 오에노코쿠스(Oenococcus) 종., 오실라토리아(Oscillatoria) 종., 파라수테레라(Parasutterella) 종., 페로토마쿠룸(Pelotomaculum) 종., 페트로토가(Petrotoga) 종., 플란토미세스(Planctomyces) 종., 포라로모나스(Polaromonas) 종., 프레보텔라(Prevotella) 종., 슈도알레로모나스(Pseudoalteromonas) 종., 랄스토니아(Ralstonia) 종., 루미노코쿠스(Ruminococcus) 종., 스타필로코커스(Staphylococcus) 종., 스트렙토코커스(Streptococcus) 종., 스트렙토미세스(Streptomyces) 종., 스트렙토스포란기움(Streptosporangium) 종., 시네쵸코쿠스(Synechococcus) 종., 테스로시포(Thermosipho) 종., 베루코미크로비아(Verrucomicrobia) 종., 또는 워리넬라(Wolinella) 종.
일부 측면들에서, CRISPR 뉴클레아제는 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9, 프란시셀라 노비씨다(Francisella novicida) Cas9, 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9, 스트렙토코커스 테으로필러스(Streptococcus thermophilus) Cas9, 스트렙토코커스 파스테우리아누스(Streptococcus pasteurianus) Cas9, 캄필로박터 제주니(Campylobacter jejuni) Cas9, 네이세리아 메닝지티스(Neisseria meningitis) Cas9, 네이세리아 씨네레아(Neisseria cinerea) Cas9, 프란시셀라 노비씨다(Francisella novicida) Cas12, 아시다미노코쿠스(Acidaminococcus) 종 Cas12, 라치노스피라세에(Lachnospiraceae) 박테리아 ND2006 Cas12a, 렙토트리키아 와데이(Leptotrichia wadeii) Cas13a, 렙토트리키아 샤히(Leptotrichia shahii) Cas13a, 프레보텔라(Prevotella) 종. P5-125 Cas13, 루미노코쿠스 플라베파시엔스(Ruminococcus flavefaciens) Cas13d, 델타프로테오박테리움(Deltaproteobacterium) CasX, 플란토미세스(Planctomyces) CasX, 또는 칸디다투스(Candidatus) CasY일 수 있다.
CRISPR 뉴클레아제는 야생형 또는 자연-발생적 단백질일 수 있다. 야생형 CRISPR 뉴클레아제는 두 개의 뉴클레아제 도메인을 일반적으로 포함하는데, 가령, Cas9 뉴클레아제는 RuvC 도메인과 HNH 도메인을 포함하며, 각 도메인은 이중-가닥으로 된 서열의 한 개 가닥을 절단한다. CRISPR 뉴클레아제는 가이드 RNA (가령, REC1, REC2) 또는 RNA/DNA 이종듀클렉스 (가령, REC3)와 상호작용하는 도메인, 그리고 프로토스페이서-인접 모티프 (PAM)와 상호작용하는 도메인 (, PAM-상호작용 도메인)을 또한 포함한다.
대안으로, CRISPR 뉴클레아제는 개선된 표적화 특이성, 개선된 충실성, 변경된 PAM 특이성, 감소된 표적-외 효과, 및/또는 증가된 안정성을 갖도록 변형될 수 있다. 예를 들면, CRISPR 뉴클레아제는 하나 또는 그 이상의 돌연변이 (, 적어도 하나의 아미노산의 치환, 결손, 및/또는 삽입)를 포함하도록 변형될 수 있다. 표적화 특이성을 개선시키고, 충실성을 개선시키거나, 및/또는 표적-외 효과를 감소시키는 하나 또는 그 이상의 돌연변이의 비-제한적인 예로는 N497A, R661A, Q695A, K810A, K848A, K855A, Q926A, K1003A, R1060A, 및/또는 D1135E 이 포함된다(SpyCas9의 번호매김 체계를 참고).
각종 구체예들에서, CRISPR 뉴클레아제는 (, 이중-가닥으로 된 뉴클레오티드 서열의 두 가닥 모두를 절단하거나, 또는 단일-가닥으로 된 뉴클레오티드 서열을 절단하는) 뉴클레아제일 수 있다. 기타 구체예에서, CRISPR 뉴클레아제는 이중-가닥으로 된 서열중 한 가작을 절단하는 니카제(nickase)일 수 있다. 상기 니카제는 CRISPR 뉴클레아제의 뉴클레아제 도메인중 하나의 비활성화를 통하여 공작될 수 있다. 예를 들면, Cas9 단백질의 RuvC 도메인은 돌연변이, 이를 테면, D10A, D8A, E762A, 및/또는 D986A에 의해 비-활성화되거나, 또는 Cas9 단백질 도메인의 HNH는 돌연변이, 이를 테면, H840A, H559A, N854A, N856A, 및/또는 N863A에 의해 비활성화되어 (스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9의 번호매김 체계를 참고하여, SpyCas9), Cas9 니카제 (가령, nCas9)를 만든다. 다른 CRISPR 뉴클레아제에서 필적가능한 돌연변이가 니카제 (가령, nCas12)를 만들 수 있다.
CRISPR 시스템은 또한 가이드 RNA를 포함한다. 가이드 RNA는 CRISPR 뉴클레아제, 그리고 관심대상 핵산에서 표적 서열과 상호작용하여, CRISPR 뉴클레아제를 해당 표적 서열로 안내한다. 상기 표적 서열은 프로토스페이스 인접 모티프 서열 (protospacer adjacent motif: PAM)에 인접한 서열을 제외하고, 서열 제한이 없다. 상이한 CRISPR 뉴클레아제는 상이한 PAM 서열을 인지한다. 예를 들면, Cas9 단백질의 PAM 서열에는 5'-NGG, 5'-NGGNG, 5'-NNAGAAW, 5'-NNNNGATT, 및 5-NNNNRYAC가 내포되며, 그리고 Cas12 단백질의 PAM 서열에는 5'-TTN 및 5'-TTTV가 내포되며, 이때 N은 임의의 뉴클레오티드로 특정되며, R은 G 또는 A로 특정되며, W는 A 또는 T로 특정되며, Y는 C 또는 T로 특정되며, 그리고 V는 A, C, 또는 G로 특정된다. 일반적으로, Cas9 PAMs은 상기 표적 서열의 3'에 위치하고, 그리고 Cas12 PAMs는 상기 표적 서열의 5'에 위치한다.
가이드 RNAs는 특정 CRISPR 뉴클레아제와 복합되도록 공작된다. 일반적으로, 가이드 RNA는 (i) 상기 표적 부위에서 혼성화되는, 5' 단부에 가이드 또는 스페이서 서열을 함유하는 CRISPR RNA (crRNA), 그리고 (ii) CRISPR 뉴클레아제와 상호작용하는 트랜스액팅 crRNA (tracrRNA) 서열을 포함한다. 각 가이드 RNA의 가이드 또는 스페이서 서열은 상이하다 (, 특이적 서열이다). 상기 가이드 RNA 서열의 나머지는 특정 CRISPR 뉴클레아제와 복합되도록 기획된 가이드 RNAs에서 일바적으로 동일하다
crRNA는 5' 단부에 가이드 서열, 그리고 3' 단부의 추가 서열을 포함하는데, 이들은 tracrRNA의 5' 단부 서열과 염기-쌍을 형성하여 이중 구조를 형성하고, tracrRNA는 적어도 하나의 스템-루프 구조를 형성하는 추가 서열을 포함하며, 이는 CRISP 뉴클레아제와 상호작용한다. 상기 가이드 RNA는 단일 분자 (가령, 단일 가이드 RNA (sgRNA) 또는 1-피스 sgRNA)일 수 있고, 이때 crRNA 서열은 tracrRNA 서열에 연계된다. 대안으로, 상기 가이드 RNA는 crRNA 및 tracrRNA을 포함하는, 두 개의 별개 분자일 수 있다 (가령, 2-피스 gRNA).
상기 crRNA 가이드 서열은 관심대상 핵산에서 표적 서열 (, 프로토스페이서)의 보체와 혼성화되도록 기획된다. 일반적으로, 상기 가이드 서열과 표적 서열 간의 상보성은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%이다. 특정 구체예들에서, 상보성은 완벽하다 (, 100%). 다양한 구체예들에서, crRNA 가이드 서열의 길이는 약 15개 뉴클레오티드 내지 약 25개 뉴클레오티드 범위가 될 수 있다. 예를 들면, crRNA 가이드 서열의 길이는 약 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 또는 25개 뉴클레오티드일 수 있다. 특정 구체예들에서, 상기 가이드의 길이는 약 19개, 20개, 또는 21개 뉴클레오티드이다. 한 구체예에서, 상기 crRNA 가이드 서열은 20개의 뉴클레오티드 길이를 갖는다. 특정 구체예들에서, 상기 crRNA는 tracrRNA와 상호작용하는 추가 3' 서열을 포함할 수 있다. 상기 추가 서열은 약 10 ~ 약 40개의 뉴클레오티드를 포함할 수 있다. 상기 가이드 RNA가 단일 분자를 포함하는 구체예들에서, gRNA의 crRNA와 tracrRNA 부분들은 서열에 의해 연계되어, 루프를 형성할 수 있다. 루프를 형성하는 서열의 길이는 약 4개 뉴클레오티드에서 약 10개 또는 그 이상의 뉴클레오티드 범위일 수 있다.
상기 언급된 바와 같이, tracrRNA는 CRISPR 뉴클레아제와 상호작용하는 적어도 하나의 스템 루프 구조를 형성하는 반복 서열을 포함한다. 각 루프의 길이는 가변적일 수 있다. 예를 들면, 루프는 길이가 약 3 개 내지 약 10 개 뉴클레오티드 범위일 수 있고, 스템은 길이가 약 6 개 내지 약 20 개 염기쌍 범위일 수 있다. 상기 스템은 1 개 내지 약 10 개 뉴클레오티드로 된 한 개 또는 그 이상의 불지스(bulges)를 포함할 수 있다. 상기 가이드 RNA에서 tracrRNA 서열은 야생형 CRISPR 뉴클레아제와 상호작용하는 야생형 tracrRNA의 서열에 기반을 두는 것이 일반적이다. 상기 야생형 서열은 이차 구조 형성, 증가된 이차 구조 안정성, 그리고 이와 유사한 것들이 실행되도록 개질될 수 있다. 예를 들면, 하나 또는 그 이상의 뉴클레오티드 변화가 상기 가이드 RNA 서열 안으로 도입될 수 있다. 상기 tracrRNA 서열의 길이는 약 50개 뉴클레오티드 내지 약 300개 뉴클레오티드 범위일 수 있다. 다양한 구체예들에서, tracrRNA의 길이는 약 50개 내지 약 90개 뉴클레오티드, 약 90개 내지 약 110개 뉴클레오티드, 약 110개 내지 약 130개 뉴클레오티드, 약 130개 내지 약 150개 뉴클레오티드, 약 150개 내지 약 170개 뉴클레오티드, 약 170개 내지 약 200개 뉴클레오티드, 약 200개 내지 약 250개 뉴클레오티드, 또는 약 250개 내지 약 300개 뉴클레오티드의 범위일 수 있다. 상기 tracrRNA는 이 tracrRNA의 3' 단부에서 임의선택적 연장부를 포함할 수 있다.
상기 가이드 RNA는 표준 리보뉴클레오티드 및/또는 변형된 리보뉴클레오티드를 포함할 수 있다. 일부 구체예들에서, 가이드 RNAs는 표준 또는 변형된 데옥시리보뉴클레오티드를 포함할 수 있다. 가이드 RNA가 효소적으로 (, 생체내 또는 시험관내에서)합성되는 구체예들에서, 이 가이드 RNA는 일반적으로 표준 리보뉴클레오티드를 포함한다. 가이드 RNA 화학적으로 합성되는 구체예들에서, 이 가이드 RNA는 표준 또는 변형된 리보뉴클레오티드 및/또는 데옥시리보뉴클레오티드를 포함할 수 있다. 변형된 리보뉴클레오티드 및/또는 데옥시리보뉴클레오티드는 염기 변형 (예로써, 슈도우리딘, 2-티오우리딘, N6-메틸아데노신, 및 이와 유사한 것들) 및/또는 당 변형 (예로써, 2'-O-메틸, 2'-플루오로, 2'-아미노, 잠금(locked) 핵산 (LNA), 및 등등)을 포함한다. 가이드 RNA의 기본골격은 포스포로티오에이트 링키지, 보라노포스페이트 링키지 또는 펩티드 핵산을 포함하도록 또한 변형될 수 있다.
CRISPR 뉴클레아제 시스템의 가이드 RNA는 전술한 바와 같이, 단백질-핵산 복합체가 형성될 수 있도록, 원핵생물 염색체 DNA에 있는 특정 부위로 CRISPR 뉴클레아제 시스템을 표적화시키도록 공작된다. 일반적으로, 상기 단백질-핵산 복합체는 상기 원핵생물 안에 형성된다.
일부 구체예들에서, 상기 공작된 CRISPR 뉴클레아제 시스템은 상기 원핵생물의 염색체에 통합되어, 이 염색체로부터 발현될 수 있다. 기타 구체예들에서, 상기 공작된 CRISPR 뉴클레아제 시스템은 염색체외 벡터에 의해 운반되고, 이로부터 발현될 수 있다. 상기 공작된 CRISPR 뉴클레아제 시스템의 발현은 제어될 수 있다. 예를 들면, 상기 공작된 CRISPR 뉴클레아제 시스템의 발현은 유도성 프로모터에 의해 제어될 수 있다.
(b) 원핵생물 염색체
본원에서 기술된 단백질-핵산 복합체는 원핵생물 염색체를 더 포함하며, 이때 상기 원핵생물 염색체는 서열 식별 번호:1의 아미노산 서열에 대해 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 HU 패밀리 DNA-결합 단백질을 인코드하고, 그리고 이 해당 원핵생물의 염색체 DNA는 전술한 HU 패밀리 DNA-결합 단백질에 연합된다. DNA-결합 단백질의 HU 패밀리는 서열 특이성 없이, 이중 가닥으로 된 DNA에 결합하고, DNA 구조, 이를 테면, 포크, 3원/4원 방식 졍션, 니크(nicks), 오버행(overhangs), 그리고 불지스(bulges)에 결합하는 작은(~90개 아미노산의) 염기성 히스톤-유사 단백질을 포함하다. HU 패밀리 DNA-결합 단백질의 결합으로 DNA가 안정화되어, 극단적인 환경 조건 하에서 변성으로부터 이를 보호할 수 있다.
이 염색체는 박테리아 도메인 또는 고세균류 도메인의 구성부 안에 있을 수 있다. 일부 구체예들에서, 상기 유기체는 박테리아성 종이거나 또는 이 종의 상이한 균주다. 일부 구체예들에서, 상기 HU 패밀리 DNA-결합 단백질은 서열 식별 번호:1에 대해 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 포함한다.
특정 구체예들에서, 상기 원핵생물은 박테로이드(Bacteroides) 속(genus)의 구성원이다. 박테로이드(Bacteroides) 종은 포유류 내장 미생물총의 현저한 혐기성 공생체(symbionts)다. 그들은 다양한 당분해 효소를 함유하고 있으며, 장에서 다당류의 주요 발효제다. 그들은 장에 남아있을 때 숙주와 복잡하고 일반적으로 유익한 관계를 유지하지만, 그러나 이 환경을 벗어나면 심각한 병리를 일으킬 수 있다. 박테로이드(Bacteroides) 종의 비-제한적인 예로는 다음이 내포된다: B. 악시도파시엔스, B. 박테리아, B. 바르네시아스, B. 카카에, B. 아케시코라, B. 카에시갈리라룸, B. 카필로시스, B. 셀룰로실리티쿠스, B. 셀룰로솔벤스, B. 클라루스, B. 코아굴란스, B. 코프로코라, B. 코프로필루스, B. 코프로수이스, B. 디스타소니스, B. 도레이, B. 에게르티, B. 그라실리스, B. 파에시킨칠라에, B. 파에시스, B. 피네골디, B. 플룩수스, B. 프라길리스, B. 갈락투로니쿠스, B. 갈리나세움, B. 갈리나룸, B. 골드스테이니, B. 그라미니솔벤스, B. 헬코게네, B. 헵파리노리티쿠스, B. 인테스티날리스, B. 존소니, B. 루티, B. 마실리렌시스, B. 멜라니노게니쿠스, B. 네오나티, B. 노르디, B. 올레이시플레누스, B. 오리스, B. 오바투스, B. 파우로사카로리티쿠스, B. 플레베이우스, B. 폴리프라그마투스, B. 프로피오니시파시엔스, B. 푸트레디니스, B. 피요게네스, B. 레티쿨로테르미티스, B. 로덴티움, B. 살라니트로니스, B. 살에르시아, B. 사르토리, B. 세디멘트, B. 스테르코리스, B. 스테르코리로소리스, B. 수이스, B. 텍투스, B. 테타이오타오미크론, B. 티모넨시스, B. 우리포르미스, B. 불가투스, B. 실라니솔벤스, B. 실라노리티쿠스, 그리고 B. 주글레오포르만스.
일부 구체예들에서, 상기 원핵생물 염색체는 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) , 박테로이드 불가투스(Bacteroides vulgatus), 박테로이드 셀롤로리티쿠스(Bacteroides cellulosilyticus), 박테로이드 프라길리스(Bacteroides fragilis), 박테로이드 헬코게네스(Bacteroides helcogenes), 박테로이드 오바투스(Bacteroides ovatus), 박테로이드 살라니트로니스(Bacteroides salanitronis), 박테로이드 우니포르미스(Bacteroides uniformis), 또는 박테로이드 실라니솔벤스(Bacteroides xylanisolvens)에서 선택된 염색체다.
일부 구체예들에서, 이 염색체는 바르네시에라(Barnesiella) 종., 바르네시에라 비세리코라(Barnesiella viscericola), 캅노씹트파가(Capnocytphaga) 종., 오도리박터 스플라키니쿠스(Odoribacter splanchnicus), 파루디박터(Paludibacter)종., 파라박테로이드(Parabacteroides) 종., 포르피로모나다세아(Porphyromonadaceae) 박테리아, 그리고 쉬레이페리아(Schleiferia) 종으로부터 선택된다.
(c) 특정 단백질-핵산 복합체
특정 구체예들에서, 상기 단백질-핵산 복합체는 박테로이드(Bacteroides) 염색체에 결합된, 또는 연합된 공작된 CRISPR Cas9/gRNA 시스템 또는 공작된 CRISPR Cas12/gRNA 시스템을 포함할 수 있다.
(II) 상기 단백질-핵산 복합체를 만드는 방법
본 명세서의 추가 측면은 공작된 RNA-유도된 (CRISPR) 뉴클레아제 시스템과 상기에서 기술된 HU 패밀리 DNA-결합 단백질을 인코딩하는 원색생물 염색체를 포함하는 복합체를 만드는 방법들을 제공한다. 전술한 방법들은 (a) 상기 원핵생물 염색체에 있는 부위를 표적으로 하도록 CRISPR 뉴클레아제 시스템을 공작하고, 그리고 (b) 상기 공작된 CRISPR 뉴클레아제 시스템을 상기 원핵생물에 도입시키는 것을 포함한다.
CRISPR 뉴클레아제 시스템의 공작은 상기 원핵생물 염색체에서 PAM 서열에 인접한 특정 (~19-22 nt) 서열(관심대상의 CRISPR 뉴클레아제에 의해 인지되는)을 표적으로 하는 가이드 RNA를 기획하는 것을 포함하고, 그리고 tracrRNA 서열은 섹션(I)(a)에서 기술된 바와 같이, 관심대상의 CRISPR 뉴클레아제에 의해 인지된다. 상기 공작된 CRISPR 시스템은 인코딩 핵산으로써, 상기 원핵생물 안으로 도입될 수 있다. 예를 들면, 상기 인코딩 핵산은 벡터의 일부분일 수 있다. 다양한 벡터를 운반 또는 도입시키는 수단들은 당분야에 잘 공지되어 있다.
상기 공작된 CRISPR 시스템 (, CRISPR 뉴클레아제 및 가이드 RNA)을 인코딩하는 벡터는 플라스미드 벡터, 파아지미드 벡터, 바이러스 벡터, 박테리오파아지 벡터, 박테리오파아지-플라스미드 하이브리드 벡터, 또는 기타 적합한 벡터일 수 있다. 상기 벡터는 통합 벡터, 콘쥬게이션 벡터, 셔틀 벡터, 발현 벡터, 염색체외 벡터, 그리고 기타등등이 될 수 있다.
CRISPR 뉴클레아제를 인코딩하는 핵산 서열은 상기 원핵생물에서 발현을 위해 프로모터 제어 서열에 작동가능하도록 연계될 수 있다. 특정 구체예들에서, 상기 공작된 CRISPR 뉴클레아제에 작동가능하도록 연계된 프로모터는 조정된(regulated) 프로모터일 수 있다. 일부 측면들에서, 상기 조정된 프로모터는 프로모터 유도성 화학물질에 의해 조정될 수 있다. 이러한 구체예들에서, 상기 프로모터는 pTetO일 수 있는데, 이것은 대장균(Escherichia coli) Tn10-유래된 tet 조절 시스템에 기반을 두며, 강력한 tet 오퍼레이터 (tetO)-함유하는 미코박테리아성 프로모터와 억제인자 (TetR)를 위한 발현 카세트로 구성되며, 상기 프로모터 유도성 화학물질은 안하이드테트라사이클린 (aTc)일 수 있다. 기타 구체예에서, 상기 프로모터는 pBAD 또는 araC-ParaBAD일 수 있고, 상기 프로모터 유도성 화학물질은 아라비노스일 수 있다. 추가 구체예들에서, 상기 프로모터는 pLac 또는 tac (trp-lac)일 수 있고, 상기 프로모터 유도성 화학물질은 락토스/IPTG이다. 기타 구체예들에서, 상기 프로모터는 pPrpB일 수 있고, 상기 프로모터 유도성 화학물질은 프로피오네이트일 수 있다.
상기 적어도 하나의 가이드 RNA를 인코딩하는 핵산 서열은 상기 원핵생물에서 발현을 위해 프로모터 제어 서열에 작동가능하도록 연계될 수 있다. 상기 관심대상의 원핵생물이 박테로이드(Bacteroides)인 구체예들에서, 상기 구성적 프로모터는 P1 프로모터일 수 있고, 이것은 B. 테타이오타오미크론(B. thetaiotaomicron) 16S rRNA 유전자 BT_r09의 상류에 있다 (Wegmann et al., Applied Environ. Microbiol., 2013, 79:1980-1989). 기타 적합한 박테로이드(Bacteroides) 프로모터에는 P2, P1TD, P1TP, P1TDP (Lim et al., Cell, 2017, 169:547-558), PAM, PcfiA, PcepA, PBT1311 (Mimee et al., Cell 시스템, 2015, 1:62-71) 또는 전술한 프로모터중 임의의 프로모터의 변이체들이 내포된다. 기타 구체예들에서, 상기 구성적 프로모터는 E. coli σ70 프로모터 또는 이의 유도체, B. 서브틸리스(b. subtilis) σA 프로모터 또는 이의 유도체, 또는 살모넬라(salmonella) Pspv2 프로모터 또는 이의 유도체일 수 있다. 당업자는 관심대상의 원핵생물에 적합한 추가 구성적 프로모터를 잘 알고 있다.
일부 구체예들에서, 상기 벡터는 통합 벡터일 수 있고, 리콤비나제를 인코딩하는 서열, 뿐만 아니라 하나 또는 그 이상의 리콤비나제 인지 부위를 더 포함할 수 있다. 일반적으로, 상기 리콤비나제는 비가역적 리콤비나제이다. 적합한 리콤비나제의 비-제한적인 예로는 박테로이드(Bacteroides) intN2 티로신 인테그라제 (NBU2 유전자에 의해 인코드됨), 스트렙토미세스(Streptomyces) 파아지 phiC31 (φC31) 리콤비나제, 골리파아지 P4 리콤비나제, 콜리파아지 람다 인테그라제, 리스테리아(listeria) A118 파아지 리콤비나제, 그리고 악티노파아지 R4 Sre 리콤비나제가 내포된다. 리콤비나제/인테그라제는 두 개의 서열 특정 인지 (또는 부착) 부위 (가령, attP 부위와 attB 부위) 사이의 재조합을 매개한다. 일부 구체예들에서, 상기 벡터는 리콤비나제 인지 부위중 하나 (가령, attP)를 포함하고, 다른 리콤비나제 인지 부위 (가령, attB)는 상기 원핵생물의 염색체 (가령, tRNA-ser 유전자 부근)에 위치할 수 있다. 이러한 상황들에 있어서, 상기 전체 벡터는 상기 원핵생물의 염색체로 통합될 수 있다. 기타 구체예들에서, 상기 공작된 CRISPR 뉴클레아제 시스템을 인코딩하는 서열은 두 개의 리콤비나제 인지 부위 측면에 있을 수 있고, 이로써 상기 공작된 CRISPR 뉴클레아제 시스템을 인코딩하는 서열만이 상기 원핵생물 염색체로 통합된다.
상기에서 기술된 벡터들중 임의의 벡터는 적어도 하나의 전사 종료 서열, 뿐만 아니라 관심대상의 원핵생물에서 증식 및 선별을 위한 적어도 하나의 복제 원점 및/또는 적어도 하나의 선택성 마커 서열 (가령, 항생제 저항성 유전자)를 더 포함할 수 있다.
벡터 및 이의 용도에 관한 추가 정보는 "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001에서 찾아볼 수 있다.
상기 공작된 CRISPR 뉴클레아제 시스템을 인코딩하는 벡터가 통합 벡터인 구체예들에서, 상기 공작된 CRISPR 시스템 (또는 전체 벡터)을 인코딩하는 핵산은 이 벡터가 박테리아로 전달된 후 (그리고 리콤비나제/인테그라제의 발현 후) 해당 박테리아 염색체에 안정적으로 통합될 수 있다. 상기 공작된 CRISPR 뉴클레아제 시스템을 인코딩하는 벡터가 통합 벡터가 아닌 구체예들에서, 상기 벡터는 이 벡터가 해당 미생물로 전달된 후, 염색체외에 남아있을 수 있다.
CRISPR 뉴클레아제를 인코딩하는 서열이 유도성 프로모터에 작동가능하도록 연계된 구체예들에서, CRISPR 뉴클레아제 시스템의 발현은 상기 프로모터 유도성 화학물질을 상기 원핵생물로 도입시킴으로써 조정될 수 있다. 특정 구체예들에서, 상기 프로모터 유도성 화학물질은 안하이드테트라사이클린일 수 있다. 유도 시, CRISPR 뉴클레아제가 합성되고, 적어도 하나의 가이드 RNA와 복합되고, 이는 CRISPR 뉴클레아제 시스템을 상기 박테리아 염색체의 표적 부위로 표적화됨으로써, 본원에서 기술된 단백질-핵산 복합체가 형성된다.
(III) 미생물총 조성물을 변조시키기 위한 방법
본 명세서의 추가 측면은 미생물의 혼합 집단에서 표적 미생물(원핵생물)의 성장을 선택적으로 늦춤으로써, 미생물총의 집단 및 구성을 변경시키는 방법을 포괄한다. 상기 방법은 상기 표적 원핵생물에 공작된 RNA-유도된 (CRISPR) 뉴클레아제 시스템을 발현시키는 것을 포함하고, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 상기 표적 원핵생물의 염색체에 있는 부위로 표적화되어, 상기 표적 원핵생물의 염색체에 적어도 하나의 이중 가닥 파괴(break)가 도입되고, 이로써 상기 표적 원핵생물의 성장 또는 증식이 지연된다. 염색체 DNA에 적어도 하나의 이중 가닥 파괴를 포함하는 표적 원핵생물의 성장은 DNA 파괴가 전반적으로 원핵생물에서 복구되지 않거나, 또는 효과적으로 복구되지 않기 때문에, 느려진다. 상기 표적 원핵생물 성장의 지체로 인하여 해당 원핵생물의 혼합 집단에서 표적이 되는 원핵생물의 수준이 감소되거나, 또는 제거된다.
섹션 (I)(a)에서 기술된 CRISPR 뉴클레아제 시스템중 임의의 것은 섹션 (II)에서 기술된 바와 같이 공작되어, 관심대상의 원핵생물의 염색체 내의 부위로 표적화되고, 이 내용은 섹션 (I)(b)에 기술되어 있다. 상기 공작된 CRISPR 뉴클레아제 시스템은 섹션 (II)에서 기술된 바와 같이, 해당 원핵생물로 벡터의 일부분으로 도입될 수 있다. 일반적으로, CRISPR 뉴클레아제는 유도성이다 (, 이의 인코딩 서열은 유도성 프로모터에 작동가능하도록 연계됨). 이와 같이, CRISPR 뉴클레아제는 몇시된 시점에 발현될 수 있다. 프로모터 유도성 화학물질이 없는 경우, CRISPR 뉴클레아제 시스템은 생성되지 않을 수 있다. CRISPR 뉴클레아제는 상기 원핵생물을 프로모터 유도성 화학물질에 노출시킴으로써, 만들어질 수 있으며, 섹션 (II)에서 기술된 바와 같이, 염색체에 통합된 코딩 서열로부터, 또는 염색체외 인코딩 서열로부터 CRISPR 뉴클레아제가 발현된다. 적어도 하나의 가이드 RNA를 갖는 CRISPR 뉴클레아제 복합체는 염색체에 통합된 코딩 서열 또는 염색체외 인코딩 서열로부터 구성적으로 발현되고, 이로써 활성 CRISPR 뉴클레아제 시스템이 형성된다. CRISPR 뉴클레아제 시스템은 해당 원핵생물 염색체내 표적 부위로 표적화되고, 여기에서 이 시스템은 이 염색체 DNA에 이중 가닥 파괴를 도입시킨다. 상기 이중 가닥 파괴로 인하여 해당 표적 원핵생물의 성장이 늦어지거나, 또는 사멸된다. 그 결과, 상기 원핵생물의 혼합 집단에서 표적이 되는 원핵생물의 수준이 감소되거나, 또는 제거되었다.
일부 구체예들에서, 상기 표적 원핵생물은 섹션 (I)(b)에서 상술된 바와 같이, 박테로이드(Bacteroides) 종일 수 있다.
상기 공작된 CRISPR 시스템은 해당 원핵생물의 혼합 집단 안의 표적이 되는 원핵생물로 도입될 수 있다. 대안으로, 상기 공작된 CRISPR 시스템은 상기 표적이 되는 원핵생물로 도입될 수 있고, 그 다음 해당 원핵생물의 혼합 집단과 혼합된다.
일부 구체예들에서, 상기 원핵생물의 혼합 집단이 세포 배양물 안에 품어 있을 수 있고, 이때 상기 프로모터 유도성 화학물질에 노출됨으로써 표적이 되는 원핵생물의 수준이 감소되거나, 또는 제거된다.
기타 구체예들에서, 상기 원핵생물의 혼합 집단이 포유류의 소화 기관 (또는 장) 내에 머물 수 있고, 이때 상기 프로모터 유도성 화학물질의 투여로 장 미생물총에서 표적이 되는 원핵생물의 수준이 감소되거나, 또는 제거로 이어질 수 있다. 상기 프로모터 유도성 화학물질은 경구 (가령, 음식, 음료 또는 약제학적 제형을 통하여)로 투여될 수 있다. 상기 포유류는 마우스, 렛(rat), 또는 기타 연구 동물일 수 있다. 특정 구체예들에서, 상기 포유류는 인간일 수 있다. 상기 표적이 되는 원핵생물 (가령, 박테로이드(Bacteroides))의 감소 또는 제거로 장 건강이 개선될 수 있다.
상기 원핵생물의 혼합 집단 (세포 배양물 또는 소화 기관안의)은 다양한 분류군을 포함할 수 있다. 예를 들면, 인간 장 미생물총은 수백가지 상이한 종의 박테리아, 그리고 이들 종의 많은 균주-수준의 변이체드르을 포함할 수 있다.
특정 구체예들에서, 상기 포유류 (가령, 인간)는 암 면역요법을 받고 있을 수 있으며, 이때 면역요법 응답자들은 비-응답자와 비교하였을 때, 이들의 장 미생물총내 박테로이드(Bacteroides) 종의 수준은 더 낮은 것으로 나타났다 (Gopalakrishnan et al., Science, 2018, 359:97-103). 따라서, 장 미생물총내 박테로이드(Bacteroides) 종 수준의 감소로 인하여 인간 암 면역요법 결과가 더 나아질 수 있다.
특정 구체예들에서, 상기 포유류 (가령, 인간, 개, 고양이, 돼지, 말 또는 소)는 염증성 장질환, 크론병, 게실염, 장폐색, 용종 제거, 암 조직 제거, 궤양성 대장염, 장 절제술, 직장 절제술, 완전 결장절제술 또는 부분 결장절제술을 비롯하여, 다양한 이유로 장 수술을 받을 수 있고, 이때 유도성 CRISPR 시스템에 의해 포유류의 외과수술-전 장내에 박테로이드 프라실리스(Bacteroides fragilis) 종의 감소는 장의 바깥쪽에, 그러나 해당 포유류 신체 내에 위치에서 B. 프라실리스(B. fragilis) 에 의한 수술-후 감염 위험을 감소시킬 수 있다. 장의 바깥쪽 위치에는 내장의 외부 표면이 내포된다. B. 프라실리스(B. fragilis) 내에서 유도성 CRISPR 시스템은 유사한 위치, 가령, 발병성 섬, 독소 (, B. 프라실리스(B. fragilis) 독소 또는 BFT) 또는 B. 프라실리스(B. fragilis) 또는 외과수술-후 감염을 야기시키는 것으로 알려진 기타 고유의 장 원핵생물의 감염성 균주와 연합된 다른 독특한 서열을 비롯한, 그러나, 이에 국한되지 않은 위치를 를 절단하거나, 또는 변형시키도록 표적화될 수 있다. 예를 들면, 비-독성생성 B. 프라실리스(B. fragilis) (NTBF) 및 장-독소생성 B. 프라실리스(B. fragilis) (ETBF)의 수준은 ETBF 균주 내에 위치한(그러나, NTBF 균주는 아님) 공작된 유도성 CRISPR 시스템을 이용하여 선택적으로 변조될 수 있다. 장 외과수술 후 감염을 여기시키는 기타 박테리아성 분류에는 박테로이드 카필로시스(Bacteroides capillosis), 대장균(Escherchia coli), 엔테로코쿠스 파에칼리스(Enterococcus faecalis), 카멜라 헤모리산(Gamella haemolysan), 그리고 모르가넬라 모르가니(Morganella morganii)가 내포될 수 있다. 상기 유도성 CRISPR 시스템을 장 미생물총로의 전달은 외과수술 전, 후, 또는 수술하는 동안 프로바이오틱 처리의 일부분으로 일어날 수 있다. 상기 유도성 CRISPR 시스템을 상기 표적 원핵생물로의 전달은 상기 포유류 신체의 외부, 또는 상기 포유류 신체내에서 일어날 수 있다. 상기 유도성 CRISPR 시스템을 상기 표적 원핵생물로의 전달은 핵산 벡터, 이를 테면, 플라스미드 또는 박테리오파아지를 통하여 일어날 수 있다. 플라스미드의 전달은 전기천공, 화학적 형질변환, 또는 박테리아에서-박테리아로의 콘쥬게이션을 통하여 일어날 수 있다.
각종 구체예들에서, 상기 표적 원핵생물의 수준은 CRISPR 뉴클레아제의 발현 전의 수준과 비교하여 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 적어도 약 99% 감소될 수 있다. 특정 구체예들에서, 상기 표적 원핵생물은 CRISPR 뉴클레아제의 발현 후 해당 원핵생물의 혼합 집단내에서 감지불가능한 수준으로 감소될 수 있다.
(IV) 프로바오이틱으로써의 CRISPR 통합된 원핵생물
본 명세서의 또다른 측면은 프로바이오틱으로써 사용하기 위한 공작된 원핵생물을 포괄한다. 상기 공작된 원핵생물은 이 원핵생물 세포 안에 에피좀 벡터로 유지된, 섹션 (I)에서 기술된 임의의 공작된 CRISPR 뉴클레아제 시스템을 포함한다. 일부 구체예들에서, 상기 공작된 원핵생물은 유도성 CRISPR 뉴클레아제 시스템을 포함하는 공작된 박테로이드(Bacteroides)이다. 상기 공작된 박테로이드(Bacteroides)를 포유류 대상체로 투여하고, 이어서 CRISPR 시스템을 유도하여 장 미생물총에서 박테로이드(Bacteroides) 균주의 상대적 풍도를 감소시킬 수 있다. 기타 구체예들에서, 상기 박테로이드(Bacteroides) 균주는 장 미생물총에서 박테로이드(Bacteroides)의 야생형 균주를 능가하도록 공작될 수 있다. 이들 구체예 및 다른 구체예들에서, 포유류 대상체에게 치료요법적 이점을 제공하는 공작된 박테로이드(Bacteroides) 균주는 상기 유도성 CRISPR 뉴클레아제 시스템의 유도에 의해 해당 포유류 대상체로부터 제거될 수 있다.
정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 의미를 갖는다. 하기 참고 문헌은 당업자에게 본 발명에 사용된 많은 용어의 일반적인 정의를 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology (1991). 본원에서 사용된 바와 같이, 다음의 용어는 달리 명시되지 않는 한 그 의미를 갖는다.
본 개시 내용의 요소 또는 그의 바람직한 구체예(들)를 소개할 때, 부정관사 ("a", "an"), 정관사("the") 및 "전술한"이란 하나 또는 이상의 요소가 존재함을 의미하도록 의도된다. "포함하는(comprising)", "내포하는(including)" 및 "갖는(having)"이라는 용어는 포괄적인 것으로 의도되며, 열거된 요소 이외의 추가 요소가 존재할 수 있음을 의미한다.
숫자 값 x와 관련하여 사용될 때, 용어 "약"이란 예를 들어 x ± 5 %를 의미한다.
여기에서 사용된 바와 같이, "상보적" 또는 "상보성"이라는 용어는 특정 수소 결합을 통한 염기쌍에 의한 이중 가닥 핵산의 회합을 의미한다. 염기 쌍이란 표준 Watson-Crick 염기 쌍 (예로써, 5'-A G T C-3' 상보적인 서열 3'-T C A G-5'와 쌍을 이룬다). 상기 염기 쌍은 Hoogsteen 또는 역전된 Hoogsteen 수소 결합일 수 있다. 상보성은 전형적으로 듀플렉스(duplex) 영역에 대해 측정되므로, 예를 들어, 오버행(overhangs)을 배제한다. 염기의 일부 (예를 들어, 70 %)만이 상보적인 경우, 듀플렉스 영역의 두 가닥 사이의 상보성은 부분적이고, 백분율 (예를 들어, 70 %)로 표현될 수 있다. 상보적이지 않은 염기는"미스매치(mismatched)"다. 듀플렉스 영역의 모든 염기가 상보적인 경우, 상보성이 또한 완전한 상보성이 될 수 있다(즉, 100 %).
유전자 또는 폴리뉴클레오티드 관련하여, 용어 "발현"이란 유전자 또는 폴리뉴클레오티드의 전사를 지칭하며, 적절한 경우, mRNA 전사체가 단백질 또는 폴리펩티드로의 해독을 지칭한다. 따라서, 문맥에서 명백해지는 바와 같이, 단백질 또는 폴리펩티드의 발현은 오픈 리딩 프레임의 전사 및/또는 해독으로 인한 것이다.
여기에서 사용된 바와 같이, "유전자"란 유전자 서열을 코딩하는 DNA 영역 (엑손 및 인트론 포함)뿐만 아니라, 이러한 조절 서열이 코딩 및 / 또는 전사 된 서열에 인접하는지 여부에 관계없이, 유전자 생성물의 생산을 조절하는 모든 DNA 영역을 지칭한다. 따라서, 유전자에는 프로모터 서열, 터미네이터, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 해독 조절 서열, 인핸서, 사일런서(silencers), 절연체(insulators), 경계 요소, 복제 원점(replication origins), 매트릭스 부착 부위 및 유전자 좌 조절 영역들이 내포되지만, 이에 제한되지는 않는다.
"이종성(heterologous)"이라는 용어는 내생성이 아니거나, 또는 관심대상 세포에 고유하지 않은 엔터티를 의미한다. 예로써, 이종 단백질은 외생적으로 도입된 핵산 서열과 같은 외생성 공급원으로부터 유래되거나 또는 이로부터 유래된 단백질을 지칭한다. 일부 경우들에서, 이종 단백질은 일반적으로 관심대상 세포에 의해 생성되지 않는다.
용어 "뉴클레아제"는 용어 "엔도뉴클레아제"와 호환사용되며, 이중-가닥으로 된 핵산 서열의 양쪽 가닥 또는 단일-가닥으로 된 핵산 서열을 절단하는 효소를 지칭한다.
용어 "핵산" 및 "폴리뉴클레오티드"란 선형 또는 원형 형태에서, 그리고 단일- 또는 이중-가닥으로된 형태에서 데옥시리보뉴클레오티드 또는 리보뉴클레오티드를 지칭한다. 본 명세서의 목적을 위하여, 이들 용어는 중합체의 길이의 제한으로 해석되지 않아야 한다. 이들 용어는 천연 뉴클레오티드의 공지의 유사체들, 뿐만아니라 염기, 당 및/또는 포스페이트 모이어티 (예로써, 포스포로티오에이트 기본골격)에서 변형이 있는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기-쌍 특이성을 갖는데; 가령, A의 유사체는 T와 염기쌍을 형성할 수 있다.
용어 "뉴클레오티드"란 데옥시리보뉴클레오티드 또는 리보뉴클레오티드를 지칭한다. 뉴클레오티드는 표준 뉴클레오티드 (가령, 아데노신, 구아노신, 시티딘, 티미딘, 그리고 우리딘), 뉴클레오티드 이성체, 또는 뉴클레오티드 유사체일 수 있다. 뉴클레오티드 유사체는 변형된 푸린 또는 피리미딘 염기 또는 변형된 리보스 모이어티를 갖는 뉴클레오티드를 지칭한다. 뉴클레오티드 유사체는 자연 발생적 뉴클레오티드 (예로써, 이노신, 슈도우리딘, 등등) 또는 비-자연 발생적 뉴클레오티드일 수 있다. 뉴클레오티드의 당 또는 염기 모이어티에 변형의 비-제한적 예로는 아세틸기, 아미노기, 카르복실기, 카르복시메틸기, 히드록실기, 메틸기, 포스포릴기 및 티올기의 첨가 (또는 제거) 및 염기의 탄소 및 질소 원자를 다른 원자로 치환하는 것 (예: 7-데자 퓨린)을 포함한다. 뉴클레오티드 유사체는 또한 디데옥시 뉴클레오티드, 2'-O-메틸 뉴클레오티드, 잠금 핵산 (LNA), 펩티드 핵산 (PNA) 및 몰폴리노를 포함한다.
용어 "폴리펩티드" 및 "단백질"은 상호 호환적으로 사용되며, 아미노산 잔기의 중합체를 지칭한다.
용어 "표적 서열"과 "표적 부위"는 호환사용되며, 관심대상 핵산에서 CRISPR 시스템이 표적으로 하는 특정 서열 (가령, 염색체 DNA 또는 세포 RNA), 그리고 CRISPR 시스템이 핵산 또는 이 핵산과 연합된 단백질(들)을 변형시키는 부위를 지칭한다.
핵산 및 아미노산 서열 동일성을 결정하는 기술은 당업계에 공지되어 있다. 전형적으로, 이러한 기술은 유전자의 mRNA의 뉴클레오티드 서열을 결정하고, 이에 의해 인코드된 아미노산 서열을 결정하는 것과, 그리고 이들 서열을 제 2 뉴클레오티드 또는 아미노산 서열에 비교하는 것을 포함한다. 게놈 서열은 이러한 방식으로 또한 결정되며, 비교될 수 있다. 일반적으로, 동일성이란 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열에서 각각 차례로 정확한 뉴클레오티드-대 뉴클레오티드, 또는 아미노산-대-아미노산 대응성을 말한다. 2개의 또는 그 이상의 서열 (폴리뉴클레오티드 또는 아미노산)은 이들의 동일성 백분율을 결정함으로써, 비교될 수 있다. 핵산 또는 아미노산 서열에 관계없이, 2 개의 서열의 동일성 백분율은 2 개의 정렬된 서열 사이의 정확하게 일치하는 수를 더 짧은 서열의 길이로 나눈 후, 100을 곱한 것이다. 예를 들면, 핵산 서열들을 위한 적절한 정렬은 Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)의 국소 상동성 알고리즘에 의해 제공된다. 이 알고리즘은 Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA에 의해 개발되고, Gribskov (1986), Nucl. Acids Res. 14(6):6745-6763(1986)에의해 정상화된 스코어링 매트릭스(scoring matrix)를 이용하여 아미노산 서열에 적용될 수 있다. 서열의 동일성 백분율을 결정하기 위한 이 알고리즘의 예시적인 구현은 Genetics Computer Group (Madison, Wis.)에 의해 제공되는 "BestFit" 유틸리티 응용으로 제공된다. 서열 간의 동일성 또는 유사성을 계산하기 위한 다른 적합한 프로그램은 당업계에 일반적으로 공지되어 있으며, 예를 들어, 다른 정렬 프로그램은 디폴트 매개변수로 사용되는 BLAST이다. 예로써, BLASTN 및 BLASTP는 다음의 디폴트 매개변수를 이용할 수 있다: 유전자 코드=표준; 필터=없음; 가닥=양쪽 두 가닥; 컷오프=60; 예상=10; Matrix=BLOSUM62; 설명=50 서열; 소트 바이=HIGH SCORE; 데이터베이스=비-리던단트, GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR. 이러한 프로그램에 대한 자세한 내용은 GenBank 웹 사이트에서 찾을 수 있다.
본 발명의 범위를 벗어나지 않으면서 전술한 세포 및 방법에서 다양한 변경이 이루어질 수 있기 때문에, 상기 설명 및 하기 주어진 실시예에 포함된 모든 물질은 예시적인 것으로 해석되어야 되며, 이에 한정시키는 것으로 해석되어서는 안된다.
실시예
하기 실시예는 본 개시의 특정 측면을 예시한다
실시예 1. 벡터 구축
CRISPR 통합 pNBU2-CRISPR 플라스미드는pExchange-tdk의 플라스미드 백본 (RP4-oriT, R6K ori, bla, ermG)의 Gibson 클로닝 (NEBuild HIFI DNA Assembly Master Mix, New England Biolabs), pNBU2-tetQb의 NBU2 인테그라제, 그리고 스트렙토코커스 피오게네스(Streptococcus pyogenes) 균주 SF370의 합성 DNAs 또는 게놈 DNA PCR로부터 어셈블리된 안하이드테트라사이클린 (aTc) 유도성 CRISPR 카세트 (P2-A21-tetR, P1TDP-GH023-SpCas9, P1-N20 sgRNA 스캐폴드) 를 이용하여 구축되었다. 도 2는 상기 플라스미드 디자인을 도시한다.
상기 플라스미드 백본은 R6K 복제 원점과 대장균에서 암피실린 선별용 bla 서열, 콘쥬게이션을 위한 RP4-oriT 서열, 그리고 박테로이드(Bacteroides)에서 에리트로마이신 (Em) 선별을 위한 ermG 서열을 품고있다. NBU2는 intN2 티로신 인테그라제를 인코드하는데, 이는 pNBU2-CRISPR 플라스미드 상의 attN2 부위와 박테로이드(Bacteroides) 세포의 염색체 상에 있는 attB 부위중 하나 사이의 서열-특이적 재조합을 매개한다. 상기 attN2와 attB는 동일한 13 bp 인지 뉴클레오티드 서열 (5'-3')을 갖는다: CCTGTCTCTCCGC (서열 식별 번호: 2).
상기 유도성 CRISPR 카세트에는 TetR 조절자 (P2-A21-tetR, P1TDP-GH023-SpCas9)의 제어 하에 있는 aTc 유도성 SpCas9, 그리고 P1 프로모터 (P1-N20 sgRNA 스캐폴드) 하에서 구성적으로 발현되는 가이드 RNA가 내포되어 있다. 상기 프로모터 및 리보솜 결합 부위는 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) 16S rRNA 유전자의 조절 서열로부터 유래되고, 공작된다( Lim et al., Cell, 2017, 169:547-558에서 기술된 바와 같이). 상기 가이드 RNA는 코딩 DNA 서열, 또는 비-코딩 DNA 서열, 또는 비-표적화 스크램블 뉴클레오티드 서열에 상동성인 뉴클레오티드 서열이다. 이 서열은 다른 Cas9 동족체(homologs)의 프로토스페이서 인접 모티프(PAM) 요구 사항과 양립가능하다면, 임의의 형태일 수 있다. 가이드 RNA는 tracrRNA 및 crRNA의 별개 전사 단위에 있거나, 또는 하이브리드 키메라 tracr/crRNA 단일 가이드(sgRNA)에 융합될 수 있다.
상기 플라스미드에 대한 DNA 서열은 서열 식별 번호: 3:으로 제시된다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
실시예 2. 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)의 염색체로의 CRISPR 통합
pNBU2.CRISPR 플라스미드는 대장균(E. coli) S-17 람다-pir,로 형질도입되었고, 이어서 콘쥬게이션을 통하여 박테로이드(Bacteroides) 세포로 전달되었다. 이 특정 실시예에서, 상기 pNBU2-CRISPR 플라스미드는 intN2 티로신 인테그라제를 인코드하는데, 이는 pNBU2-CRISPR 플라스미드 상에 있는 attN2 부위와 B. 테타이오타오미크론(B. thetaiotaomicron) VPI-5482 (간략하게 Bt)의 염색체 상에 두 개 tRNA-Ser 유전자, BT_t70 (attBT2-1) 및 BT_t71 (attBT2-2)의 3' 단부에 위치한 두 개 attBT 부위중 하나 사이의 서열-특이적 재조합을 매개한다. 상기 pNBU2-CRISPR 플라스미드의 삽입으로 두 개 tRNA-Ser 유전자중 하나가 비활성화되고, 그리고 BT_t70 및 BT_t71 모두에 동시 삽입은 tRNA-Ser의 본성(essentiality)으로 인하여 가능성이 낮다.
이 특정 실시예에서, 3개 플라스미드가 구축되었는데, 이들은 Bt 게놈에서 비-표적화 제어 가이드 RNA ('M'으로 명명됨), 가이드 RNA 표적화 tdk_Bt (BT_2275) 및 susC_Bt (BT_3702) 코딩 서열을 발현시킨다. tdk 유전자는 티미딘 키나제를 인코드하고, susC 유전자는 B. 테타이오타오미크론(B. thetaiotaomicron) 전분 결합에 연루된 외측 막 단백질을 인코드한다. tdk_Bt의 프로토스페이서 서열은 5'-AATTGAGGCATCGGTCCGAA-3' (서열 식별 번호: 4)이며, 그리고 susC_Bt의 프로토스페이서 서열은 5'-ATGACGGGAATGTACCCCAG-3' (서열 식별 번호: 5)이다. 박테로이드(Bacteroides) 게놈에 대항하는 비-표적화 제어 프로토스페이서 서열 (5'-TGATGGAGAGGTGCAAGTAG-3'; 서열 식별 번호: 6)의 가상 분석에서 임의의 유의적인 서열 매치(matches)는 없었고, 따라서 '표적-외' 활성은 기대하지 않는다. sgRNA 스캐폴드 서열은 다음과 같다: 5'-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT-3" (서열 식별 번호:7). 생성된 플라스미드는 차례로 pNBU2-CRISPR.M, pNBU2-CRISPR.tdk_Bt, 그리고 pNBU2-CRISPR.susC_Bt로 명명한다.
상기 pNBU2-CRISPR 플라스미드를 Bt 세포에 콘쥬게이트시켰고, 에리트로마이신 선별하면, 콘쥬게이션당 500-1000개 콜로니가 생성되었다 (도 3A, 3B). 박테로이드(Bacteroides), 에 대한 복제 원점이 없기 때문에, 이들 플라스미드는 박테로이드(Bacteroides) 세포에서 유지되지 않을 수 있다. 에리트로마이신 저항성 콜로니는 아마도 염색체 구성요소들이었다. 각 콘쥬게이션으로부터 4개의 콜로니, M (M1, M2, M3, M4), tdk_Bt (T1, T2, T3, T4) 및 susC_Bt (S1, S2, S3, S4)을 선별하여, 상기 두 개 attBT 유전자좌중 하나에서 CRISPR 통합에 대한 콜로니 PCR 스크리닝을 하였다 (도 3C). 각 유전자좌에 있어서 바깥쪽 프라이머를 이용하여, 야생형 또는 플라스미드 통합된, PCR 앰플리콘 크기를 확인하였다. 전체 플라스미드가 약 10 kb이기 때문에, 콜로니 PCR을 이용한 이의 통합에 대한 PCR 앰플리콘을 획득할 가능성은 없지만, 정제된 게놈 DNA를 이용하면 가능하다. 각 유전자좌에 있어서, 바깥쪽 프라이머를 이용하여 PCR을 수행하였다. 통합이 일어나지 않는다면, 겔 상에 약 0.5 kb (attBT2-1 유전자좌) 또는 0.65 kb (attBT2-2 유전자좌)의 PCR 앰플리콘이 예상되지만: 그렇지 않으면 PCR 산물은 기대되지 않는다. 또한, 염색체 서열에 결합하는 바깥쪽 프라이머와 통합 플라스미드로부터 ermG 코딩 서열에 결합하는 내부 프라이머를 이용하여 통합의 좌측 증션을 증폭시키는 PCR을 수행하였다. 통합이 일어난다면, 겔 상에 PCR 산물을 보여야 하고; 그렇지 않으면, PCR 산물은 기대되지 않는다. PCR 증폭은 다음 사이클링 조건을 사용하여 Q5 Hot-start 2X Master Mix(New England Biolabs)로 수행했다: 최초 변성을 위해 98oC에서 30초간; 98oC에서 20 초, 58oC에서 20 초, 그리고 72oC에서 45 초를 25회; 그리고 72oC에서 5 분 최종 연장. PCR 산물은 1% 아가로스 겔 상에서 해리시켰다. 도 3C에 나타낸 바와 같이, 바깥쪽 프라이머를 사용하여 PCR A (attBT2-1 유전자좌) 및 PCR B (attBT2-2 유전자좌)의 크기를 기반으로 하여, 클론 M1-M4, T1, T2, T4, S1, S3, S4 모두다 attBT2-1 유전자좌에 통합된 CRISPR 카세트를 품고 있는 반면, 클론 T3 및 S2는 Bt 염색체 상의 attBT2-2 유전자좌에 통합된 것으로 유추된다. 염색체과 플라스미드 서열 사이의 졍션은 PCR (PCR C 및 D), 그리고 선별된 클론 M1, M2, T1, T3, S1 및 S2에 대한 Sanger DNA 서열화에 의해 정확하다고 다시 확인하였다.
실시예 3. 개별 B. 테타이오타오미크론(B. thetaiotaomicron) 균주의 유도성 CRISPR 사멸
선별된 B. 테타이오타오미크론(B. thetaiotaomicron) CRISPR 구성요소들 M1, T1 및 S1의 경우 (이들 모두 attBT2-1 유전자좌에 통합된 유도성 CRISPR 카세트를 가짐), 상기 유도성 CRISPR/Cas9 매개된 세포 사멸은 BHI 혈액 한천 플레이트 또는 TYG 액체 배지 상에서 조사하였다 (차례로 도 4A 도 4B). M1 및 T1 균주의 단일 콜로니를 코이 쳄버 (Coy Laboratory Products Inc.) 상에서 200 μg/ml 젠타마이신 (Gm) 및 25 μg/ml 에리트로마이신 (Em)이 보충된 5 ml TYG 액체 배지를 함유하는 팔콘 튜브 배양으로 하룻밤 동안 혐기적으로 성장시켰다. 상기 배양물을 희석시키고 (10-6), 그리고 0 및 100 ng/ml의 농도의 안하이드테트라사이클린 (aTc)이 보충된 BHI 혈액 한천 플레이트 (Gm 200 μg/ml 및 Em 25 μg/ml) 상에 100μl를 도말하였다. 상기 한천 플레이트를 혐기적으로 37℃에서, 2-3일 동안 항온처리하였다. 모든 균주의 경우, Tc 없이 (0 ng/ml) 혈액 한천 플레이트에서 약 103-104 CFU (콜로니 형성 단위)를 얻었다. T1균주의 경우, Tc 존재 하에 (100 ng/ml), 혈액 한천 플레이트 상에는 CFU 형성이 관찰되지 않았던 반면, M1 균주의 경우, 여전히 103-104 CFU가 획득되었다 (도 4A).
유사하게, M1을 제외하고, 100ng/ml의 aTc가 보충된 TYG 배지를 함유하는 액체 튜브 배양물에서 37℃에서 4일 동안 혐기성 항온처리에도 세포 성장이 관찰되지 않았다. 그러나, 혐기성 항온처리-후 24시간 시점에서10ng/ml의 aTc 농도에서 클론 T1 및 S2에 대해 약간의 성장이 관찰되었으며, 이로써 완전한 고갈을 위해서는 더 높은 Tc 농도가 필요함을 시사한다 (도 4B). 이들 데이터로부터 염색체 통합 CRISPR/Cas9 시스템이 외인성으로 제공된 유도자 aTc에 의해 활성화되고, 표적화 RNA(tdk_Bt 또는 susC_Bt)에 의해 안내되는 게놈 DNA의 치명적인 절단을 만들고, 이로 인하여 세포 생존력이 손실된다는 것을 보여준다.
실시예 4. 시험관내에서 혼합 집단에서 B. 테타이오타오미크론(B. thetaiotaomicron) 세포들의 표적화된, 유도성 CRISPR 사멸
비-표적화 (M) 또는 표적화 (tdk_Bt 또는 susC_Bt) 가이드 RNA를 발현시키는 CRISPR 통합된 Bt 균주의 혼합 배양물을 이용하여, 시험관내에서 혼합 집단내에서 특정 균주의 표적화된 CRISPR 사멸을 설명하였다. 동일한 양의 지수 성장기 배양물을 혼합하였고, 최종 농도가 각각 0, 10 또는 100ng/ml의 aTc를 보충시킨 5ml TYG 액체 배지에서 혐기성 항온처리하였다. 24h 후, 모든 배양물은 약 1.3 OD600nm 이 되도록 성장시켰다(도 5A). aTc 처리된 배양물의 한 세트(M1 + T1, 각각 0, 10 및 100ng/ml의 aTc를 보충함)의 경우, PCR 및 DNA 서열화를 가이드 RNA(P1-N20 sgRNA 스캐폴드) 영역에서 수행했다. DNA 서열화 크로마토그램에서, aTc 처리된 배양액(aTc 10 및 aTc 100)은 비-표적화 제어 가이드 RNA(M)을 품고 있는 세포만 있었고, 한편 aTc 처리 (aTc 0) 없는 배양물은 비-표적화 가이드 RNA (M) 및 tdk_Bt 표적화 가이드 RNA 모두를 품고 있는 세포의 혼합 집단이 있었다(도 5B).
aTc-처리된 배양물 (M1 + S1-aTc100) 중 하나(M1 + S1-aTc100)를 희석하였고, aTc 보충 없이 BHI 혈액 한천에 도말하여, 단일 콜로니를 얻었다. 개별 콜로니, 뿐만 아니라 한천 플레이트의 콜로니 긁힘을 gRNA 영역의 PCR 후 Sanger DNA 서열화로 분석했다. 모든 개별 콜로니 및 콜로니 혼합물은 비-표적화, 제어 gRNA만을 품고 있는 것으로 나타났고, 이로써 susC_Bt gRNA 품고 있는 구성요소들은 aTc 유도성 CRISPR 사멸에 의해 성공적으로 고갈되었으며, 그리고 튜브 배양물에서 자체적으로(per se) 유도된 Cas9 단백질 발현으로 인한 성장 저해는 없음을 시사한다 (도 5C).
M1+T1의 혼합물에 대해서도 유사한 실험을 수행하여 동일한 관찰 결과를 얻었다. 이들 데이터는 시험관내에서 혼합 집단에서 B. 테타이오타오미크론(B. thetaiotaomicron) 세포들의 표적화된, 유도성 CRISPR 사멸을 실증하였다.
실시예 5. 항생제 선별 없이, B. 테타이오타오미크론(B. thetaiotaomicron) 균주의 장기적 성장 및 표적화된 CRISPR 사멸
항생제 선별 없이, 액체 배양물에서 장기간 성장 및 표적 사멸을 테스트하기 위해, 연속 제한 희석을 사용했다. CRISPR 통합된 Bt 균주 M1, T1 및 S1은 글리세롤 스톡의 TYG 배지에 접종하였고, 24g 동안 코이 챔버에서 37℃에서 혐기성으로 성장시켰다. 이 배양물을 1:100의 희석으로 새로운 TYG 배지에 다시- 접종하였고, 또다른 24h 동안 혐기성으로 성장시켰다. 동일한 절차를 4회 반복하여, 약 5일 동안 액체 배지에서 40세대 동안 성장시켰다. 그런 다음, 이 배양물을 BHI 혈액 한천 플레이트에 도말하여, 단일 콜로니를 형성시켰다. 약 50개 콜로니 각각의 항생제 저항성은 Gm (200 μg/ml) 또는 Em (25 μg/ml)이 보충된 BHI 혈액 한천 플레이트 상에서 테스트되었다. 테스트된 모든 콜로니는 두 항생제 모두에 내성을 나타내었고, 이는 통합된 Bt 균주에서 CRISPR 카세트의 장기간 유지를 시사한다.
실시예 6. 박테로이드 불가투스(Bacteroides vulgatus) 염색체 상에서 CRISPR 통합
상기 유도성 CRISPR 카세트는 박테로이드 불가투스(Bacteroides vulgatus) ATCC 8482 균주 (간단하게 Bv)의 염색체 상에서 또한 통합되었다. Bv 상에서 염색체 통합에 이용된 pNBU2.CRISPR 플라스미드는 실시예 1에서 기술된 바와 같이 구축되었는데, 단지 차이는 Bv 게놈 상에 가이드 RNA 표적화 susC_Bv (BVU_RS05095)가 클론되었다는 점이다. susC_Bv 가이드 RNA를 발현시키기 위한 20 bp 프로토스페이서 서열은 다음과 같다: 5'-ATTCGGCAGTGAATTCCAGA-3' (서열 식별 번호: 8).
비-표적화, 제어 가이드 RNA (M) 또는 susC_Bv 표적화 가이드 RNA를 발현시키기 위한 pNBU2-CRISPR 플라스미드를 대장균(E. coli) S17 람다-pir로 형질도입시켰고, 그리고 Bv 세포로 콘쥬게이션시켰다. 각 콘쥬게이션에서 약 10,000개의 Em 저항성 콜로니가 획득되었다. 비-표적화 제어 콘쥬게이션 플레이트로부터 7개 콜로니 (VM1, VM2, VM3, VM4, VM5, VM6 및 VM7로 표지됨)를 찍어내었고, susC_Bv 표적화 콘쥬게이션 플레이트로부터 5개의 콜로니(V1, V2, V3, V4, V5로 표지됨)를 찍어내어, 콜로니 PCR을 통하여 각각에 대해 염색체 CRISPR 통합 스크리닝하였다. Bv 염색체, attBv.3-1 (tRNA-Ser, BVU_RS10595), attBv.3-2 (BVU_RS21625) 및 attBv.3-3 (유전자간 영역, 3,171,462에서 3,171,474까지의 뉴믈레오티드 좌표) 상에서 3개의 잠재적 NBU2 인테그라제 인지 유전자 좌가 있다. 각 유전자좌에 있어서, 바깥쪽 프라이머를 이용하여 PCR을 수행하였다. 통합이 일어나지 않는다면, 겔 상에 약 0.5 kb의 PCR 앰플리콘이 예상되지만: 그렇지 않으면 PCR 산물은 기대되지 않는다. attBv.3-1 유전자좌의 경우 또한, 염색체 서열에 결합하는 바깥쪽 프라이머와 통합 플라스미드로부터 ermG 인코딩 서열에 결합하는 내부 프라이머를 이용하여 통합의 좌측 증션을 증폭시키는 PCR을 수행하였다. 통합이 attBv.3-1 유전자좌에서 일어난다면, 약 0.6 kb PCR 산물을 보여야 하고; 그렇지 않으면, PCR 산물은 기대되지 않는다. 도 6에 나타낸 바와 같이, 비-표적화, 제어 가이드 RNA 구성요소들 (VM)의 경우, 7개 클론 모두 attBv.3-1 유전자좌에 CRISPR 통합을 품고 있으며; susC_Bv 표적화 가이드 RNA 구성요소들 (V)의 경우, 클론 V1은 attBv.3-1 및 attBv.3-2 유전자좌 모두에서 CRISPR 통합을 품고 있을 수 있고; 클론 V2는 attBv.3-1 및 attBv.3-3 유전자좌 모두에서 CRISPR 통합을 품고 있을 수 있고, 그리고 클론 V3, V4 및 V5의 경우, 이들은 모두 attBv.3-1 유전자좌에서만 오로지 CRISPR 통합을 품고 있다. 이들 데이터에서 NBU2 기반의 CRISPR 통합 시스템은 박테로이드 불가투스(Bacteroides vulgatus) 균주에서 잘 작동됨을 보여준다.
실시예 7. 박테로이드 불가투스(Bacteroides vulgatus)의 표적화된, 유도성 CRISPR 사멸
실시예 3에서와 같이, 개별 CRISPR 통합된 Bv 균주 VM1 (비-표적화 가이드 RNA를 발현시킴) 및 V1, V2, V3, V4, V5 (모두 susC_Bv 가이드 RNA를 발현시킴)는 TYG 액체 배지에서 하룻밤 동안 혐기적으로 성장시켰다. 그 다음, 상기 배양물을 100 ng/ml의 aTc가 보충된 새로운 TYG 배지에 재-접종하였고(1:100 희석) , 이어서 37oC에서 24h 동안 혐기적으로 성장시켰다. 오로지 VM1 배양물만 높은 탁도로 성장한 반면, 표적화 가이드 RNA를 발현시키는 다른 배양물은 성장을 보이지 않았다.
실시예 4에서와 같이, VM1 (비-표적화 가이드 RNA) 및 V3 (susC_Bv 가이드 RNA를 발현시키는)의 혼합 배양물에 100 ng/ml의 aTc를 처리하였고, 이어서 TYG 액체 배지에서 24h 동안 혐기적으로 항온처리하였다. 상기 배양물은 높은 탁도까지 성장하였다. 상기 혼합 배양물의 가이드 RNA 영역의 PCR 및 DNA 서열화에서 이렇게 처리된 배양물은 비-표적화, 제어 가이드 RNA를 발현시키는 세포만 함유한 것으로 나타났다. 이것으로 유도자 추가 시, 혼합 세포 집단에서 특정 B. 불가투스 (B. vulgatus) 균주의 표적화된 CRISPR 사멸이 실증되었다.
실시예 8. 다른 박테로이드(Bacteroides) 균주 염색체 상에서 CRISPR 통합
NBU2 인테그라제 재조합 tRNA-ser 부위 (13 bp)는 공개된 게놈 서열을 기반으로 하여, 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus), 박테로이드 프라실리스(Bacteroides fragilis), 박테로이드 헬로코겐(Bacteroides helcogenes), 박테로이드 오바투스(Bacteroides ovatus), 박테로이드 살라니트로니스(Bacteroides salanitronis), 박테로이드 우니포르미스(Bacteroides uniformis) 및 박테로이드 실라니솔벤스(Bacteroides xylanisolvens)을 비롯한 많은 다른 박테로이드(Bacteroides) 균주에서 보존되고, 존재하였다. 표적화 가이드 RNA를 발현시키는 유도성 CRISPR 카세트는 박테로이드(Bacteroides) 균주 (실시예 3 및 6에서 기술된 바와 같이)의 염색체 상에 통합될 수 있고, 그리고 표적화 가이드 RNA를 발현시키는 특정 균주의 표적화된 CRISPR 사멸은 aTc 유도자 (실시예 4, 5 및 7에서 기술된 바와 같이)로 처리함으로써 이루어질 수 있다.
특정 종의 염색체 상에 NBU2 인테그라제 부위가 없는 상황에서, 이들 13개 염기-쌍 DNA 서열은 염색체 CRISPR 통합 및 표적화된 균주 사멸이 기능하도록 하기 위해 당분야에 기술된 바와 같이, 재조합 (가령, Cre/loxP) 또는 대립형질유전자 교환을 통하여 이들 염색체 상에서 용이하게 삽입될 수 있다.
실시예 9. 인간 프로바이오틱으로 전달된 CRISPR 통합된 박테로이드(Bacteroides) 균주
CRISPR 통합된 박테로이드(Bacteroides) 균주는 인간 장에서 야생형 박테로이드(Bacteroides) 균주의 상대적 풍도를 감소시키는 방법으로 이용될 수 있다. 인간 흑색종 환자들에서 항-PD-1 면역요법은 장 미생물총에 박테로이드(Bacteroides) 균주의 존재에 따라 달라짐을 볼 수 있었다(Gopalakrishnan et al., Science, 2018, 359:97-103). 면역요법 응답자과 비교하였을 때, 비-응답자들은 이들의 미생물총에서 박테로이드(Bacteroides) 균주의 상대적 양이 증가되었다. 면역요법을 시작하기 전, 인간 암 면역요법의 결과를 개선시키기 위해,면역요법유도된 통합된 CRISPR 시스템을 통한 박테로이드(Bacteroides) 균주를 제거할 수 있다.
실시예 10. 인간 장 미생물총 모델의 박테로이드(Bacteroides) 구성부 현시에서 CRISPR-표적화된 감소
장내 미생물총은 인간 건강 뿐만 아니라 각종 질환의 다양한 측면에서 중요한 결정 요인이다. 숙주 생물학에 대한 급격히 증가되는 무수한 효과에 대한 인식은 미생물총-지향된 치료제를 개발하려는 노력을 자극시켰다. 이러한 초기 치료법 중 다수는 장내 미생물총의 초기 구성에 대한 현저한 의존성을 보여주었다. 따라서, 미생물군총 구성원 간의 생태학적 관계를 기술하는 도구(가령, 영양소 경쟁/협력의 토대를 포함하는 틈새 분할)는 효과적인 미생물총-지향 치료제의 발전에 중요한 역할을 할 것이다(가령, Patnode et al., 2019).
장내 미생물 공동체 구성부 간의 상호 작용을 연구하기 위해, 특정된 인간 장내 미생물총 모델에서 특정 장내 박테리아 균주의 현시를 독립적으로 교란할 수 있는 유전적 시스템을 개발했다. 이 시스템은 건강한 개체의 성인 장내 미생물총의 두드러지고, 흔한 구성원인 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron)을 사용하여 구현되었다.
우리는 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) 균주 VPI-5482 (Bt)에서 돌연변이체 세트를 만들었다. 돌연변이체는 (i) 안하이드테트라사이클린-유도성 (aTc) spCas9 유전자, (ii) 에리트로마이신 저항성 카세트, 그리고 (iii) 무작위, 비-게놈 서열 (음성적 대조군)을 표적으로 하는, 또는 두 개 Bt 유전자 (tdk 및 SusC)를 표적으로 하는 구성적으로 활성 가이드 RNA를 함유한다. 이들 카세트는 두 게놈 위치중 하나에 통합되었다. 이들 돌연변이체를 이용하여, 우리는 플레이트 검정 및 액체 배양물에서 강력한 aTc-유도성 사멸을 기록하였다 (도 7A-7C).
우리는 무균 마우스에 13개의 배양된 인간 장 박테리아성 균주 컨소시움을 군락화시켰고, 이들 게놈을 서열화하였다(아래 참고); 이 컨소시움에는 tdk-표적화 gRNA와 함께, Bt-CRISPR 돌연변이가 내포되었다. 마우스는 단독-사육되었으며, 포화 지방이 높고, 과일과 채소가 적은 인간의 식단을 제공하였다. 낮은-섬유질의 'HiSF/LoFV'식이 요법은 10%(w/w) 완두콩 섬유로 보충되었다: 이러한 배합은 이전에 이 공동체/식이 요법 맥락에서 15-20%에서 Bt의 상대적 풍부함을 유지하는 것으로 나타났다(Patnode et al., 2019). 치료 군에서, 위관영양주입-후 1일차 또는 4일차 식수에 10 μg/mL의 Tc를 보충했고 (도 8A); 그렇지 않으면, 위관영양주입-후 1일차에 마우스에게 0.5% 에탄올만 함유한 식수(즉, aTc 용해도를 유지시키기 위해 사용된 비히클)를 제공했다. 대변 DNA의 짧은-판독 쇼트건(shotgun) 서열화를 사용하여, 균주 수준 분해능에서 공통체 구성부의 상대적 풍도를 특정했다. 또한, 우리는 포유류 장에서 발견되지 않는 두 개의 '스파이크-인(spike-in)' 박테리아 분류군을 비롯한 유기체의 절대 풍도를 정량화했다(상세한 내용은 아래 참조).
이 결과는 4-일 치료군에서, aTc 치료 시작-후 2일 시점에서 Bt의 상대적 풍도 및 절대적 풍도에서 35-배 감소되었고, 초기 치료 조건에서 유사한 효과가 있었음을 보여주었다(상대적 풍도 50-배 감소). 이 최저점에 도달한 후, Bt 풍도가 증가하기 시작했지만, 대조군에서 관찰된 수준에는 결코 도달하지 않았다 (도 8B).
Bt의 고갈은 몇가지 다른 박테로이드(Bacteroides): B. 셀룰로실리티쿠스(B. cellulosilyticus), B. 오바투스(B. ovatus), 그리고 B. 카카에(B. caccae)에서 상대적 풍도에서 유의적인 변화가 수반되었다 (도 8C, D; 선형 혼합 모델 한계 평균 P<0.05). Bt 및 이러한 다른 박테로이드(Bacteroides)의 절대적 풍도의 변화 패턴은 상대적 풍도 측정과 유사하다.
관련 실험에서, WT Bt 균주, 또는 12-구성부 공통체를 비롯한 13-구성부 공통체를 마우스에 콜로니화시켰다( Bt 제외). 이들 마우스는 단독-수용되었고, 위관영양공급-후 20일 동안 HiSF/LoFV+10% 완두콩 섬유 식이를 임의로 공급했다. 연속적으로 수집된 대변 샘플에서 분리된 DNA의 COPRO-Seq 분석은 컨소시엄을 설치하기 전, WT Bt를 생략하면 CRISPR-Bt 녹다운의 효과와 대체로 일치하는 이러한 다른 박테로이드(Bacteroides)의 상대적/절대적 풍도의 변화를 초래하는 것으로 나타났다(도 9A-9B).
A. 시험관내에서 성장 검정
모든 성장 검정은 3% 수소, 20% CO2 및 77% N2 대기에서 연질-측면 혐기성 성장 챔버(Coy Laboratory Products)에서 수행되었다. 안하이드테트라사이클린 염산염 (37919, Millipore Sigma)의 스톡 용액을 에탄올에서 2 mg/mL로 제조하고, 필터-멸균(Millipore Sigma SLGV033RS)하였다. Bt 돌연변이체 스톡을 연속 희석하였고, 혈액 한천 플레이트 ± 200ng/mL 안하이드로테트라사이클린에 플레이팅했다. 2일의 성장-후, 플레이트를 이미지화하였다. Bt 돌연변이체의 글리세롤 스톡을 콜로니 정제하였고, 25μg/mL 에리트로마이신을 함유하는 5mL LYBHI에 접종했다. 밤새 항온처리-후, 배양물을 9ng/mL aTc를 함유하는 LYBHI 배지에서 1:50으로 희석하였고, 200μL 분취량을 96-웰 전체-면적 플레이트의 웰(Costar; Cat. No.; CLS3925)에 피펫팅했다. 플레이트를 광학적으로 투명한 멤브레인(Axygen; 카탈로그 번호; UC500)으로 밀봉하고 37℃에서 15분마다 광학 밀도(600 nm)를 통해 성장을 모니터링했다(BioStack 4가 있는 Biotek Eon).
B. 기지균외무감염상태(Gnotobiotic) 마우스
축산 - 마우스와 관련된 모든 실험은 세인트루이스에 있는 Animal Studies Committee of Washington University에서 승인한 프로토콜에 따라 수행되었다. 무균 수컷 C57/B6 마우스 (18-22-주령)는 박막의 유연한 플라스틱 절연체 내에 위치한 케이지에 단독으로 수용하였고, 고압멸균 가능한 마우스 먹이를 먹였다(Envigo; Cat. No.: 2018S). 케이지에는 환경 강화를 위한 종이 집이 들어 있었다. 정확하게 유지되는 조명 주기(06:00시 켜짐, 19:00시 꺼짐) 하에서 동물을 두었다.
HiSF/LoFV+10% 완두 섬유는 National Health and Nutrition Examination Survey(NHANES) database1의 소비 패턴을 기반으로, 선별된 인간을 위한 식품을 사용하여 생산되었다. 상기 식이를 분말(D90 입자 크기, 980mm)로 분쇄하였고, 10%(w/w) 섬유질로 완두콩 섬유(Rattenmaier; Cat. No.: Pea Fiber EF 100)와 혼합했다. 그런 다음, 이 혼합물을 펠릿으로 압출시켰다. 상기 펠릿을 포장하였고, 진공 밀봉하였고, 감마선 조사(20-50 kilogreys)로 멸균시켰다. TYG 배지에서 37℃, 호기성 및 혐기성 조건(대기, 75% N2, 20% CO2, 5% H2)에서 식이를 배양하였고, 무균 마우스에게 식이를 공급한 후, 대변 DNA에 대한 짧은 판독 쇼트건 시퀀싱(시퀀싱에 의한 공통체 PROfiling, COPRO-Seq) 분석함으로써, 무균성을 확인했다.
0.5% 에탄올 또는 10 μg/mL의 aTC를 함유하는 새로운 멸균 식수를 기지균외무감염상태 분리기(gnotobiotic isolators)에서 격일로 준비했다.
콜로니화(Colonization) - 박테로이드 카카에(Bacteroides caccae) TSDC17.2-1.2, 박테로이드 피네골디(Bacteroides finegoldii) TSDC17.2-1.1, 박테로이드 마실리엔시스(Bacteroides massiliensis) TSDC17.2-1.1, 콜리엔셀라 아에로파시엔스(Collinsella aerofaciens) TSDC17.2-1.1, 대장균(Escherichia coli) TSDC17.2-1.2, 오도리박터 스플라키니쿠스(Odoribacter splanchnicus) TSDC17.2-1.2, 파라박테로이드 디스타소니스(Parabacteroides distasonis) TSDC17.2-1.1, 루미노코카세아(Ruminococcaceae) 종. TSDC17.2-1.2, 그리고 수브도리그라눌룸 베리아비레(Subdoligranulum variabile) TSDC17.2-1.1.는 비만-불균형(discordant) 쌍둥이-쌍의 마른 일란성으로부터 수집한 대변 샘플에서 배양되었다[Twin Pair 1, Ridaura et al. (2013)]. 이들 분리체 및 박테로이드 오바투스(Bacteroides ovatus) ATCC 8483, 박테로이드 불가투스(Bacteroides vulgatus) ATCC 8482, 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) VPI-5482, 그리고 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2의 주석이 달린 게놈 서열은 Patnode et al 2019에서 기술된다. 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) VPI-5482 돌연변이체는 상기에서 명시된 프로토콜에 따라 생성되었다. 이들 13개의 각 균주는 TYG 또는 LYBHI 배지에서 초기 정지기로 성장한 콜로니 정제되었다 (Goodman et al., 2019). 단일 배양물의 분취량은 15% 글리세롤에서 -80℃에서 저장되었다. 동등한 수의 유기체를 풀링하였고(OD600 측정 기준),분취량을 사용할 때까지, 80℃에서 15% 글리세롤에 유지시켰다. 실험 0일 차에 분취량을 해동하였고, 기지균외무감염상태 분리기로 도입시켰다. 상기 박테리아 컨소시움은 플라스틱 끝이 달린 구강 위관 주사 바늘을 통해 무균 마우스(총 부피, 한 마리 마우스당 300 μL )로 투여되었다.
콜로니화시키기 전, 마우스를 4일 동안 비-보충된 HiSF/LoFV 식이로 임의로 전환했다. 콜로니화-후, 마우스는 10% 완두콩 섬유로 보충된 HiSF/LoFV에서 시작되었다. 위관영양 다음 날, 0.5% 에탄올 또는 안하이드테트라사이클린 (10 μg/mL)을 함유하는 음용수에서 모든 마우스들은 시작했다. 콜리니화-후, 그리고 aTc 철회-후, 침구(Aspen Woodchips; Northeastern Products)가 교체되었다. 실험 0-8일차에, 각 동물로부터 생산된 새로운 대변 샘플을 수집하였고, 즉시 -80℃에서 동결시켰다.
C. 공통체 구성부의 상대적, 그리고 절대적 풍도의 COPRO-Seq 분석
냉동된 대변 샘플과 맹장 내용물(안락사 시 수집)을 1.8mL 스크류-탑 튜브에서 칭량했다. 포유류 미생물총에서 보이지 않았던 두 가지 박테리아 균주는 공지의 농도[2.22x108 cell/mL 알리시클로바실러스 아시디필루스(Alicyclobacillus acidiphilus) DSM 14558 및 9.93 x 108 cell/mL의 아그로박테리아 라디오박터(Agrobacterium radiobacter) DSM 30147: 둘다 30 μL씩]에서 각 샘플 튜브에 '박아넣었다(spiked in)'. DNA 추출은 500 μL의 2x 완충액 A (200 mM Tris, 200 mM NaCl, 20 mM EDTA), 210 μL 20 % (wt:wt) 도데실 술페이트 나트륨, 그리고 500 μL의 페놀:클로로포름:아밀 알코올 (pH 7.9; 25:24:1)에서 250 μL 0.1 mm 지르코니아/실리카 비드, 그리고 3.97 mm 강철 볼 한 개 (Biospec Minibeadbeater-96)로 4분 동안 비드-비팅(bead-beating)함으로써 시작되었다. 3,220 g에서 4 분 동안 원심분리-후, 420 μL의 수성 상(phase)을 제거하였고, 제작자의 프로토콜에 따라 정제되었다 (QIAquick 96 PCR 정제 키트; Qiagen).
Nextera DNA Library Prep Kit (Illumina; Cat. No.: 15028211) 및 맞춤 바코드화된 프라이머 (Adey)의 조합을 사용하여, 정제된 DNA에서 시퀀싱 라이브러리를 준비했다. Illumina NextSeq 기구를 이용하여 라이브러리를 서열화하였다[판독 길이, 75 nt; 서열화 깊이, 1.02 x 106 ± 2.2 x 104 판독/샘플 (평균 ± SD)]. 판독은 Bowtie II를 사용하여, 박테리아 게놈에 매핑되었고, 상대적 풍도는 정보를 가지고 있는 게놈 크기에 따라, 등급화된 판독 수를 사용하여 계산되었다(Hibberd et al., 2017). 판독이 100,000개 미만인 샘플은 추가 분석에서 생략되었다. 우리는 다음의 상관관계를 사용하여, 주어진 공통체 구성부의 절대적 풍도를 정의했다:
여기에서 P i 는 13-구성부 공동체
Figure pct00008
에서 일부 종에 대한 분획 풍도이며, 아래첨자 문자는 세포 수를 나타내며, P a/r 은 전체
Figure pct00009
에서 스파이크-인 박테리아의 분획 풍도이며, α는 A. 악시디필루스를 나타내며, rA. 라디오박터를 나타내고, ρ는 박테리아 밀도(세포/대변 mg)을 나타내고, W는 대변 펠릿 양(mg)을 나타낸다.
D. 선형 모델링
위관 영양법-후 4-7일 시점에서, 비히클 대조군 및 4-일 치료군의 상대 풍도 데이터는 선형 모델(R core team, 2018)을 사용하여, 다음 형식으로 모델링되었다:
lm(log10(퍼센트) ~ Condition*DPG, data = data)
추정된 한계 평균(Lenth, 2019)을 사용하여, 요일별 조건의 영향을 응답 척도에서 유의성 있게 테스트했다.
실시예 11. 벡터 구축
안정적으로 유지된 RepA CRISPR 플라스미드는 pExchangetdk의 플라스미드 백본 (RP4-oriT, R6K ori, bla, ermG)의 Gibson 클로닝 (NEBuild HIFI DNA Assembly Master Mix, New England Biolabs), pBI143의 RepA (Smith et al., Plasmid, 1995, 34:211-222), 그리고 스트렙토코커스 피오게네스(Streptococcus pyogenes) 균주 SF370의 합성 DNAs 또는 게놈 DNA PCR로부터 어셈블리된 안하이드테트라사이클린 (aTc) 유도성 CRISPR 카세트 (P2-A21-tetR, P1TDP-GH023-SpCas9, P1-N20 sgRNA 스캐폴드) 를 이용하여 구축되었다. 도 10은 상기 플라스미드 디자인을 도시한다.
상기 플라스미드 백본은 R6K 복제 원점과 대장균에서 암피실린 선별용 bla 서열, 박테로이드(Bacteroides)에서 복제용 repA 서열, 콘쥬게이션을 위한 RP4-oriT 서열, 그리고 박테로이드(Bacteroides)에서 에리트로마이신 (Em) 선별을 위한 ermG 서열을 품고있다.
상기 유도성 CRISPR 카세트에는 TetR 조절자 (P2-A21-tetR, P1TDP-GH023-SpCas9)의 제어 하에 있는 aTc 유도성 SpCas9, 그리고 P1 프로모터 (P1-N20 sgRNA 스캐폴드) 하에서 구성적으로 발현되는 가이드 RNA가 내포되어 있다. 상기 프로모터 및 리보솜 결합 부위는 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) 16S rRNA 유전자의 조절 서열로부터 유래되고, 공작된다( Lim et al., Cell, 2017, 169:547-558에서 기술된 바와 같이). 상기 가이드 RNA는 코딩 DNA 서열, 또는 비-코딩 DNA 서열, 또는 비-표적화 스크램블 뉴클레오티드 서열에 상동성인 뉴클레오티드 서열이다. 이 서열은 다른 Cas9 동족체(homologs)의 프로토스페이서 인접 모티프(PAM) 요구 사항과 양립가능하다면, 임의의 형태일 수 있다. 가이드 RNA는 tracrRNA 및 crRNA의 별개 전사 단위에 있거나, 또는 하이브리드 키메라 tracr/crRNA 단일 가이드(sgRNA)에 융합될 수 있다.
상기 플라스미드에 대한 DNA 서열은 서열 식별 번호: 9:으로 제시된다.
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
실시예 12. 개별 B. 테타이오타오미크론(B. thetaiotaomicron) 균주의 유도성 CRISPR 사멸
두 개의 안정적으로 유지된 플라스미드를 항생제 선별 없이, Brain Heart Infusion (BHI) 혈액 한천 플레이트 상에서 B. 테타이오타오미크론(B. thetaiotaomicron)으로 콘쥬게이션시켰다. 한 개 플라스미드는 스크램블된 비-표적화 프로토스페이서 서열 (5'-TGATGGAGAGGTGCAAGTAG-3'; 서열 식별 번호: 6)을 갖는 음성 대조군('M'으로 명명됨)이었다. 박테로이드(Bacteroides) 게놈에 대항하는 이러한 비-표적화 제어 프로토스페이서 서열 의 가상 분석에서 임의의 유의적인 서열 매치(matches)는 없었고, 따라서 '표적-외' 활성은 기대하지 않는다. 또다른 플라스미드는 Bt 게놈 상의 susC_Bt (BT_3702) 코딩 서열을 표적으로 하는 프로토스페이서 서열 (5'- ATGACGGGAATGTACCCCAG-3'; 서열 식별 번호:5)을 갖는다. susC 유전자는 B. 테타이오타오미크론(B. thetaiotaomicron).에서 전분 결합에 연루된 외측 막 단백질을 인코드한다. sgRNA 스캐폴드 서열은 다음과 같다: 5'-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAA
AGTGGCACCGAGTCGGTGCTTTTTT-3' (서열 식별 번호:7). 생성된 두 개 플라스미드는 pRepA-CRISPR.M 및 pRepA-CRISPR.susC_Bt로 불린다. 콜로니를 찍어내어, 200 μg/ml 젠타민 (Gm) 및 50 μg/ml 에리트로마이신 (Em)이 있는 BHI 혈액 한천 플레이트 상에 다시-도말시키고, 코이 챔버에서 혐기성적으로 성장시켰다 (Coy Laboratory Products Inc.). 이렇게 다시-도말된 플레이트로 부터, 단일 콜로니를 찍어내어, 200 μg/ml Gm 및 50 μg/ml Em이 있는 10 ml의 TYG 액체 배지에서 성장시켰다. OD600nm 판독을 하고, 농도는 OD 값이 1로 조정되어야 한다. 그런 다음, 1 ml 부피로 1 대 10 희석액을 만들었다. 두 개 희석액 (10-4 및 10-6) 100μl를 200 μg/ml 젠타민 (Gm) 및 50 μg/ml 에리트로마이신 (Em)있는, 그리고 차례로 0 ng/ml 및 100 ng/ml 농도의 안하이드테트라사이클린 (aTc)이 보충된, BHI 혈액 한천 플레이트 상에 도말시켰다. 이 한천 플레이트를 37 ℃에서 2-3일 동안 항온처리하였다. 모든 균주의 경우, Tc 없이 (0 ng/ml) 혈액 한천 플레이트에서 콜로니 형성 단위를 얻었다. susC 표적화 플라스미드의 경우, Tc 존재 하에 (100 ng/ml), 혈액 한천 플레이트 상에는 CFU 형성이 관찰되지 않았던 반면, M 균주의 경우, CFUs가 획득되었다(도 11 A-D).
실시예 13. 벡터 구축
CRISPR 통합 pNBU2.CRISPR 플라스미드는pExchangetdk의 플라스미드 백본 (RP4-oriT, R6K ori, bla, ermG)의 Gibson 클로닝 (NEBuild HIFI DNA Assembly Master Mix, New England Biolabs), pNBU2-tetQb의 NBU2 인테그라제, 그리고 스트렙토코커스 피오게네스(Streptococcus pyogenes) 균주 SF370의 합성 DNAs 또는 게놈 DNA PCR로부터 어셈블리된 안하이드테트라사이클린 (aTc) 유도성 CRISPR 카세트 (P2-A21-tetR, P1TDP-GH023-SpCas9, P1-N20 sgRNA 스캐폴드) 를 이용하여 구축되었다. 에리트로마이신 (ermG) 항생제 저항성 유전자는 합성 DNA 및 전통적인 제한 효소 클로닝을 이용하여, 쎄폭시틴 항생제 저항성 유전자 (cfxA)로 대체하였다. 도 12는 상기 플라스미드 디자인을 도시한다.
상기 플라스미드 백본은 R6K 복제 원점과 대장균에서 암피실린 선별용 bla 서열, 콘쥬게이션을 위한 RP4-oriT 서열, 그리고 박테로이드(Bacteroides)에서 쎄폭시틴 (FOX) 선별을 위한 cfxA 서열을 품고있다(Parker and Smith, Antimicrobial agents and Chemotherapy, 1993, 37: 1028-1036). NBU2는 intN2 티로신 인테그라제를 인코드하는데, 이는 pNBU2-CRISPR 플라스미드 상의 attN2 부위와 박테로이드(Bacteroides) 세포의 염색체 상에 있는 attB 부위중 하나 사이의 서열-특이적 재조합을 매개한다. 상기 attN2와 attB는 동일한 13 bp 인지 뉴클레오티드 서열 (5'-3')을 갖는다: CCTGTCTCTCCGC (서열 식별 번호: 2).
상기 유도성 CRISPR 카세트에는 TetR 조절자 (P2-A21-tetR, P1TDP-GH023-SpCas9)의 제어 하에 있는 aTc 유도성 SpCas9, 그리고 P1 프로모터 (P1-N20 sgRNA 스캐폴드) 하에서 구성적으로 발현되는 가이드 RNA가 내포되어 있다. 상기 프로모터 및 리보솜 결합 부위는 박테로이드 테타이오타오미크론(Bacteroides thetaiotaomicron) 16S rRNA 유전자의 조절 서열로부터 유래되고, 공작된다( Lim et al., Cell, 2017, 169:547-558에서 기술된 바와 같이). 상기 가이드 RNA는 코딩 DNA 서열, 또는 비-코딩 DNA 서열, 또는 비-표적화 스크램블 뉴클레오티드 서열에 상동성인 뉴클레오티드 서열이다. 이 서열은 다른 Cas9 동족체(homologs)의 프로토스페이서 인접 모티프(PAM) 요구 사항과 양립가능하다면, 임의의 형태일 수 있다. 가이드 RNA는 tracrRNA 및 crRNA의 별개 전사 단위에 있거나, 또는 하이브리드 키메라 tracr/crRNA 단일 가이드(sgRNA)에 융합될 수 있다.
상기 플라스미드 (도 12)에 대한 DNA 서열은 서열 식별 번호: 10으로 제시된다:
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
실시예 14. 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2염색체 상에서 CRISPR 통합
pNBU2-CRISPR 플라스미드는 대장균(E. coli) S-17 람다-pir로 형질도입되었고, 이어서 콘쥬게이션을 통하여 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2 세포로 전달되었다. 이 특정 실시예에서, pNBU2-CRISPR 플라스미드는 티로신 인테그라제를 인코드하는데, 이는 pNBU2-CRISPR 플라스미드 상의 attN2 부위와 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2 (간략하에, BWH2)의 염색체 상에서 두 개의 tRNA-Ser 유전자, BcellWH2_RS22795 또는 BcellWH2_RS23000의 3' 단우에 위치한 또는 비-코딩 영역(뉴클레오티드 좌표 6,071,791-6,071,803) 에 위치한 3개 attBWH2 부위 중 하나 사이의 서열-특이적 재조합을 매개한다. 상기 pNBU2-CRISPR 플라스미드의 삽입으로 두 개 tRNA-Ser 유전자중 하나를 비활성화시킬 수 있고(비-코딩 영역으로 삽입된다면, tRNA-Ser 유전자를 비활성화시키지 않을 것임), 동시에 두 개 tRNA-Ser 유전자로의 삽입은 tRNA-Ser의 본성(essentiality)으로 인하여 가능성이 낮다.
5개 플라스미드가 구축되었으며, 이들은 비-표적화 제어 가이드 ('M'으로 명명됨), 두 개 가이드 RNAs 표적화 tdk_BWH2 (BcellWH2_RS17975) ('T2' 및 'T3'으로 명명됨) 그리고 두 개 가이드 RNAs 표적화 susC_BWH2 (BcellWH2_RS26295) ('S6' 및 'S19'로 명명됨)를 발현시킨다. tdk 유전자는 티미딘 키나제를 인코드하고, susC 유전자는 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2 전분 결합에 연루된 SusC/RagA 패밀리 Ton-B-연계된 외측 막 단백질을 인코드한다. tdk_BWH2에 대한 두 개 프로토스페이서 서열은 T2 (5'-ATACAGGAAACCAATCGTAG-3'; 서열 식별 번호:11) 및 T3, (5'-GGAAGAATCGAAGTTATATG-3'; 서열 식별 번호:12)이며, susC_BWH2의 경우는 S6 (5'-AATCCACTGGATGCCATCCG-3'; 서열 식별 번호:13) 및 S19 (5'-GCTTATGTCTATCTATCCGG-3'; 서열 식별 번호:14)이다. 박테로이드(Bacteroides) 게놈에 대항하는 비-표적화 제어 프로토스페이서 서열 (5'-TGATGGAGAGGTGCAAGTAG-3'; 서열 식별 번호: 6)의 가상 분석에서 임의의 유의적인 서열 매치(matches)는 없었고, 따라서 '표적-외' 활성은 기대하지 않는다. sgRNA 스캐폴드 서열은 다음과 같다: 5'-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT-3' (서열 식별 번호:7). 생성된 플라스미드는 pNBU2-CRISPR.M_BWH2, pNBU2-CRISPR.tdk_BWH2-2, pNBU2-CRISPR.tdk_BWH2-3, pNBU2-CRISPR.susC_BWH2-6 및 pNBU2-CRISPR.susC_BWH2-19로 칭한다.
쎄폭시틴 저항성을 갖는 pNBU2-CRISPR 플라스미드 상의 attN2 부위와 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2 게놈에 있는 3개 attBWH2 부위중 하나 사이에 표적화된 삽입의 예시는 13A-B에 제시된다. 플라스미드 pNBU2-CRISPR.susC_BWH2-19는 t-RNA-Ser 유전자, BcellWH2_RS22795의 attBWH2 부위에만 통합된다. 플라스미드 통합 부위의 5' 단부는 도 13A에 나타내고, 플라스미드 통합 부위의 3' 단부는 도 13B에 나타낸다. 서열화는 Illumina Next Gen Sequencing 기술을 사용하여 수행되었으며, 분석은 Geneious align/assemble 소프트웨어로 수행되었다.
실시예 15. 개별 B. 셀룰로실리티쿠스(B. cellulosilyticus) WH2 균주의 유도성 CRISPR 사멸
선별된 박테로이드 셀룰로실리티쿠스(Bacteroides cellulosilyticus) WH2 구성요소들 (M1, M2, T2, T3, S6 및 S19)의 경우, 유도성 CRISPR Cas9 매개된 세포 사멸은 TYG 액체 배지에서 조사되었다. of M1, M2, T2, T3, S6 및 S19 (M1 및 M2는 동일한 M 비-표적화 콘쥬게이션 플레이트에 있는 별개의 콜로니님)의 단일 콜로니는 코이 쳄버 (Coy Laboratory Products Inc.) 상에서 200 μg/ml 젠타마이신 (Gm) 및 10 μg/ml 쎄폭시틴 (FOX)이 보충된, 5 ml의 TYG 액체 배지를 함유하는 팔콘 튜브 배양으로 하룻밤 동안 혐기적으로 성장시켰다. 그런 다음, 하룻밤 배양물은 TYG 배지에서 OD600nm 값 1로 표준화시켰다. 이들 표준화된 배양물은 1:100 비율 (24.75 ml의 TYG에 250 μl )로 희석시켜 씨딩 배양물을 만들었다. 이러한 25 ml 씨딩 배양물은 새로운 15 ml의 팔콘 튜브에 5 ml 씩 배양물을 할당하였다. 안하이드로테트라사이클린 (aTc)을 0 ng/ml, 10 ng/ml 또는 100 ng/ml의 농도로 5 ml 배양물에 추가하였고, 37 ℃에서, 24시간동안 혐기성적으로 항온처리하였다. 성장 24시간 후, 얻은 OD600nm 판독은 도 14에 나타낸다. 이들 데이터로부터 염색체 통합 CRISPR/Cas9 시스템이 외인성으로 제공된 유도자 aTc에 의해 활성화되고, 표적화 RNA(tdk_BWH2 또는 susC_BWH2)에 의해 안내되는 게놈 DNA의 치명적인 절단을 만들고, 이로 인하여 세포 생존력이 손실된다는 것을 보여준다.
참고자료
Figure pct00024
SEQUENCE LISTING <110> SIGMA-ALDRICH CO. LLC WASHINGTON UNIVERSITY <120> MODULATION OF MICROBIOTA COMPOSITIONS USING TARGETED NUCLEASES <130> P19-171 WO-PCT <140> <141> <150> 63/052,825 <151> 2020-07-16 <150> 62/909,078 <151> 2019-10-01 <150> 62/908,130 <151> 2019-09-30 <160> 38 <170> PatentIn version 3.5 <210> 1 <211> 90 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: HU family DNA-binding protein" <400> 1 Met Asn Lys Ala Asp Leu Ile Ser Ala Val Ala Ala Glu Ala Gly Leu 1 5 10 15 Ser Lys Val Asp Ala Lys Lys Ala Val Glu Ala Phe Val Ser Thr Val 20 25 30 Thr Lys Ala Leu Gln Glu Gly Asp Lys Val Ser Leu Ile Gly Phe Gly 35 40 45 Thr Phe Ser Val Ala Glu Arg Ser Ala Arg Thr Gly Ile Asn Pro Ser 50 55 60 Thr Lys Ala Thr Ile Thr Ile Pro Ala Lys Lys Val Thr Lys Phe Lys 65 70 75 80 Pro Gly Ala Glu Leu Ala Asp Ala Ile Lys 85 90 <210> 2 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 2 cctgtctctc cgc 13 <210> 3 <211> 10396 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 3 ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat taggcacccc 60 aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat 120 ttcacacagg aaacagctat gaccatgatt acgcccttaa gacccacttt cacatttaag 180 ttgtttttct aatccgcata tgatcaattc aaggccgaat aagaaggctg gctctgcacc 240 ttggtgatca aataattcga tagcttgtcg taataatggc ggcatactat cagtagtagg 300 tgtttccctt tcttctttag cgacttgatg ctcttgatct tccaatacgc aacctaaagt 360 aaaatgcccc acagcgctga gtgcatataa tgcattctct agtgaaaaac cttgttggca 420 taaaaaggct aattgatttt cgagagtttc atactgtttt tctgtaggcc gtgtacctaa 480 atgtactttt gctccatcgc gatgacttag taaagcacat ctaaaacttt tagcgttatt 540 acgtaaaaaa tcttgccagc tttccccttc taaagggcaa aagtgagtat ggtgcctatc 600 taacatctca atggctaagg cgtcgagcaa agcccgctta ttttttacat gccaatacaa 660 tgtaggctgc tctacaccta gcttctgggc gagtttacgg gttgttaaac cttcgattcc 720 gacctcatta agcagctcta atgcgctgtt aatcacttta cttttatcta atctagacat 780 attcgtttaa tatcataaat aatttatttt attttaaaat gcgcgggtgc aaaggtaaga 840 ggttttattt taactaccaa atgttttcgg aagttttttc gcttttcttt ttctatcgtt 900 tctcagactc tcttagcgaa agggaaagaa ggtaaagaag aaaaacaaaa cgccttttct 960 tttttgcacc cgctttccaa gagaagaaag ccttgttaaa ttgacttagt gtaaaagcgc 1020 agtactgctt gaccataaga acaaaaaaat ctctatcact gatagggata aagtttggaa 1080 gataaagcta aaagttctta tctttgcagt ctccctatca gtgatagaga cgaaataaag 1140 acatataaaa gaaaagacac catggataag aaatactcaa taggcttaga tatcggcaca 1200 aatagcgtcg gatgggcggt gatcactgat gaatataagg ttccgtctaa aaagttcaag 1260 gttctgggaa atacagaccg ccacagtatc aaaaaaaatc ttataggggc tcttttattt 1320 gacagtggag agacagcgga agcgactcgt ctcaaacgga cagctcgtag aaggtataca 1380 cgtcggaaga atcgtatttg ttatctacag gagatttttt caaatgagat ggcgaaagta 1440 gatgatagtt tctttcatcg acttgaagag tcttttttgg tggaagaaga caagaagcat 1500 gaacgtcatc ctatttttgg aaatatagta gatgaagttg cttatcatga gaaatatcca 1560 actatctatc atctgcgaaa aaaattggta gattctactg ataaagcgga tttgcgctta 1620 atctatttgg ccttagcgca tatgattaag tttcgtggtc attttttgat tgagggagat 1680 ttaaatcctg ataatagtga tgtggacaaa ctatttatcc agttggtaca aacctacaat 1740 caattatttg aagaaaaccc tattaacgca agtggagtag atgctaaagc gattctttct 1800 gcacgattga gtaaatcaag acgattagaa aatctcattg ctcagctccc cggtgagaag 1860 aaaaatggct tatttgggaa tctcattgct ttgtcattgg gtttgacccc taattttaaa 1920 tcaaattttg atttggcaga agatgctaaa ttacagcttt caaaagatac ttacgatgat 1980 gatttagata atttattggc gcaaattgga gatcaatatg ctgatttgtt tttggcagct 2040 aagaatttat cagatgctat tttactttca gatatcctaa gagtaaatac tgaaataact 2100 aaggctcccc tatcagcttc aatgattaaa cgctacgatg aacatcatca agacttgact 2160 cttttaaaag ctttagttcg acaacaactt ccagaaaagt ataaagaaat cttttttgat 2220 caatcaaaaa acggatatgc aggttatatt gatgggggag ctagccaaga agaattttat 2280 aaatttatca aaccaatttt agaaaaaatg gatggtactg aggaattatt ggtgaaacta 2340 aatcgtgaag atttgctgcg caagcaacgg acctttgaca acggctctat tccccatcaa 2400 attcacttgg gtgagctgca tgctattttg agaagacaag aagactttta tccattttta 2460 aaagacaatc gtgagaagat tgaaaaaatc ttgacttttc gaattcctta ttatgttggt 2520 ccattggcgc gtggcaatag tcgttttgca tggatgactc ggaagtctga agaaacaatt 2580 accccatgga attttgaaga agttgtcgat aaaggtgctt cagctcaatc atttattgaa 2640 cgcatgacaa actttgataa aaatcttcca aatgaaaaag tactaccaaa acatagtttg 2700 ctttatgagt attttacggt ttataacgaa ttgacaaagg tcaaatatgt tactgaagga 2760 atgcgaaaac cagcatttct ttcaggtgaa cagaagaaag ccattgttga tttactcttc 2820 aaaacaaatc gaaaagtaac cgttaagcaa ttaaaagaag attatttcaa aaaaatagaa 2880 tgttttgata gtgttgaaat ttcaggagtt gaagatagat ttaatgcttc attaggtacc 2940 taccatgatt tgctaaaaat tattaaagat aaagattttt tggataatga agaaaatgaa 3000 gatatcttag aggatattgt tttaacattg accttatttg aagataggga gatgattgag 3060 gaaagactta aaacatatgc tcacctcttt gatgataagg tgatgaaaca gcttaaacgt 3120 cgccgttata ctggttgggg acgtttgtct cgaaaattga ttaatggtat tagggataag 3180 caatctggca aaacaatatt agattttttg aaatcagatg gttttgccaa tcgcaatttt 3240 atgcagctga tccatgatga tagtttgaca tttaaagaag acattcaaaa agcacaagtg 3300 tctggacaag gcgatagttt acatgaacat attgcaaatt tagctggtag ccctgctatt 3360 aaaaaaggta ttttacagac tgtaaaagtt gttgatgaat tggtcaaagt aatggggcgg 3420 cataagccag aaaatatcgt tattgaaatg gcacgtgaaa atcagacaac tcaaaagggc 3480 cagaaaaatt cgcgagagcg tatgaaacga atcgaagaag gtatcaaaga attaggaagt 3540 cagattctta aagagcatcc tgttgaaaat actcaattgc aaaatgaaaa gctctatctc 3600 tattatctcc aaaatggaag agacatgtat gtggaccaag aattagatat taatcgttta 3660 agtgattatg atgtcgatca cattgttcca caaagtttcc ttaaagacga ttcaatagac 3720 aataaggtct taacgcgttc tgataaaaat cgtggtaaat cggataacgt tccaagtgaa 3780 gaagtagtca aaaagatgaa aaactattgg agacaacttc taaacgccaa gttaatcact 3840 caacgtaagt ttgataattt aacgaaagct gaacgtggag gtttgagtga acttgataaa 3900 gctggtttta tcaaacgcca attggttgaa actcgccaaa tcactaagca tgtggcacaa 3960 attttggata gtcgcatgaa tactaaatac gatgaaaatg ataaacttat tcgagaggtt 4020 aaagtgatta ccttaaaatc taaattagtt tctgacttcc gaaaagattt ccaattctat 4080 aaagtacgtg agattaacaa ttaccatcat gcccatgatg cgtatctaaa tgccgtcgtt 4140 ggaactgctt tgattaagaa atatccaaaa cttgaatcgg agtttgtcta tggtgattat 4200 aaagtttatg atgttcgtaa aatgattgct aagtctgagc aagaaatagg caaagcaacc 4260 gcaaaatatt tcttttactc taatatcatg aacttcttca aaacagaaat tacacttgca 4320 aatggagaga ttcgcaaacg ccctctaatc gaaactaatg gggaaactgg agaaattgtc 4380 tgggataaag ggcgagattt tgccacagtg cgcaaagtat tgtccatgcc ccaagtcaat 4440 attgtcaaga aaacagaagt acagacaggc ggattctcca aggagtcaat tttaccaaaa 4500 agaaattcgg acaagcttat tgctcgtaaa aaagactggg atccaaaaaa atatggtggt 4560 tttgatagtc caacggtagc ttattcagtc ctagtggttg ctaaggtgga aaaagggaaa 4620 tcgaagaagt taaaatccgt taaagagtta ctagggatca caattatgga aagaagttcc 4680 tttgaaaaaa atccgattga ctttttagaa gctaaaggat ataaggaagt taaaaaagac 4740 ttaatcatta aactacctaa atatagtctt tttgagttag aaaacggtcg taaacggatg 4800 ctggctagtg ccggagaatt acaaaaagga aatgagctgg ctctgccaag caaatatgtg 4860 aattttttat atttagctag tcattatgaa aagttgaagg gtagtccaga agataacgaa 4920 caaaaacaat tgtttgtgga gcagcataag cattatttag atgagattat tgagcaaatc 4980 agtgaatttt ctaagcgtgt tattttagca gatgccaatt tagataaagt tcttagtgca 5040 tataacaaac atagagacaa accaatacgt gaacaagcag aaaatattat tcatttattt 5100 acgttgacga atcttggagc tcccgctgct tttaaatatt ttgatacaac aattgatcgt 5160 aaacgatata cgtctacaaa agaagtttta gatgccactc ttatccatca atccatcact 5220 ggtctttatg aaacacgcat tgatttgagt cagctaggag gtgactgaat taatgcggct 5280 gcaatttttt tgggcggggc cgcccaaaaa aatcctagca ccctgcagca gtactgcttg 5340 accataagaa caaaaaaact tccgataaag tttggaagat aaagctaaaa gttcttatct 5400 ttgcagtatg acgggaatgt accccaggtt ttagagctag aaatagcaag ttaaaataag 5460 gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt gagatctgtc 5520 gactctagag gatccccggg taccgagctc gaattcactg gccgtcgttt tacaacgtcg 5580 tgactgggaa aaccctggcg ttacccaact taatcgtact tgtgcctgtt ctatttccga 5640 accgaccgct tgtatgaatc catcaaaatt cgttttctct atgttggatt ccttgttgct 5700 catattgtga tgataatttc tacaaatata gtcattggta actatctatg aaactgtttg 5760 atacttttat agttgattaa acttgttcat ggcatttgcc ttaatatcat ccgctatgtc 5820 aatgtagggt ttcatagctt tgtagtcgct gtgtcccgtc catttcatga ccacctgtgc 5880 cgggattccg agagccagcg cattgcagat gaatgtcctt tttcctgcat gggtactgag 5940 caaagcgtat ttgggtgtga cttcatcaat acgttcattt cccttgtagt aggtttcccg 6000 tacaggctcg ttgatttctg ccagttcgcc cagctctttc aggtaatcgt tcatcttctg 6060 gttgctgatg acgggcagag ccatgtaatt ctcgaaatgg atgtccttgt atttgtccag 6120 tatggctttg ctgtatttgt tcagttcaat cgtcaggctg tcggcagtct tgactgtggt 6180 tatttcgatg tggtcggact tcacatcgct tcttttcaga ttgcgaacat ccgaataccg 6240 caaactcgta aagcagcaga acaggaaaac atcacgcaca cgttccaggt attgcttatc 6300 cttgggtatc tggtagtctt tcagcttgtt cagttcatcc caagtcagga agattacttt 6360 tttcgaggtg gttttcagtt tcggtttgaa cgtatcgtat gcaatgttct gatgatgtcc 6420 tttcttgaag ctccagcgca ggaaccattt gaggaatccc atttgcttgc cgatggtgct 6480 gtttctcata tccttggtgt cacgcaggaa gttgacgtat tcgttcaatc caaactcgtt 6540 gaaatagttg aacgttgcat cctccttgaa ctctttgagg tggttcctca ctgctgcaaa 6600 tttttcatag gtggatgccg tccagttatt ctggttaccg cactctttta caaactcatc 6660 gaacacctcc caaaagctga caggggcttc ttccggctgt tcttcactgg tgtctttcat 6720 tctcatgttg aaagcttcct tcaactgttg ggtcgttggc atgacctcct gcacctcaaa 6780 ttccttgaaa atattctgga tttcggcata gtatttcagc aagtccgtat tgatttcggc 6840 tgcactttgc tttagcttgt tggtacatcc gttctttacc cgctgcttat ctgcatccca 6900 tttggctacg tcaatccggt agcccgttgt aaactcgata cgttggctgg caaagatgac 6960 acgcatacgg atgggtacgt tctctacgat tggcacaccg ttctttttcc ggctctccaa 7020 tgcaaaaatg atgttgcgct tgatattcat aattgggtgc gtttgaaatt ctacacccaa 7080 atatacaccc aattattgag atagcaaaag acatttagaa acatttactt ttactctata 7140 ttgtaattta cacttgatta tcagtcgttt gcagtcttat gatattctgt gaaagtataa 7200 gttcgagagc ctgtctctcc gcaaaaaacg ctgaaaatca gcagattgca aaacaaacac 7260 cctgttttac acccaagaat gtaaagtcgg ctgtttttgt tttatttaag ataatacaac 7320 cactacataa taaaagagta gcgatattaa aagaatccga tgagaaaaga ctaatattta 7380 tctatccatt cagtttgatt tttcaggact ttacatcgtc ctgaaagtat ttgttggtac 7440 cggtaccgag gacgcgtaaa catttacagt tgcatgtggc ctattgtttt tagccgttaa 7500 atattttata actattaaat agcgatacaa attgttcgaa actaatattg tttatatcat 7560 atattctcgc atgttttaaa gctttattaa attgattttt tgtaaacagt ttttcgtact 7620 ctttgttaac ccatttcatt acaaaagttt catatttttt tctctcttta aatgccattt 7680 ttgctggctt tctttttaat acaattaatg tgctatccac tttaggtttt ggatggaaat 7740 aatacctagg aatttttgct aatatagaaa tatctacctc tgccattaac agcaatgcta 7800 gtgatctgtt tgtatctaat aacattttag caaaaccata ttccactatt aaataactta 7860 ttgtggctga actttcaaaa acaatttttc gaattatatt tgtgcttatg ttgtaaggta 7920 tgctgccaaa tattttatat ggattgtggc taggaaatgt aaatttcagt atatcatcat 7980 ttactatttg atagttagga taatttaaga gcttattacg agttacctca cataatttag 8040 aatcaatttc tatcgccgtt acaaaattac atctctttac caatccagca gtaaaatgac 8100 ctttccctgc acctatttca aagatgttat ctttttcatc taaacttatg caattcatta 8160 ttttttctat gtgatatttt gaagtaataa aattttgact atcttttata tttactttgt 8220 tcattataac ctctccttaa tttattgcat ctcttttcga atatttatgt tttttgagaa 8280 aagaacgtac tcatggttca tcccgatatg cgtatcggtc tgtatatcag caactttcta 8340 tgtgtttcaa ctacaatagt catctattct catctttctg agtccacccc ctgcaaagcc 8400 cctctttacg acataaaaat tcggtcggaa aaggtatgca aaagatgttt ctctctttaa 8460 gagaaactct tcgggatgca aaaatatgaa aataactcca attcaccaaa ttatatagcg 8520 acttttttac aaaatgctaa aatttgttga tttccgtcaa gcaattgttg agcaaaaatg 8580 tcttttacga taaaatgata cctcaatatc aactgtttag caaaacgata tttctcttaa 8640 agagagaaac acctttttgt tcaccaatcc ccgactttta atcccgcggc catgattgaa 8700 aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 8760 tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 8820 agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 8880 gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 8940 cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 9000 agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 9060 taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 9120 tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 9180 taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 9240 acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 9300 ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 9360 cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 9420 agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 9480 tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 9540 agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcataacgcg 9600 tcaattcgag ggggatcaat tccgtgatag gtgggctgcc cttcctggtt ggcttggttt 9660 catcagccat ccgcttgccc tcatctgtta cgccggcggt agccggccag cctcgcagag 9720 caggattccc gttgagcacc gccaggtgcg aataagggac agtgaagaag gaacacccgc 9780 tcgcgggtgg gcctacttca cctatcctgc ccggctgacg ccgttggata caccaaggaa 9840 agtctacacg aaccctttgg caaaatcctg tatatcgtgc gaaaaaggat ggatataccg 9900 aaaaaatcgc tataatgacc ccgaagcagg gttatgcagc ggaaaacgga attgatccgg 9960 ccacgatgcg tccggcgtag aggatctgaa gatcagcagt tcaacctgtt gatagtacgt 10020 actaagctct catgtttcac gtactaagct ctcatgttta acgtactaag ctctcatgtt 10080 taacgaacta aaccctcatg gctaacgtac taagctctca tggctaacgt actaagctct 10140 catgtttcac gtactaagct ctcatgtttg aacaataaaa ttaatataaa tcagcaactt 10200 aaatagcctc taaggtttta agttttataa gaaaaaaaag aatatataag gcttttaaag 10260 cttttaaggt ttaacggttg tggacaacaa gccagggatg taacgcactg agaagccctt 10320 agagcctctc aaagcaattt tgagtgacac aggaacactt aacggctgac atgggaattc 10380 ccctccaccg cggtgg 10396 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 4 aattgaggca tcggtccgaa 20 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 5 atgacgggaa tgtaccccag 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 6 tgatggagag gtgcaagtag 20 <210> 7 <211> 82 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 7 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgctttt tt 82 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 attcggcagt gaattccaga 20 <210> 9 <211> 9321 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 9 ctcgagtccc cgaccgatga tttttaagtg actgattttg tgctgttttg ggggtatatt 60 aagaataaaa gaaatagaat aagttaagta cttgatacac aatatagggc attttccata 120 ttggaaattc tcattttcca atctagaaaa taccgatttc ctaatatgat actaaatagg 180 aaaataatat ttcccttaat attgttttta tggaaaataa tagtttactt tgtggagaat 240 aatatttccc aaaaacatat caaaatggaa aataaaaaag cagttaagtt aaccgatttt 300 caaaagaagc aagaaaatcc ttttatgaaa acaagctata gaggtattga aaatcatgtt 360 gttaaaaagt ataagagtaa tagtggtggc gataagagag ctgtagtagc tttagccgac 420 actgaaactg gagaagtgtt taagacttcg tttatccgtc aaatagaagt agatgaagaa 480 caattcacta aattgtatct ttctaacttt gctgcattct ttgacctatc acaagcagct 540 attcgggttt ttggttactt tatgacctgc atgaaaccca aaaatgattt aatcattttc 600 aatagaaaaa aatgcctaga atataccaaa tacaaaacag acaaagccgt ttataaagga 660 cttgcagaac ttgtaaaagc tgaaatcata gcccgaggac cagccgataa tctttggttt 720 attaatcctc tgatagtatt caatggtgac cgagtgacat ttgctaaaac atacgtttcg 780 gaaaaagact ttagctgccc aaaagaaaga agaagcagag aaacgacaat tatcacttgg 840 ctttgatgaa cagtaacact ccattgagtg aagctgccgt ttggtcgctc ccctttgggc 900 ggggggggat agataaagtt cctctatgta aagttataat gggggatgaa ggcaaggtcg 960 ctaaccttac cgaggacgcg taaacattta cagttgcatg tggcctattg tttttagccg 1020 ttaaatattt tataactatt aaatagcgat acaaattgtt cgaaactaat attgtttata 1080 tcatatattc tcgcatgttt taaagcttta ttaaattgat tttttgtaaa cagtttttcg 1140 tactctttgt taacccattt cattacaaaa gtttcatatt tttttctctc tttaaatgcc 1200 atttttgctg gctttctttt taatacaatt aatgtgctat ccactttagg ttttggatgg 1260 aaataatacc taggaatttt tgctaatata gaaatatcta cctctgccat taacagcaat 1320 gctagtgatc tgtttgtatc taataacatt ttagcaaaac catattccac tattaaataa 1380 cttattgtgg ctgaactttc aaaaacaatt tttcgaatta tatttgtgct tatgttgtaa 1440 ggtatgctgc caaatatttt atatggattg tggctaggaa atgtaaattt cagtatatca 1500 tcatttacta tttgatagtt aggataattt aagagcttat tacgagttac ctcacataat 1560 ttagaatcaa tttctatcgc cgttacaaaa ttacatctct ttaccaatcc agcagtaaaa 1620 tgacctttcc ctgcacctat ttcaaagatg ttatcttttt catctaaact tatgcaattc 1680 attatttttt ctatgtgata ttttgaagta ataaaatttt gactatcttt tatatttact 1740 ttgttcatta taacctctcc ttaatttatt gcatctcttt tcgaatattt atgttttttg 1800 agaaaagaac gtactcatgg ttcatcccga tatgcgtatc ggtctgtata tcagcaactt 1860 tctatgtgtt tcaactacaa tagtcatcta ttctcatctt tctgagtcca ccccctgcaa 1920 agcccctctt tacgacataa aaattcggtc ggaaaaggta tgcaaaagat gtttctctct 1980 ttaagagaaa ctcttcggga tgcaaaaata tgaaaataac tccaattcac caaattatat 2040 agcgactttt ttacaaaatg ctaaaatttg ttgatttccg tcaagcaatt gttgagcaaa 2100 aatgtctttt acgataaaat gatacctcaa tatcaactgt ttagcaaaac gatatttctc 2160 ttaaagagag aaacaccttt ttgttcacca atccccgact tttaatcccg cggccatgat 2220 tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg 2280 gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 2340 gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 2400 gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 2460 ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 2520 tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 2580 acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 2640 cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat 2700 catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 2760 cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 2820 ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 2880 ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 2940 ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 3000 atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 3060 gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcataa 3120 cgcgtcaatt cgagggggat caattccgtg ataggtgggc tgcccttcct ggttggcttg 3180 gtttcatcag ccatccgctt gccctcatct gttacgccgg cggtagccgg ccagcctcgc 3240 agagcaggat tcccgttgag caccgccagg tgcgaataag ggacagtgaa gaaggaacac 3300 ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct gacgccgttg gatacaccaa 3360 ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa ggatggatat 3420 accgaaaaaa tcgctataat gaccccgaag cagggttatg cagcggaaaa cggaattgat 3480 ccggccacga tgcgtccggc gtagaggatc tgaagatcag cagttcaacc tgttgatagt 3540 acgtactaag ctctcatgtt tcacgtacta agctctcatg tttaacgtac taagctctca 3600 tgtttaacga actaaaccct catggctaac gtactaagct ctcatggcta acgtactaag 3660 ctctcatgtt tcacgtacta agctctcatg tttgaacaat aaaattaata taaatcagca 3720 acttaaatag cctctaaggt tttaagtttt ataagaaaaa aaagaatata taaggctttt 3780 aaagctttta aggtttaacg gttgtggaca acaagccagg gatgtaacgc actgagaagc 3840 ccttagagcc tctcaaagca attttgagtg acacaggaac acttaacggc tgacatggga 3900 attcccctcc accgcggtgg cttaagaccc actttcacat ttaagttgtt tttctaatcc 3960 gcatatgatc aattcaaggc cgaataagaa ggctggctct gcaccttggt gatcaaataa 4020 ttcgatagct tgtcgtaata atggcggcat actatcagta gtaggtgttt ccctttcttc 4080 tttagcgact tgatgctctt gatcttccaa tacgcaacct aaagtaaaat gccccacagc 4140 gctgagtgca tataatgcat tctctagtga aaaaccttgt tggcataaaa aggctaattg 4200 attttcgaga gtttcatact gtttttctgt aggccgtgta cctaaatgta cttttgctcc 4260 atcgcgatga cttagtaaag cacatctaaa acttttagcg ttattacgta aaaaatcttg 4320 ccagctttcc ccttctaaag ggcaaaagtg agtatggtgc ctatctaaca tctcaatggc 4380 taaggcgtcg agcaaagccc gcttattttt tacatgccaa tacaatgtag gctgctctac 4440 acctagcttc tgggcgagtt tacgggttgt taaaccttcg attccgacct cattaagcag 4500 ctctaatgcg ctgttaatca ctttactttt atctaatcta gacatattcg tttaatatca 4560 taaataattt attttatttt aaaatgcgcg ggtgcaaagg taagaggttt tattttaact 4620 accaaatgtt ttcggaagtt ttttcgcttt tctttttcta tcgtttctca gactctctta 4680 gcgaaaggga aagaaggtaa agaagaaaaa caaaacgcct tttctttttt gcacccgctt 4740 tccaagagaa gaaagccttg ttaaattgac ttagtgtaaa agcgcagtac tgcttgacca 4800 taagaacaaa aaaatctcta tcactgatag ggataaagtt tggaagataa agctaaaagt 4860 tcttatcttt gcagtctccc tatcagtgat agagacgaaa taaagacata taaaagaaaa 4920 gacaccatgg ataagaaata ctcaataggc ttagatatcg gcacaaatag cgtcggatgg 4980 gcggtgatca ctgatgaata taaggttccg tctaaaaagt tcaaggttct gggaaataca 5040 gaccgccaca gtatcaaaaa aaatcttata ggggctcttt tatttgacag tggagagaca 5100 gcggaagcga ctcgtctcaa acggacagct cgtagaaggt atacacgtcg gaagaatcgt 5160 atttgttatc tacaggagat tttttcaaat gagatggcga aagtagatga tagtttcttt 5220 catcgacttg aagagtcttt tttggtggaa gaagacaaga agcatgaacg tcatcctatt 5280 tttggaaata tagtagatga agttgcttat catgagaaat atccaactat ctatcatctg 5340 cgaaaaaaat tggtagattc tactgataaa gcggatttgc gcttaatcta tttggcctta 5400 gcgcatatga ttaagtttcg tggtcatttt ttgattgagg gagatttaaa tcctgataat 5460 agtgatgtgg acaaactatt tatccagttg gtacaaacct acaatcaatt atttgaagaa 5520 aaccctatta acgcaagtgg agtagatgct aaagcgattc tttctgcacg attgagtaaa 5580 tcaagacgat tagaaaatct cattgctcag ctccccggtg agaagaaaaa tggcttattt 5640 gggaatctca ttgctttgtc attgggtttg acccctaatt ttaaatcaaa ttttgatttg 5700 gcagaagatg ctaaattaca gctttcaaaa gatacttacg atgatgattt agataattta 5760 ttggcgcaaa ttggagatca atatgctgat ttgtttttgg cagctaagaa tttatcagat 5820 gctattttac tttcagatat cctaagagta aatactgaaa taactaaggc tcccctatca 5880 gcttcaatga ttaaacgcta cgatgaacat catcaagact tgactctttt aaaagcttta 5940 gttcgacaac aacttccaga aaagtataaa gaaatctttt ttgatcaatc aaaaaacgga 6000 tatgcaggtt atattgatgg gggagctagc caagaagaat tttataaatt tatcaaacca 6060 attttagaaa aaatggatgg tactgaggaa ttattggtga aactaaatcg tgaagatttg 6120 ctgcgcaagc aacggacctt tgacaacggc tctattcccc atcaaattca cttgggtgag 6180 ctgcatgcta ttttgagaag acaagaagac ttttatccat ttttaaaaga caatcgtgag 6240 aagattgaaa aaatcttgac ttttcgaatt ccttattatg ttggtccatt ggcgcgtggc 6300 aatagtcgtt ttgcatggat gactcggaag tctgaagaaa caattacccc atggaatttt 6360 gaagaagttg tcgataaagg tgcttcagct caatcattta ttgaacgcat gacaaacttt 6420 gataaaaatc ttccaaatga aaaagtacta ccaaaacata gtttgcttta tgagtatttt 6480 acggtttata acgaattgac aaaggtcaaa tatgttactg aaggaatgcg aaaaccagca 6540 tttctttcag gtgaacagaa gaaagccatt gttgatttac tcttcaaaac aaatcgaaaa 6600 gtaaccgtta agcaattaaa agaagattat ttcaaaaaaa tagaatgttt tgatagtgtt 6660 gaaatttcag gagttgaaga tagatttaat gcttcattag gtacctacca tgatttgcta 6720 aaaattatta aagataaaga ttttttggat aatgaagaaa atgaagatat cttagaggat 6780 attgttttaa cattgacctt atttgaagat agggagatga ttgaggaaag acttaaaaca 6840 tatgctcacc tctttgatga taaggtgatg aaacagctta aacgtcgccg ttatactggt 6900 tggggacgtt tgtctcgaaa attgattaat ggtattaggg ataagcaatc tggcaaaaca 6960 atattagatt ttttgaaatc agatggtttt gccaatcgca attttatgca gctgatccat 7020 gatgatagtt tgacatttaa agaagacatt caaaaagcac aagtgtctgg acaaggcgat 7080 agtttacatg aacatattgc aaatttagct ggtagccctg ctattaaaaa aggtatttta 7140 cagactgtaa aagttgttga tgaattggtc aaagtaatgg ggcggcataa gccagaaaat 7200 atcgttattg aaatggcacg tgaaaatcag acaactcaaa agggccagaa aaattcgcga 7260 gagcgtatga aacgaatcga agaaggtatc aaagaattag gaagtcagat tcttaaagag 7320 catcctgttg aaaatactca attgcaaaat gaaaagctct atctctatta tctccaaaat 7380 ggaagagaca tgtatgtgga ccaagaatta gatattaatc gtttaagtga ttatgatgtc 7440 gatcacattg ttccacaaag tttccttaaa gacgattcaa tagacaataa ggtcttaacg 7500 cgttctgata aaaatcgtgg taaatcggat aacgttccaa gtgaagaagt agtcaaaaag 7560 atgaaaaact attggagaca acttctaaac gccaagttaa tcactcaacg taagtttgat 7620 aatttaacga aagctgaacg tggaggtttg agtgaacttg ataaagctgg ttttatcaaa 7680 cgccaattgg ttgaaactcg ccaaatcact aagcatgtgg cacaaatttt ggatagtcgc 7740 atgaatacta aatacgatga aaatgataaa cttattcgag aggttaaagt gattacctta 7800 aaatctaaat tagtttctga cttccgaaaa gatttccaat tctataaagt acgtgagatt 7860 aacaattacc atcatgccca tgatgcgtat ctaaatgccg tcgttggaac tgctttgatt 7920 aagaaatatc caaaacttga atcggagttt gtctatggtg attataaagt ttatgatgtt 7980 cgtaaaatga ttgctaagtc tgagcaagaa ataggcaaag caaccgcaaa atatttcttt 8040 tactctaata tcatgaactt cttcaaaaca gaaattacac ttgcaaatgg agagattcgc 8100 aaacgccctc taatcgaaac taatggggaa actggagaaa ttgtctggga taaagggcga 8160 gattttgcca cagtgcgcaa agtattgtcc atgccccaag tcaatattgt caagaaaaca 8220 gaagtacaga caggcggatt ctccaaggag tcaattttac caaaaagaaa ttcggacaag 8280 cttattgctc gtaaaaaaga ctgggatcca aaaaaatatg gtggttttga tagtccaacg 8340 gtagcttatt cagtcctagt ggttgctaag gtggaaaaag ggaaatcgaa gaagttaaaa 8400 tccgttaaag agttactagg gatcacaatt atggaaagaa gttcctttga aaaaaatccg 8460 attgactttt tagaagctaa aggatataag gaagttaaaa aagacttaat cattaaacta 8520 cctaaatata gtctttttga gttagaaaac ggtcgtaaac ggatgctggc tagtgccgga 8580 gaattacaaa aaggaaatga gctggctctg ccaagcaaat atgtgaattt tttatattta 8640 gctagtcatt atgaaaagtt gaagggtagt ccagaagata acgaacaaaa acaattgttt 8700 gtggagcagc ataagcatta tttagatgag attattgagc aaatcagtga attttctaag 8760 cgtgttattt tagcagatgc caatttagat aaagttctta gtgcatataa caaacataga 8820 gacaaaccaa tacgtgaaca agcagaaaat attattcatt tatttacgtt gacgaatctt 8880 ggagctcccg ctgcttttaa atattttgat acaacaattg atcgtaaacg atatacgtct 8940 acaaaagaag ttttagatgc cactcttatc catcaatcca tcactggtct ttatgaaaca 9000 cgcattgatt tgagtcagct aggaggtgac tgaattaatg cggctgcaat ttttttgggc 9060 ggggccgccc aaaaaaatcc tagcaccctg cagcagtact gcttgaccat aagaacaaaa 9120 aaacttccga taaagtttgg aagataaagc taaaagttct tatctttgca gtatgacggg 9180 aatgtacccc aggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 9240 acttgaaaaa gtggcaccga gtcggtgctt tttttgagat ctgtccatac ccatgggacg 9300 tctgatgatt aaggatcttg c 9321 <210> 10 <211> 10627 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 10 ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat taggcacccc 60 aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat 120 ttcacacagg aaacagctat gaccatgatt acgcccttaa gacccacttt cacatttaag 180 ttgtttttct aatccgcata tgatcaattc aaggccgaat aagaaggctg gctctgcacc 240 ttggtgatca aataattcga tagcttgtcg taataatggc ggcatactat cagtagtagg 300 tgtttccctt tcttctttag cgacttgatg ctcttgatct tccaatacgc aacctaaagt 360 aaaatgcccc acagcgctga gtgcatataa tgcattctct agtgaaaaac cttgttggca 420 taaaaaggct aattgatttt cgagagtttc atactgtttt tctgtaggcc gtgtacctaa 480 atgtactttt gctccatcgc gatgacttag taaagcacat ctaaaacttt tagcgttatt 540 acgtaaaaaa tcttgccagc tttccccttc taaagggcaa aagtgagtat ggtgcctatc 600 taacatctca atggctaagg cgtcgagcaa agcccgctta ttttttacat gccaatacaa 660 tgtaggctgc tctacaccta gcttctgggc gagtttacgg gttgttaaac cttcgattcc 720 gacctcatta agcagctcta atgcgctgtt aatcacttta cttttatcta atctagacat 780 attcgtttaa tatcataaat aatttatttt attttaaaat gcgcgggtgc aaaggtaaga 840 ggttttattt taactaccaa atgttttcgg aagttttttc gcttttcttt ttctatcgtt 900 tctcagactc tcttagcgaa agggaaagaa ggtaaagaag aaaaacaaaa cgccttttct 960 tttttgcacc cgctttccaa gagaagaaag ccttgttaaa ttgacttagt gtaaaagcgc 1020 agtactgctt gaccataaga acaaaaaaat ctctatcact gatagggata aagtttggaa 1080 gataaagcta aaagttctta tctttgcagt ctccctatca gtgatagaga cgaaataaag 1140 acatataaaa gaaaagacac catggataag aaatactcaa taggcttaga tatcggcaca 1200 aatagcgtcg gatgggcggt gatcactgat gaatataagg ttccgtctaa aaagttcaag 1260 gttctgggaa atacagaccg ccacagtatc aaaaaaaatc ttataggggc tcttttattt 1320 gacagtggag agacagcgga agcgactcgt ctcaaacgga cagctcgtag aaggtataca 1380 cgtcggaaga atcgtatttg ttatctacag gagatttttt caaatgagat ggcgaaagta 1440 gatgatagtt tctttcatcg acttgaagag tcttttttgg tggaagaaga caagaagcat 1500 gaacgtcatc ctatttttgg aaatatagta gatgaagttg cttatcatga gaaatatcca 1560 actatctatc atctgcgaaa aaaattggta gattctactg ataaagcgga tttgcgctta 1620 atctatttgg ccttagcgca tatgattaag tttcgtggtc attttttgat tgagggagat 1680 ttaaatcctg ataatagtga tgtggacaaa ctatttatcc agttggtaca aacctacaat 1740 caattatttg aagaaaaccc tattaacgca agtggagtag atgctaaagc gattctttct 1800 gcacgattga gtaaatcaag acgattagaa aatctcattg ctcagctccc cggtgagaag 1860 aaaaatggct tatttgggaa tctcattgct ttgtcattgg gtttgacccc taattttaaa 1920 tcaaattttg atttggcaga agatgctaaa ttacagcttt caaaagatac ttacgatgat 1980 gatttagata atttattggc gcaaattgga gatcaatatg ctgatttgtt tttggcagct 2040 aagaatttat cagatgctat tttactttca gatatcctaa gagtaaatac tgaaataact 2100 aaggctcccc tatcagcttc aatgattaaa cgctacgatg aacatcatca agacttgact 2160 cttttaaaag ctttagttcg acaacaactt ccagaaaagt ataaagaaat cttttttgat 2220 caatcaaaaa acggatatgc aggttatatt gatgggggag ctagccaaga agaattttat 2280 aaatttatca aaccaatttt agaaaaaatg gatggtactg aggaattatt ggtgaaacta 2340 aatcgtgaag atttgctgcg caagcaacgg acctttgaca acggctctat tccccatcaa 2400 attcacttgg gtgagctgca tgctattttg agaagacaag aagactttta tccattttta 2460 aaagacaatc gtgagaagat tgaaaaaatc ttgacttttc gaattcctta ttatgttggt 2520 ccattggcgc gtggcaatag tcgttttgca tggatgactc ggaagtctga agaaacaatt 2580 accccatgga attttgaaga agttgtcgat aaaggtgctt cagctcaatc atttattgaa 2640 cgcatgacaa actttgataa aaatcttcca aatgaaaaag tactaccaaa acatagtttg 2700 ctttatgagt attttacggt ttataacgaa ttgacaaagg tcaaatatgt tactgaagga 2760 atgcgaaaac cagcatttct ttcaggtgaa cagaagaaag ccattgttga tttactcttc 2820 aaaacaaatc gaaaagtaac cgttaagcaa ttaaaagaag attatttcaa aaaaatagaa 2880 tgttttgata gtgttgaaat ttcaggagtt gaagatagat ttaatgcttc attaggtacc 2940 taccatgatt tgctaaaaat tattaaagat aaagattttt tggataatga agaaaatgaa 3000 gatatcttag aggatattgt tttaacattg accttatttg aagataggga gatgattgag 3060 gaaagactta aaacatatgc tcacctcttt gatgataagg tgatgaaaca gcttaaacgt 3120 cgccgttata ctggttgggg acgtttgtct cgaaaattga ttaatggtat tagggataag 3180 caatctggca aaacaatatt agattttttg aaatcagatg gttttgccaa tcgcaatttt 3240 atgcagctga tccatgatga tagtttgaca tttaaagaag acattcaaaa agcacaagtg 3300 tctggacaag gcgatagttt acatgaacat attgcaaatt tagctggtag ccctgctatt 3360 aaaaaaggta ttttacagac tgtaaaagtt gttgatgaat tggtcaaagt aatggggcgg 3420 cataagccag aaaatatcgt tattgaaatg gcacgtgaaa atcagacaac tcaaaagggc 3480 cagaaaaatt cgcgagagcg tatgaaacga atcgaagaag gtatcaaaga attaggaagt 3540 cagattctta aagagcatcc tgttgaaaat actcaattgc aaaatgaaaa gctctatctc 3600 tattatctcc aaaatggaag agacatgtat gtggaccaag aattagatat taatcgttta 3660 agtgattatg atgtcgatca cattgttcca caaagtttcc ttaaagacga ttcaatagac 3720 aataaggtct taacgcgttc tgataaaaat cgtggtaaat cggataacgt tccaagtgaa 3780 gaagtagtca aaaagatgaa aaactattgg agacaacttc taaacgccaa gttaatcact 3840 caacgtaagt ttgataattt aacgaaagct gaacgtggag gtttgagtga acttgataaa 3900 gctggtttta tcaaacgcca attggttgaa actcgccaaa tcactaagca tgtggcacaa 3960 attttggata gtcgcatgaa tactaaatac gatgaaaatg ataaacttat tcgagaggtt 4020 aaagtgatta ccttaaaatc taaattagtt tctgacttcc gaaaagattt ccaattctat 4080 aaagtacgtg agattaacaa ttaccatcat gcccatgatg cgtatctaaa tgccgtcgtt 4140 ggaactgctt tgattaagaa atatccaaaa cttgaatcgg agtttgtcta tggtgattat 4200 aaagtttatg atgttcgtaa aatgattgct aagtctgagc aagaaatagg caaagcaacc 4260 gcaaaatatt tcttttactc taatatcatg aacttcttca aaacagaaat tacacttgca 4320 aatggagaga ttcgcaaacg ccctctaatc gaaactaatg gggaaactgg agaaattgtc 4380 tgggataaag ggcgagattt tgccacagtg cgcaaagtat tgtccatgcc ccaagtcaat 4440 attgtcaaga aaacagaagt acagacaggc ggattctcca aggagtcaat tttaccaaaa 4500 agaaattcgg acaagcttat tgctcgtaaa aaagactggg atccaaaaaa atatggtggt 4560 tttgatagtc caacggtagc ttattcagtc ctagtggttg ctaaggtgga aaaagggaaa 4620 tcgaagaagt taaaatccgt taaagagtta ctagggatca caattatgga aagaagttcc 4680 tttgaaaaaa atccgattga ctttttagaa gctaaaggat ataaggaagt taaaaaagac 4740 ttaatcatta aactacctaa atatagtctt tttgagttag aaaacggtcg taaacggatg 4800 ctggctagtg ccggagaatt acaaaaagga aatgagctgg ctctgccaag caaatatgtg 4860 aattttttat atttagctag tcattatgaa aagttgaagg gtagtccaga agataacgaa 4920 caaaaacaat tgtttgtgga gcagcataag cattatttag atgagattat tgagcaaatc 4980 agtgaatttt ctaagcgtgt tattttagca gatgccaatt tagataaagt tcttagtgca 5040 tataacaaac atagagacaa accaatacgt gaacaagcag aaaatattat tcatttattt 5100 acgttgacga atcttggagc tcccgctgct tttaaatatt ttgatacaac aattgatcgt 5160 aaacgatata cgtctacaaa agaagtttta gatgccactc ttatccatca atccatcact 5220 ggtctttatg aaacacgcat tgatttgagt cagctaggag gtgactgaat taatgcggct 5280 gcaatttttt tgggcggggc cgcccaaaaa aatcctagca ccctgcagca gtactgcttg 5340 accataagaa caaaaaaact tccgataaag tttggaagat aaagctaaaa gttcttatct 5400 ttgcagttga tggagaggtg caagtaggtt ttagagctag aaatagcaag ttaaaataag 5460 gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt gagatctgtc 5520 gactctagag gatccccggg taccgagctc gaattcactg gccgtcgttt tacaacgtcg 5580 tgactgggaa aaccctggcg ttacccaact taatcgtact tgtgcctgtt ctatttccga 5640 accgaccgct tgtatgaatc catcaaaatt cgttttctct atgttggatt ccttgttgct 5700 catattgtga tgataatttc tacaaatata gtcattggta actatctatg aaactgtttg 5760 atacttttat agttgattaa acttgttcat ggcatttgcc ttaatatcat ccgctatgtc 5820 aatgtagggt ttcatagctt tgtagtcgct gtgtcccgtc catttcatga ccacctgtgc 5880 cgggattccg agagccagcg cattgcagat gaatgtcctt cttcctgcat gggtactgag 5940 caaagcgtat ttgggtgtga cttcatcaat acgttcattt cccttgtagt aggtttcccg 6000 tacaggctcg ttgatttctg ccagttcgcc cagctctttc aggtaatcgt tcatcttctg 6060 gttgctgatg acgggcagag ccatgtaatt ctcgaaatgg atgtccttgt atttgtccag 6120 tatggctttg ctgtatttgt tcagttcaat cgtcaggctg tcggcagtct tgactgtggt 6180 tatttcgatg tggtcggact tcacatcgct tcttttcaga ttgcgaacat ccgaataccg 6240 caaactcgta aagcagcaga acaggaaaac atcacgcaca cgttccaggt attgcttatc 6300 cttgggtatc tggtagtctt tcagcttgtt cagttcatcc caagtcagga agattacttt 6360 tttcgaggtg gttttcagtt tcggtttgaa cgtatcgtat gcaatgttct gatgatgtcc 6420 tttcttgaag ctccagcgca ggaaccattt gaggaatccc atttgcttgc cgatggtgct 6480 gtttctcata tccttggtgt cacgcaggaa gttgacgtat tcgttcaatc caaactcgtt 6540 gaaatagttg aacgttgcat cctccttgaa ctctttgagg tggttcctca ctgctgcaaa 6600 tttttcatag gtggatgccg tccagttatt ctggttaccg cactctttta caaactcatc 6660 gaacacctcc caaaagctga caggggcttc ttccggctgt tcttcgctgg tgtctttcat 6720 tctcatgttg aaagcttcct tcaactgttg ggtcgttggc atgacctcct gcacctcaaa 6780 ttccttgaaa atattctgga tttcggcata gtatttcagc aagtccgtat tgatttcggc 6840 tgcactttgc tttagcttgt tggtacatcc gctctttacc cgctgcttat ctgcatccca 6900 tttggctacg tcaatccggt agcccgttgt aaactcgatg cgttggctgg caaagatgac 6960 acgcatacgg atgggtacgt tctctacgat tggcacaccg ttctttttcc ggctctccaa 7020 tgcaaaaatg atgttgcgct tgatattcat aattgggtgc gtttgaaatt ctacacccaa 7080 atatacaccc aattattgag atagcaaaag acatttagaa acatttactt ttactctata 7140 ttgtaattta cacttgatta tcagtcgttt gcagtcttat gatattctgt gaaagtataa 7200 gttcgagagc ctgtctctcc gcaaaaaacg ctgaaaatca gcagattgca aaacaaacac 7260 cctgttttac acccaagaat gtaaagtcgg ctgtttttgt tttatttaag ataatacaac 7320 cactacataa taaaagagta gcgatattaa aagaatccga tgagaaaaga ctaatattta 7380 tctatccatt cagtttgatt tttcaggact ttacatcgtc ctgaaagtat ttgttggtac 7440 cggtaccgag gacgcgtaaa catttacagt tgcatgtggc ctattgtttt taagatttta 7500 ctgaagtttg cattaataaa gaatatacta cagctgatat atgcgcaaca tattgtgacg 7560 cttgtgattt atttcccttg aaatccttaa caaataccgc taaggtataa ctgatattat 7620 taggcagaca tatataggca acatcattgt gagctgcaag aacaccattt tcattaacat 7680 aacctgaacc tgtcttatgc gctataacaa ccccttcttt atcaagaagt ggagctgcta 7740 tcctatctac acctgttttg cattctttta acgtattctt aatgaaactt tgtttctcat 7800 catcgataag accttcagta aacaaacgat tcatcaacat tgcagcacca agaggagatg 7860 tatagttaga gtaagccttg ttatggtcag ccgacatttc ctcttccgta taagctatct 7920 gaaaacttga acgaggaatg agtgtggcta taaaactatc tgtttgagcg acattaacca 7980 tatccttaaa cataaggttg cttgcattgt tgtcactctg agtaagagta taacgcagca 8040 aatctctcac tgtcaatgat atgactggcc ctgaataatc tttcagcata ggactccaag 8100 tctttgggtc aagtttatcc ctatttatat ttactaaggt atcaagtgaa attcctttat 8160 tgtcaaagtc attacaaaga gctaatgcct gatgaacctt aaacacactc atcataggat 8220 aaacactctt attattgacc ttaaccgtat ctctgttatt aacaataacc gccacaccaa 8280 tttcgccagg acaagctgag acaatttgag aaatgctatc agtcaaaaca tttgttaaag 8340 gaggatttgc gctatctttt gtcgctgatt tatggaacaa tgaaaatacc aagatgaaaa 8400 tgcaaactaa agctatactc aaaactacga tttgtttttt tctgtttttt tccattataa 8460 cctctcctta atttattgca tctcttttcg aatatttatg ttttttgaga aaagaacgta 8520 ctcatggttc atcccgatat gcgtatcggt ctgtatatca gcaactttct atgtgtttca 8580 actacaatag tcatctattc tcatctttct gagtccaccc cctgcaaagc ccctctttac 8640 gacataaaaa ttcggtcgga aaaggtatgc aaaagatgtt tctctcttta agagaaactc 8700 ttcgggatgc aaaaatatga aaataactcc aattcaccaa attatatagc gactttttta 8760 caaaatgcta aaatttgttg atttccgtca agcaattgtt gagcaaaaat gtcttttacg 8820 ataaaatgat acctcaatat caactgttta gcaaaacgat atttctctta aagagagaaa 8880 cacctttttg ttcaccaatc cccgactttt aatcccgcgg ccatgattga aaaaggaaga 8940 gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 9000 ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 9060 cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 9120 ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 9180 cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 9240 tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 9300 tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 9360 tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 9420 ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 9480 tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 9540 cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 9600 gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 9660 ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 9720 acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 9780 cctcactgat taagcattgg taactgtcag accaagttta ctcataacgc gtcaattcga 9840 gggggatcaa ttccgtgata ggtgggctgc ccttcctggt tggcttggtt tcatcagcca 9900 tccgcttgcc ctcatctgtt acgccggcgg tagccggcca gcctcgcaga gcaggattcc 9960 cgttgagcac cgccaggtgc gaataaggga cagtgaagaa ggaacacccg ctcgcgggtg 10020 ggcctacttc acctatcctg cccggctgac gccgttggat acaccaagga aagtctacac 10080 gaaccctttg gcaaaatcct gtatatcgtg cgaaaaagga tggatatacc gaaaaaatcg 10140 ctataatgac cccgaagcag ggttatgcag cggaaaacgg aattgatccg gccacgatgc 10200 gtccggcgta gaggatctga agatcagcag ttcaacctgt tgatagtacg tactaagctc 10260 tcatgtttca cgtactaagc tctcatgttt aacgtactaa gctctcatgt ttaacgaact 10320 aaaccctcat ggctaacgta ctaagctctc atggctaacg tactaagctc tcatgtttca 10380 cgtactaagc tctcatgttt gaacaataaa attaatataa atcagcaact taaatagcct 10440 ctaaggtttt aagttttata agaaaaaaaa gaatatataa ggcttttaaa gcttttaagg 10500 tttaacggtt gtggacaaca agccagggat gtaacgcact gagaagccct tagagcctct 10560 caaagcaatt ttgagtgaca caggaacact taacggctga catgggaatt cccctccacc 10620 gcggtgg 10627 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 11 atacaggaaa ccaatcgtag 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 12 ggaagaatcg aagttatatg 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 13 aatccactgg atgccatccg 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 14 gcttatgtct atctatccgg 20 <210> 15 <211> 64 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 15 aaagttctta tctttgcagt tgatggagag gtgcaagtag gttttagagc tagaaatagc 60 aagt 64 <210> 16 <211> 64 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (26)..(26) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (30)..(30) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (38)..(38) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (47)..(47) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (59)..(59) <223> a, c, t, g, unknown or other <400> 16 aaagttctta tctttgcagt tgatgnagan gcggtacnaa gttttanagc tagaaatanc 60 aagt 64 <210> 17 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 17 aagctaaaag ttcttatctt tgcagttgat ggagaggtgc aagtaggttt tagagctaga 60 aatagcaag 69 <210> 18 <211> 76 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 18 tgaaaaccgt tgtactgcga ggtacccggg gttcgaatcc ctgtctctcc gcaaaaaacg 60 ctgaaaatca gcagat 76 <210> 19 <211> 76 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 19 atctgctgat tttcagcgtt ttttgcggag agacagggat tcgaaccccg ggtacctcgc 60 agtacaacgg ttttca 76 <210> 20 <211> 74 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 20 tgaaaaccgt tgtactgcga ggtacccggg gttcgaatcc ctgtctctcc gcaaaaaacg 60 ctgaaaatca gcag 74 <210> 21 <211> 74 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 21 ctgctgattt tcagcgtttt ttgcggagag acagggattc gaaccccggg tacctcgcag 60 tacaacggtt ttca 74 <210> 22 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 22 aaccgttgta ctgcgaggta cccggggttc gaatccctgt ctctccgcaa aaaacgctga 60 aaatcagcag at 72 <210> 23 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 23 atctgctgat tttcagcgtt ttttgcggag agacagggat tcgaaccccg ggtacctcgc 60 agtacaacgg tt 72 <210> 24 <211> 68 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 24 gttgtactgc gaggtacccg gggttcgaat ccctgtctct ccgcaaaaaa cgctgaaaat 60 cagcagat 68 <210> 25 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 25 tctgtgaaag tataagttcg agagcctgtc tctccgctga acgtgctgga cagaaatggt 60 cag 63 <210> 26 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 26 ctgaccattt ctgtccagca cgttcagcgg agagacaggc tctcgaactt atactttcac 60 aga 63 <210> 27 <211> 46 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 27 tctgtgaaag tataagttcg agagcctgtc tctcagaaat ggtcag 46 <210> 28 <211> 46 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 28 ctgaccattt ctgagagaca ggctctcgaa cttatacttt cacaga 46 <210> 29 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 29 tctgtgaaag tataagctct ccgctgaacg tgctggacag aaatggtcag 50 <210> 30 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 30 ctgaccattt ctgtccagca cgttcagcgg agagcttata ctttcacaga 50 <210> 31 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 31 tctgtgaaag tataagttcg agtccgctga acgtgctgga cagaaatggt cag 53 <210> 32 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 32 ctgaccattt ctgtccagca cgttcagcgg actcgaactt atactttcac aga 53 <210> 33 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 33 tctgtgaaag tataagctcc gctgaacgtg ctggacagaa atggtcag 48 <210> 34 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 34 ctgaccattt ctgtccagca cgttcagcgg agcttatact ttcacaga 48 <210> 35 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 35 tctgtgaaag gagcctgtct ctccgctgaa cgtgctggac agaaatggtc ag 52 <210> 36 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 36 ctgaccattt ctgtccagca cgttcagcgg agagacaggc tcctttcaca ga 52 <210> 37 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 37 tctgtgaaag tataagttcg agagcctgtc tctccgctga acgtgctgga cagaaatg 58 <210> 38 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 38 catttctgtc cagcacgttc agcggagaga caggctctcg aacttatact ttcacaga 58

Claims (28)

  1. 박테리아성 또는 고세균류의 종의 염색체와 연합된 공작된 RNA-유도된 뉴클레아제 시스템을 포하하는 단백질-핵산 복합체에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 해당 미생물 염색체에 있는 부위로 표적화되며, 이 미생물의 염색체는 서열 식별 번호:1과 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 HU 패밀리 DNA-결합 단백질을 인코딩하는, 단백질-핵산 복합체.
  2. 청구항 1에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 유형 I CRISPR 시스템, 유형 II CRISPR 시스템, 유형 III CRISPR 시스템, 유형 IV CRISPR 시스템, 유형 V CRISPR 시스템, 또는 유형 VI CRISPR 시스템에서 선택된, 단백질-핵산 복합체.
  3. 청구항 2에 있어서, 이때 CRISPR 시스템은 CRISPR 뉴클레아제 및 가이드 RNA를 포함하는, 단백질-핵산 복합체.
  4. 청구항 3에 있어서, 이때 CRISPR 뉴클레아제는 Cas9, Cas12, Cas13, 또는 CasX인, 단백질-핵산 복합체.
  5. 청구항 1 ~ 4중 임의의 한 항에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 상기 공작된 RNA-유도된 뉴클레아제 시스템을 인코드하는 핵산으로부터 발현되며, 박테리아 또는 고세균류의 염색체로 통합되는, 단백질-핵산 복합체.
  6. 청구항 1 ~ 4중 임의의 한 항에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 상기 공작된 RNA-유도된 뉴클레아제 시스템을 인코드하는 핵산으로부터 발현되며, 염색체외 벡터 상에 담겨있는, 단백질-핵산 복합체.
  7. 청구항 1 ~ 6중 임의의 한 항에 있어서, 이때 상기 원핵생물 염색체는 박테로이드(Bacteroides) 종 안에 있는, 단백질-핵산 복합체.
  8. 청구항 7에 있어서, 이때 상기 박테로이드(Bacteroides) 종은 B. 테타이오타오미크론(B. thetaiotaomicron), B. 불가투스(B. vulgatus), B. 셀룰로실리티쿠스(B. cellulosilyticus), B. 프라실리스(b. fragilis), B. 헬코게네스(helcogenes), B. 오바투스(B. ovatus), B. 살라니트로니스(B. salanitronis), B. 우리포르미스(B. uniformis), 또는 B. 실라니솔벤스(B. xylanisolvens)에서 선택되는, 단백질-핵산 복합체.
  9. 원핵생물의 혼합 집단에서 표적이 되는 원핵 생물의 성장을 느리게 하는 방법에 있어서, 상기 방법은 표적이 되는 원핵생물에서 공작된 RNA-유도된 뉴클레아제 시스템을 발현시키는 것을 포함하며, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 상기 표적 원핵생물의 염색체에 있는 부위로 표적화되어, 적어도 하나의 이중 가닥으로 된 파괴가 이 표적이 되는 원핵생물의 염색체에 도입되고, 이로 인하여, 해당되는 표적 원핵생물의 성장이 느리게 되는, 방법.
  10. 청구항 9에 있어서, 이때 상기 표적 원핵생물 성장의 지체로 인하여 해당 원핵생물의 혼합 집단에서 표적이 되는 원핵생물의 수준이 감소되거나, 또는 제거되는, 방법.
  11. 청구항 9 또는 10에 있어서, 이때 RNA-유도된 뉴클레아제 시스템의 발현은 유도성인, 방법.
  12. 청구항 9 ~ 11중 임의의 한 항에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 유형 I CRISPR 시스템, 유형 II CRISPR 시스템, 유형 III CRISPR 시스템, 유형 IV CRISPR 시스템, 유형 V CRISPR 시스템, 또는 유형 VI CRISPR 시스템에서 선택된 CRISPR 시스템인, 방법.
  13. 청구항 12에 있어서, 이때 CRISPR 시스템은 CRISPR 뉴클레아제 및 가이드 RNA를 포함하는, 방법.
  14. 청구항 13에 있어서, 이때 CRISPR 뉴클레아제는 Cas9, Cas12, Cas13, 또는 CasX 뉴클레아제인, 방법.
  15. 청구항 13에 있어서, 이때 CRISPR 뉴클레아제 및 가이드 RNA는 상기 표적 원핵생물의 염색체로 통합된 적어도 하나의 핵산으로부터 발현되는, 방법.
  16. 청구항 13에 있어서, 이때 CRISPR 뉴클레아제 and 가이드 RNA는 염색체외 벡터에서 운반하는 적어도 하나의 핵산으로부터 발현되는, 방법.
  17. 청구항 15 또는 16에 있어서, 이때 CRISPR 뉴클레아제를 인코딩하는 핵산은 유도성 프로모터에 작동가능하도록 연계된, 방법.
  18. 청구항 17에 있어서, 이때 발현 단계는 상기 원핵생물의 혼합 집단에 프로모터 유도성 화학물질을 접촉시키는 것을 포함하는, 방법.
  19. 청구항 9 ~ 18중 임의의 한 항에 있어서, 이때 상기 원핵생물의 혼합 집단은 세포 배양물 안에 있는, 방법.
  20. 청구항 9 ~ 18중 임의의 한 항에 있어서, 이때 상기 원핵생물의 혼합 집단은 포유류의 소화 기관 안에 있는, 방법.
  21. 청구항 20에 있어서, 이때 상기 공작된 RNA-유도된 뉴클레아제 시스템은 공작된 CRISPR 뉴클레아제 시스템이며, 상기 공작된 CRISPR 뉴클레아제 시스템을 인코딩하는 적어도 하나의 핵산은 상기 표적이 되는 원핵생물로 도입되며, CRISPR 뉴클레아제를 인코딩하는 핵산은 유도성 프로모터에 작동가능하도록 연계되며, 그리고 발현 단계는 프로모터 유도성 화학물질을 상기 포유류에 투여하는 것을 포함하는, 방법.
  22. 청구항 21에 있어서, 이때 상기 투여는 상기 프로모터 유도성 화학물질의 경구 투여를 포함하는, 방법.
  23. 청구항 18, 21, 또는 22중 임의의 한 항에 있어서, 이때 상기 프로모터 유도성 화학물질은 안하이드테트라사이클린인, 방법.
  24. 청구항 20 ~ 23중 임의의 한 항에 있어서, 이때 상기 포유류는 인간인, 방법.
  25. 청구항 24에 있어서, 이때 상기 인간은 암 치료를 받고 있으며, 이 인간의 위장관에서 원핵생물의 혼합 집단으로부터 표적이 되는 원핵 생물의 감소 또는 제거로 인하여 암 치료에 대한 해당 인간의 반응이 개선되는, 방법.
  26. 청구항 25에 있어서, 이때 암 치료는 면역요법을 포함하는, 방법.
  27. 청구항 9 ~ 26중 임의의 한 항에 있어서, 이때 상기 표적 원핵생물은 박테로이드(Bacteroides) 종인, 방법.
  28. 청구항 27에 있어서, 이때 상기 박테로이드(Bacteroides) 종은 B. 테타이오타오미크론(B. thetaiotaomicron), B. 불가투스(B. vulgatus), B. 셀룰로실리티쿠스(B. cellulosilyticus), B. 프라실리스(b. fragilis), B. 헬코게네스(helcogenes), B. 오바투스(B. ovatus), B. 살라니트로니스(B. salanitronis), B. 우리포르미스(B. uniformis), 또는 B. 실라니솔벤스(B. xylanisolvens)에서 선택되는, 방법.
KR1020227010378A 2019-09-30 2020-09-29 표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조 KR20220051259A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962908130P 2019-09-30 2019-09-30
US62/908,130 2019-09-30
US201962909078P 2019-10-01 2019-10-01
US62/909,078 2019-10-01
US202063052825P 2020-07-16 2020-07-16
US63/052,825 2020-07-16
PCT/US2020/053304 WO2021067291A1 (en) 2019-09-30 2020-09-29 Modulation of microbiota compositions using targeted nucleases

Publications (1)

Publication Number Publication Date
KR20220051259A true KR20220051259A (ko) 2022-04-26

Family

ID=72896108

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227010378A KR20220051259A (ko) 2019-09-30 2020-09-29 표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조

Country Status (10)

Country Link
US (1) US20210095273A1 (ko)
EP (1) EP4038185A1 (ko)
JP (1) JP2022549519A (ko)
KR (1) KR20220051259A (ko)
CN (1) CN114929873A (ko)
AU (1) AU2020357816A1 (ko)
BR (1) BR112022005831A2 (ko)
CA (1) CA3152931A1 (ko)
IL (1) IL291509A (ko)
WO (1) WO2021067291A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220116512A (ko) * 2019-12-17 2022-08-23 시그마-알드리치 컴퍼니., 엘엘씨 박테로이데스의 게놈편집
CN116004688A (zh) * 2021-10-21 2023-04-25 中国科学院深圳先进技术研究院 肠道菌拟杆菌的基因编辑方法与应用
WO2023107464A2 (en) * 2021-12-07 2023-06-15 Cornell University Methods and compositions for genetically modifying human gut microbes

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002077183A2 (en) * 2001-03-21 2002-10-03 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
US10329587B2 (en) * 2013-07-10 2019-06-25 President And Fellows Of Harvard College Orthogonal Cas9 proteins for RNA-guided gene regulation and editing
CA2943775A1 (en) * 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
EP4233546A3 (en) * 2015-05-06 2023-09-27 SNIPR Technologies Limited Altering microbial populations & modifying microbiota
US11591604B2 (en) * 2015-06-10 2023-02-28 Massachusetts Institute Of Technology Gene expression in Bacteroides

Also Published As

Publication number Publication date
AU2020357816A1 (en) 2022-04-14
WO2021067291A1 (en) 2021-04-08
CA3152931A1 (en) 2021-04-08
JP2022549519A (ja) 2022-11-25
IL291509A (en) 2022-05-01
BR112022005831A2 (pt) 2022-06-21
US20210095273A1 (en) 2021-04-01
CN114929873A (zh) 2022-08-19
EP4038185A1 (en) 2022-08-10

Similar Documents

Publication Publication Date Title
KR20220051259A (ko) 표적화된 뉴클레아제를 이용하여 미생물총 조성물의 변조
CA3110998A1 (en) Rna and dna base editing via engneered adar recruitment
Monk et al. Directed evolution and targeted mutagenesis to murinize Listeria monocytogenes internalin A for enhanced infectivity in the murine oral infection model
CA3128876A1 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20200109395A1 (en) Genetic systems that defend against foreign dna and uses thereof
US20220056457A1 (en) Cis conjugative plasmid system
KR20230069157A (ko) GJB2를 코딩하는 재조합 아데노 연관 바이러스 (rAAV) 및 그의 용도
KR20140002463A (ko) 디포신 및 그의 사용 방법
US20210180071A1 (en) Genome editing in bacteroides
Li et al. PA5001 gene involves in swimming motility and biofilm formation in Pseudomonas aeruginosa
US20220119809A1 (en) CRISPR-cas9 SYSTEM AND USES THEREOF
Jing et al. The small and large subunits of carbamoyl-phosphate synthase exhibit diverse contributions to pathogenicity in Xanthomonas citri subsp. citri
AU2007285462A1 (en) Identification of genes implicated in the virulence of streptococcus
ES2699479T3 (es) Microorganismos recombinantes y sus métodos de uso
US20230313231A1 (en) Rna and dna base editing via engineered adar
US20210386915A1 (en) Compositions and methods for airway tissue regeneration
US20210093679A1 (en) Engineered gut microbes and uses thereof
CN111394294B (zh) 布鲁氏菌A19 bvfA基因缺失株及其构建和应用
Černý et al. Development of a rapid method for site-directed mutagenesis in Streptococcus zooepidemicus
Disha et al. Factors and Conditions That Impact Electroporation of Clostridioides difficile Strains
KR20150098058A (ko) 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물
KR20150127266A (ko) 디포신류 및 이들의 사용 방법
CN116286925A (zh) 一种逆转菌体耐药的通用型抗菌药物及其应用
CN103305476B (zh) 肠道病毒71型的活体成像示踪***及其应用
CN116997657A (zh) 编码GJB2的重组腺相关病毒(rAAV)及其用途

Legal Events

Date Code Title Description
A201 Request for examination