CN107208070A - 细菌基因的靶向消除 - Google Patents

细菌基因的靶向消除 Download PDF

Info

Publication number
CN107208070A
CN107208070A CN201580074405.2A CN201580074405A CN107208070A CN 107208070 A CN107208070 A CN 107208070A CN 201580074405 A CN201580074405 A CN 201580074405A CN 107208070 A CN107208070 A CN 107208070A
Authority
CN
China
Prior art keywords
gene
crispr
bacterium
bacteriophage
cas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580074405.2A
Other languages
English (en)
Other versions
CN107208070B (zh
Inventor
埃胡德·齐姆容
伊多·约瑟夫
米丽亚姆·马诺尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ramot at Tel Aviv University Ltd
Technology Innovation Momentum Fund Israel LP
Original Assignee
Technology Innovation Momentum Fund Israel LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology Innovation Momentum Fund Israel LP filed Critical Technology Innovation Momentum Fund Israel LP
Publication of CN107208070A publication Critical patent/CN107208070A/zh
Application granted granted Critical
Publication of CN107208070B publication Critical patent/CN107208070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10041Use of virus, viral particle or viral elements as a vector
    • C12N2795/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10111Myoviridae
    • C12N2795/10141Use of virus, viral particle or viral elements as a vector
    • C12N2795/10143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明涉及包括两种元件或组分的试剂盒或***。第一组分(i)是选择组分,所述选择组分包含含有至少一个原始间隔区的核酸序列。第二组分(ii)包含至少一个敏化组分,所述至少一个敏化组分包含至少一个cas基因和至少一个CRISPR阵列。应注意的是,CRISPR的至少一个间隔区靶向包含于细菌的致病性基因内的原始间隔区,以特异性地灭活所述细菌中的所述致病性基因,并且其中所述CRISPR的至少一个间隔区靶向包含于(i)的所述选择组分内的原始间隔物区,以特异性地灭活所述选择组分。本发明还提供了使用本发明的组分或试剂盒来干扰致病性基因在细菌之间的水平转移(horizontal transfer)并且来防止哺乳动物受试者中的由细菌感染引起的病理状况的方法。

Description

细菌基因的靶向消除
促成本发明的工作已经根据欧盟第七框架计划(European Union's SeventhFramework Programme)(EP7/2007-2013)/ERC拨款协议第336079号从欧洲研究委员会(European Research Council)获得资助。
发明领域
本发明涉及用于细菌基因的特异性靶向消除的方法。更具体地,本发明提供了使用工程化RNA指导的核酸酶(RNA guided nucleases,RGN)***来靶向并消除细菌致病性基因的试剂盒、***、组合物和方法。
背景参考文献
1.Lu TK &Collins JJ(2009)Proc Natl Acad Sci U S A 106(12):4629-4634.
2.Merril CR,等(2003)Nat Rev Drug Discov 2(6):489-497.
3.Qimron U,等(2006)Proc Natl Acad Sci USA 103(50):19039-19044.4
4.Lang LH(2006)Gastroenterology 131(5):1370.
5.Abuladze T,等(2008).Appl Environ Microbiol 74(20):6230-6238.
6.Hagens和Blassi(2003)Lett Appl Microbiol.;37(4):318-23.
7.Qimron U,等(2014)美国专利第8,865,158号.
8.Gomaa AA等(2014)MBio 5(1):e00928-00913.
9.Garneau JE等(2010)Nature 468(7320):67-71.
10.Citorik RJ等(2014)Nat.Biotechnol.
11.Bikard D等(2014)Nat Biotechnol.
12.Barrangou等(2007)Science 315(5819):1709-12.
13.Bolotin等(2005)Microbiology 151(Pt 8):2551-61.
14.Marraffini等(2008)Science 322:1843-1845.
15.Yosef I等(2014)Bacteriophage 4(1):e28491.
16.Barrangou R,等(2007)Science 315(5819):1709-1712).
17.Hale CR,等(2009)Cell 139(5):945-956.
18.Pendleton JN,等(2013)Expert Rev Anti Infect Ther 11(3):297-308.
19.Boucher HW,等(2009)Clin Infect Dis 48(1):1-12.
20.Marraffini LA等(2010)Nat Rev Genet 11(3):181-190.
21.Hale CR等(2009)Cell 139(5):945-956.
22.Datsenko KA等(2000)Proc Natl Acad Sci U S A 97(12):6640-6645.
23.Yosef I等(2012)Nucleic Acids Res 40(12):5569-5576.
24.Sharan SK等(2009)Nat Protoc 4(2):206-223.
25.Yu D等(2000)Proc Natl Acad Sci U S A 97(11):5978-5983.
26.Yosef I等(2011)Proc Natl Acad Sci U S A 108(50):20136-20141.
27.Kiro R等(2013)Proc Natl Acad Sci U S A 110(48):19549-19554.
28.Bush K等(2011)Annu Rev Microbiol 65:455-478.
29.Brouns SJ等(2008)Science 321(5891):960-964.
30.Baba T等(2006)Mol Syst Biol 2:1-11.
31.Edgar R和Qimron U(2010)J Bacteriol 192(23):6291-6294.
本文中对上述参考文献的承认不应被推断为意味着它们以任何方式与本文公开的主题的可专利性相关。
发明背景
细菌已经进化以克服广泛范围的抗生素,并且在一些细菌中已经鉴定到针对大多数常规抗生素的耐受性机制。更新的抗生素的加速开发正被细菌耐受性的进度赶超。例如,在美国,超过70%的医院获得性感染涉及对至少一种抗生素耐受的细菌,并且在日本,超过50%的金黄色葡萄球菌(Staphylococcus aureus)的临床分离株是多药耐受的(multidrug-resistant)。
对于人类健康,病原体的抗生素耐受性日益引起关注,导致对噬菌体疗法重新燃起兴趣。这种疗法使用细菌的天然敌人噬菌体来杀死病原体。然而,该治疗目前是不可行的,主要由于递送到组织中的障碍以及细菌对噬菌体的耐受性。对噬菌体疗法的使用的主要关切包括噬菌体被脾/肝以及被免疫***中和、其狭窄的宿主范围、细菌对噬菌体的耐受性以及缺乏在人和动物中的足够的药代动力学和功效研究。
若干研究使用噬菌体作为增加细菌对抗生素的敏感性的遗传工具。一项研究使用革兰氏阴性大肠杆菌(Escherichia coli)的噬菌体M13以在遗传上靶向若干基因网络,从而致使细菌对抗生素更敏感(1)。它证明了通过M13介导的基因靶向破坏SOS应答使细菌对多种抗生素敏感若干倍。它还表明,与抗生素组合的噬菌体介导的基因转移增加了感染致病性大肠杆菌的小鼠的存活。总体而言,该研究显示,通过噬菌体M13转移基因弱化了细菌,并致使细菌更容易被抗生素杀死。最终结果与常规的噬菌体疗法实践非常相似,其中噬菌体被用于直接杀死病原体。
不同的方法将噬菌体用作存在于可食用食品、植物和农场动物上的病原体的“消毒剂”。除了延长这些产品的货架期之外,该处理意图预防疾病的偶尔爆发。但是,该策略的实施必须克服若干障碍。大多数噬菌体感染的一个特征是其狭窄的宿主范围。大多数噬菌体仅感染细菌的一个种,而一些噬菌体限于种内的某些菌株(2)。一方面,该特征可以是有利的,因为它允许靶向特定病原体而不破坏其他细菌群体(2)。另一方面,该狭窄的宿主范围可能构成显著的缺点,因为未感染的病原体将保持不被处理。扩大噬菌体的宿主范围的一种方式是选择感染新宿主的噬菌体突变体。在很多情况中,选择的适应于新宿主的突变体还保持着其对原始宿主的感染性,并且从而范围被扩展(3)。部分地克服该问题的另一种方式是使用靶向相同细菌物种的扩展范围的噬菌体的混合物。此类方法的成功实例是在各自的产品ListShield、EcoShield和SalmoFresh中使用针对单核细胞增生性李斯特菌(Listeria monocytogenes)、大肠杆菌和肠道沙门氏菌(Salmonella enterica)的噬菌体的混合物,所述产品都由美国食品和药物管理局(FDA)批准(4)。这些噬菌体混合物显示出有效地根除食物和表面上的靶向的病原体(5)。此外,所有这些产品均从美国FDA获得“即食”批准,表明在消费产品上以及在表面上散布噬菌体的安全性(4)。
其他的噬菌体混合物在欧洲已被批准作为食品添加剂,并且很多噬菌体混合物目前正由噬菌体生物技术公司开发。这些应用表明,噬菌体可以分散在环境中并高效地靶向其周围的病原体。
病原体对抗生素的耐受性是快速增长的问题,导致对新型抗微生物剂的迫切需求。不幸的是,新型抗生素的开发面临许多障碍,并且因此将使病原体对批准的抗生素重新敏化的方法具有重要的优势。
Lu和Collins(1)教导了用于弱化细菌以使它们对抗生素更敏感的经遗传修饰的噬菌体。Hagens和Blassi(6)教导了作为杀细菌剂的经遗传修饰的丝状噬菌体。本发明的发明人先前已描述了(7)编码主要的敏感耐受性基因例如30S核糖体亚基蛋白S12、旋转酶(gyrase)、RNA聚合酶β亚基和胸苷酸合成酶以及另外地亚碲酸盐(tellurite)耐受性基因的经遗传修饰的噬菌体,及其在降低细菌的抗生素耐受性中的用途。
成簇的规则间隔的短回文重复(CRISPR)及其相关联的Cas蛋白(CRISPR-Cas)通过提供高效的工具来精确地删除和编辑人类、灵长类、啮齿动物、鱼类、飞虫(fly)、蠕虫(worm)、植物、酵母、细菌细胞和噬菌体的基因组已经彻底改变了分子生物学。CRISPR-Cas***最近也已被用于在表型上修正活的动物中的遗传疾病,并且正在探索其对哺乳动物中的多种治疗方法的效用。尽管如此,只有有限的研究已显示使用CRISPR-Cas***来靶向抗生素耐受性基因或特定的毒性细菌菌株的群体(8、10、11)。
CRISPR是包括被相似大小的非重复序列(称为间隔区)间隔的一组短的重复的遗传***。该***的另外的组分包括CRISPR相关(cas)基因和前导序列。转录的间隔区将Cas蛋白引导至外源核酸内的同源序列,所述转录的间隔区被称为原始间隔区(protospacer),所述同源序列随后被裂解。该***在原核生物中是丰富的,并且计算分析显示在迄今为止测序的~40%的细菌基因组和~90%的古细菌基因组中发现了CRISPR。
CRISPR阵列和cas基因在微生物物种之间变化很大。直接重复序列在物种之间频繁趋异,并且在cas基因中还观察到极端的序列趋异。重复的大小可以在24bp和47bp之间变化,间隔区大小为26-72bp。每阵列的重复数可以从2到目前的记录保持者Verminephrobacter eiseniae变化,Verminephrobacter eiseniae具有249个重复/阵列,并且尽管许多基因组含有单个CRISPR基因座,但是詹氏甲烷球菌(M.jannaschii)具有18个基因座。最后,虽然在一些CRISPR***中,只鉴定出6个或更少cas基因,但其他的CRISPR***涉及多于20个cas基因。尽管存在这种多样性,大多数CRISPR***具有一些保守的特征。
以前已经表明,响应于噬菌体感染,细菌整合源自噬菌体基因组序列的新间隔区,导致CRISPR介导的噬菌体耐受性。新的重复-间隔区单元被添加到阵列的前导-近端,并且必须准确匹配噬菌体序列(100%同一性),以提供完全的耐受性。当此类噬菌体来源的间隔区被人工引入到噬菌体敏感的嗜热链球菌(S.thermophilus)菌株的CRISPR阵列中时,嗜热链球菌变为噬菌体耐受性的(12)。实际上,在天然存在的CRISPR阵列中发现的间隔区经常源自噬菌体和其它染色体外元件(13)。
Marraffini等人2008(14)教导了操作CRISPR阵列用于阻碍抗生素耐受性基因和毒力因子在细菌病原体中的传播。Garneau等人(9)教导了CRISPR阵列裂解编码抗生素耐受性基因的质粒DNA。
最近的两项巧妙的研究表明,噬菌体可转移的CRISPR-Cas***(phage-transferable CRISPR-Cas systems)能够特异性地杀死病原体或使它们对抗生素重新敏化(10、11)。这些研究和另一项研究(8)还显示转移的CRISPR-Cas***能够富集特定的细菌群体。此外,他们表明该***可能针对病原体使用以有效治疗感染的动物。因此,暗示了该***可被用作有效的抗微生物剂。然而,尽管这些研究的结果强调了可转移的CRISPR-Cas***的潜力,但是将该***用作直接的抗微生物剂的概念与遭受多种困难的常规噬菌体疗法相似(15)。人们可能会提出,如果有可能通过噬菌体将特定的DNA递送到病原体内,则通过裂解性噬菌体将会更高效地直接杀死该病原体。此外,在感染的患者中使用提议的***以使病原体对抗生素敏化同时抗生素反向选择这些敏化的病原体将很可能由于抗生素选择的逃逸突变体而失败。
因此,存在对开发高效的抗微生物方法以特异性地靶向细菌耐受性基因并且此外消除抗生素耐受性的水平转移的迫切需求。
发明概述
本发明的第一方面涉及包括两种元件或组分的试剂盒或***。第一组分(i)是选择组分,所述选择组分包含含有至少一个原始间隔区的核酸序列。第二组分(ii)包含至少一种敏化组分,所述敏化组分包含至少一个cas基因和至少一个成簇的、规则间隔的短回文重复(CRISPR)阵列,其中所述CRISPR的至少一个间隔区靶向包含于细菌的致病性基因内的原始间隔区,以特异性地灭活所述细菌中的所述致病性基因,并且其中所述CRISPR的至少一个间隔区靶向包含于(i)的所述选择组分内的原始间隔区,以特异性地灭活所述选择组分。应该注意的是,此类灭活使得被所述温和性噬菌体感染的细菌对选择组分不敏感并且耐受选择组分。
本发明的第二方面涉及干扰致病性基因在细菌之间的水平转移的方法。更具体地,该方法包括使含有携带此类致病性基因的细菌的固体表面与本发明的选择组分和敏化组分中的至少一种或包含其的任何试剂盒,具体地本发明的试剂盒或***的任一种接触的步骤,从而使致病性基因失活并干扰其水平转移。
本发明还提供了使用本发明的选择组分和敏化组分中的至少一种或包含其的任何试剂盒,具体地本文提供的试剂盒或***的任一种来预防哺乳动物受试者中由含有致病性基因的细菌的细菌感染引起的病理状况的方法。
本发明的另一方面涉及包含工程化CRISPR的经遗传修饰的温和性噬菌体。又另外,本发明包括包含本发明的原始间隔区的任何经遗传修饰的裂解性噬菌体,特别地本发明描述的任何裂解性噬菌体。
除非另有定义,否则本文使用的所有技术和/或科学术语具有与由本发明所属技术领域的普通技术人员通常理解的相同的含义。尽管与本文描述的那些方法和材料相似或等价的方法和材料可用于本发明的实施方案的实践或测试,以下描述了示例性方法和/或材料。在冲突的情况下,将以包括定义的专利说明书为准。另外,材料、方法和示例仅是说明性的,并且并不意图是必然限制性的。
附图简述
本文仅以示例的方式参考附图描述本发明的一些实施方案。现在详细地参考具体附图,要强调的是,所示的细节是以示例的方式并且是为了说明性地讨论本发明的实施方案的目的。在该方面,使用附图进行的描述使得可以如何实践本发明的实施方案对于本领域技术人员来说是明显的。
在图中:
图1.溶源性噬菌体的示意图
I-E型的CRISPR相关基因:cas3、cse1、cse2、cas7、cas5和cas6e(深色柱)被***以替换λ染色体的位置19014-27480处的核苷酸(NCBI参考序列:NC_001416.1,SEQ IDNO.36),获得对照溶源性噬菌体λcas(底部)。λcas-CRISPR噬菌体(上部)除了cas基因之外还编码CRISPR阵列,所述CRISPR阵列具有靶向基因ndm-1(N1、N2、N3,如分别由SEQ ID NO.37、38、39所示的)和ctx-M-15(C1、C2、C3,如分别由SEQ ID NO.40、41、42所示的)的间隔区。PT7,T7启动子。
图2A-2D.与携带耐受性质粒的细菌相比,溶源性细菌的竞争性适应。
图2A显示了以1:1比率混合的编码λcas-CRISPR前噬菌体和pVec质粒的细菌的培养物。
图2B显示了以1:1比率混合的编码λcas-CRISPR前噬菌体和pCTX质粒的细菌的培养物。
图2C显示了以1:1比率混合的编码λcas-CRISPR前噬菌体和pNDM质粒的细菌的培养物。
图2D显示了以1:1比率混合的编码λcas-CRISPR前噬菌体和pNDM*+pCTX质粒的细菌的培养物。
将来自A图、B图、C图和D图的细菌在32℃在LB中一起培养14h。然后将细胞在LB中1/800稀释,并在32℃生长另外14h。在指示的时间点收取来自混合培养物的样品并涂布到卡那霉素或链霉素或链霉素+庆大霉素琼脂板上,以区分溶源性细菌(卡那霉素r)和携带质粒的细菌(对于A图、B图、C图,链霉素r,或者对于D图,链霉素r+庆大霉素r)。然后通过计算总耐受性CFU中每种类型的耐受性CFU的数目来确定每种菌株的CFU比率。
图3.溶源化对抗生素耐受性质粒的转化的影响
用λcas(浅灰色柱)或λcas-CRISPR(深灰色柱)使大肠杆菌K-12溶源化。用对照(pVEC)、编码ndm-1(pNDM)或ctx-M-15(pCTX)的质粒转化这些溶源性细菌并将其涂布到用链霉素补充的琼脂板上。柱表示在三次独立的实验中,涂布培养物的系列稀释物后计数的每ml菌落形成单位(CFU)数的平均值和标准偏差。
图4.抗生素耐受性细菌通过溶源化作用的敏化
用λcas(浅灰色柱)或λcas-CRISPR(深灰色柱)处理携带对照(pVEC)、编码ndm-1(pNDM)、ctx-M-15(pCTX)或ndm-1+ctx-M-15(pNDM*/pCTX)的质粒的大肠杆菌K-12,并将其涂布在用5μg/ml四环素和0.2%***糖补充的LB板上。然后将菌落(每个菌株24个)接种在用5μg/ml四环素和0.2%***糖补充并且具有或缺乏链霉素或庆大霉素的板上。柱表示来自三次独立实验的被评分为能够在缺乏链霉素或庆大霉素的板上生长的CFU的总数中不能在具有这些抗生素的板上生长的CFU链霉素或庆大霉素敏感细菌的百分数和标准偏差。
图5.溶源化对针对裂解性噬菌体的保护的影响
用λcas(浅灰色柱)或λcas-CRISPR(深灰色柱)使大肠杆菌K-12溶源化。用缺乏靶向的原始间隔区的对照T7-gp8,或用编码ndm-1的两个原始间隔区(T7-N1N2,如由SEQ ID NO.55所示)或ctx-M-15的两个原始间隔区(T7-C2C1,如由SEQ ID NO.56所示)或各自的一个间隔区(T7-N1C1,如由SEQ ID NO.57所示,和T7-C2N2,如由SEQ ID NO.58所示)的T7噬菌体感染这些溶源性细菌。柱表示在三次独立的实验中,涂布噬菌体的系列稀释物后计数的每ml噬菌斑形成单位(PFU)数的平均值和标准偏差。
图6A-6C.通过裂解性噬菌体富集抗生素敏感性细菌
图6A.显示了富集抗生素敏感性细菌的程序的示意图。将细菌培养物与溶源化噬菌体混合,在培养物中得到溶源性细菌和非溶源性细菌两者。溶源性细菌既是抗生素敏化的又是噬菌体耐受性的,因为CRISPR-Cas***降解赋予抗生素耐受性的质粒和裂解性噬菌体染色体。将经处理的培养物接种在含有裂解性噬菌体的琼脂上,所述裂解性噬菌体选择性地杀死非溶源性细菌并富集抗生素敏感性细菌。
图6B.噬菌体耐受性大肠杆菌的富集。用λcas(浅灰色柱)或λcas-CRISPR(深灰色柱)处理携带对照(pVEC);编码ndm-1(pNDM)、ctx-M-15(pCTX)或ndm-1+ctx-M-15(pNDM*/pCTX)的质粒的大肠杆菌K-12,并将其涂布在T7-N1C1(如由SEQ ID NO.57所示)包被的板上,如A图中展示的方案中显示的。柱表示在三次独立的实验中计数的每ml存活CFU的数目的平均值和标准偏差。
图6C.抗生素敏感性大肠杆菌的富集。将来自B图中描述的每种培养物的存活菌落(20-48CFU)接种到具有或缺乏链霉素或庆大霉素的板上。柱表示来自三次独立实验的被评分为不能在缺乏链霉素或庆大霉素的板上生长的CFU的总数中不能在具有这些抗生素的板上生长的CFU的链霉素或庆大霉素敏感性细菌的百分数和标准偏差。
发明详述
本发明人不仅使CRISPR/Cas***来赋予选择优势,还使用CRISPR/Cas***作为遗传工具来破坏赋予细菌抗生素耐受性或任何致病性的特定DNA。CRISPR/Cas***最近已显示在细菌中作为适应性免疫***发挥作用(16)。该***的生理作用是通过靶向外源DNA或RNA来保护免受噬菌体攻击并免于不期望的质粒复制(16-17)。CRISPR/Cas可以基于被称为CRISPR的独特DNA阵列中的短同源DNA序列合理设计,以特异性地靶向任何DNA分子(见下文和图1)。CRISPR阵列的合理设计使得能够靶向编码耐受性决定子的任何DNA分子。另外,最初进化为针对噬菌体的防御机制的该***可以被设计为针对选择的裂解性噬菌体提供保护。这允许本发明的发明人将有益于细菌的性状(即,赋予噬菌体耐受性的基因)与逆转药物耐受性并消除耐受性决定子的DNA在遗传上连锁。这种遗传连锁使得能够通过使用裂解性噬菌体作为选择剂(selection agent)来选择敏化的细菌群体。在一些实施方案中,裂解性噬菌体被工程化以包含呈现出与本发明的工程化CRISPR阵列***中的至少一个间隔区相同的序列。用于选择的此类人工噬菌体,最终将抗生素敏感性和噬菌体耐受性连锁。携带针对裂解性噬菌体的防御连同敏化结构的细菌将存活,而其他细菌将被裂解性噬菌体,特别是本发明的工程化裂解性噬菌体杀死。该整合的结构被设计为主动地根除存在的耐受性基因,并且还消除这些基因在病原体之间的水平转移。本文提议的CRISPR/Cas***具有遗传工具的所有组分以逆转药物耐受性,所述CRISPR/Cas***组合了两种元件:敏化组分和选择元件,所述敏化组分为CRISPR阵列,所述选择元件为裂解性噬菌体。
更具体地,本发明提供了具体且有效的技术以抵消抗生素耐受性细菌的新兴威胁,所述技术克服了以上缺点。本文提供了复杂的方法,敏化表面上或人类天然菌群中的病原体、富集特定的敏感群体并从而使得能够随后在感染的患者中使用传统抗生素的方法,而并非直接靶向病原体。在该技术中,CRISPR-Cas***被用于破坏赋予抗生素耐受性的特定DNA并同时向抗生素敏感性细菌赋予选择优势。该选择优势使得能够通过选择针对未经处理的细菌来高效地替换抗生素敏感性细菌的群体。该方法与常规的噬菌体疗法的不同在于,它并非旨在直接杀死经处理的细菌,而是使它们对抗生素敏感并杀死未处理的细菌。因此,没有对处理的反向选择(counter selection)。通过利用选择优势,递送的效率被最大化,因为逃脱处理的细菌被选择剂杀死。通过该策略,本发明的发明人提出使表面上或人类皮肤菌群中的病原体敏化,同时富集这些敏化的群体。从而感染这些抗生素敏感性细菌的患者可以通过传统的抗生素治疗。
因此,本发明的第一方面涉及包括至少两种元件或组分的试剂盒或***。第一组分(i)是选择组分,所述选择组分包含含有至少一个原始间隔区的核酸序列。第二组分(ii)包含至少一种敏化组分,所述敏化组分包含至少一个cas基因和至少一个成簇的、规则间隔的短回文重复(CRISPR)阵列。应当注意,CRISPR的至少一个间隔区靶向包含于细菌的致病性基因(细菌致病性基因)内的原始间隔区,以特异性地灭活细菌中的致病性基因。此外,在另外的实施方案中,本发明的CRISPR的至少一个间隔区靶向包含于(i)的选择组分内的原始间隔区,以特异性地灭活选择组分。在更具体的实施方案中,本发明的CRISPR阵列的至少一个间隔区可以与包含于细菌的至少一种致病性基因中的核酸序列(或所述基因的一部分)(在本文中也被称为“原始间隔区”)足够互补,以靶向并灭活所述细菌中的至少一个致病性基因。
如本文所用的“选择组分”指本发明的试剂盒的元件或组分,所述元件或组分使得能够、促进、导致并且发挥作用于选择(selecting)、选择(choosing)、选择(electing)或富集特定的细菌细胞群体、特别地携带本发明的cas-CRISPR***的细胞群体、更特别地携带本发明的敏化组分的细菌细胞群体。选择组分例如通过施加仅仅使得选择的期望的群体(在具体的实施方案中,携带本发明的敏化组分的任何群体或细胞)能够存活并仅仅允许所述选择的期望的群体存活的条件,而为期望的群体提供选择优势。
如本文所用的“敏化组分”指本发明的试剂盒的以下元件,所述元件使得携带所述元件或组分的生物体对某种物质例如对抗生素物质的敏感性或易感性增加,和/或对某种物质例如对抗生素物质的耐受性降低。在更具体的实施方案中,本发明的敏化组分通过特异性地靶向、灭活和/或破坏细菌致病性基因,例如编码抗生素耐受性的基因或编码有毒化合物的基因,使细胞敏化并使得其能够逆转为更不耐受且更易感的细胞。在某些实施方案中,“靶向”应被理解为将元件或对象或者元件或对象的组作为靶,以选择(elect)或选择(choose)它或它们进行作用,其中被选择(elected)或选择(choose)的一个或多个对象或一个或多个元素被攻击、摄取(taken)、分解、灭活或破坏。
此外,本发明的CRISPR阵列的至少一个间隔区可以与包含于本发明的试剂盒的选择组分内的核酸序列(或原始间隔区)足够互补,以靶向并灭活选择组分,其中“灭活”意指延迟、减少、抑制、消除、减弱或终止选择组分的活性。应当注意的是,此类灭活致使包含所述敏化元件的细菌不敏感并且对本发明的试剂盒的选择组分耐受。应领会的是,如本文所使用的足够的互补性反映了在约10%至100%之间的任何互补性,更特别地,约10%、15%、20%、25%、30%、35%、40%、45%、50%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%和100%的互补性。
在某些实施方案中,“互补性”指各自遵循锁钥原则的两个结构之间的关系。在本质上,互补性是DNA复制和转录的基本原则,因为它是两个DNA或RNA序列之间共有的属性,以使得当它们彼此反平行对齐时,序列中的每个位置处的核苷酸碱基将是互补的(例如,A和T或U、C和G)。
本发明在其一些实施方案中涉及使用CRISPR构建体下调(例如消除)细菌基因的试剂盒和方法。更具体地,本发明提供了用于富集具有携带本发明的试剂盒的敏化组分的抗生素敏感性细菌的细菌群体的试剂盒和方法。
在详细解释本发明的至少一个实施方案之前,应理解的是,本发明在其应用中不必然被限制为以下说明中所示或由实施例例证的细节。本发明能够进行其他实施方案,或者能够以多种方式实践或进行。
在本上下文中,术语“细菌(baceria)”(单数“细菌(bacterium)”)指任何类型的单细胞微生物。本文中的术语“细菌”和“微生物”是可互换的。在本文中该术语包括根据其基本形状属于一般类别的细菌,即球形(球菌(cocci))、杆状(杆菌(bacilli))、螺旋形(螺旋菌(spirilla))、弧形(弧菌(vibrios))或螺旋桨形(corkscrew)(螺旋体(spirochaetes)))以及以单细胞、成对、成链或成簇存在的细菌。
应当注意的是,如本文所用的术语“细菌”指以单细胞或以单细胞簇或聚集体存在的任何原核微生物。在更具体的实施方案中,术语“细菌”具体指革兰氏阳性、革兰氏阴性或耐酸生物体。***可以被认为保留用于区分细菌的革兰氏染色法的结晶紫染料,并且因此在显微镜下看起来是紫色的。革兰氏阴性细菌不保留结晶紫,使得阳性鉴定是可能的。换言之,在本文中术语“细菌”适用于在细胞膜外的细胞壁中具有较厚的肽聚糖层的细菌(革兰氏阳性),以及在细胞质的细胞内膜(inner cytoplasmic cell membrane)和细菌外膜之间具有它们的细胞壁的薄肽聚糖层的细菌(革兰氏阴性)。该术语还适用于诸如异常球菌属(Deinococcus)的一些细菌,这些细菌由于厚的肽聚糖层的存在而染色为革兰氏阳性,但是还拥有外细胞膜,并因此被认为是在单层(monoderm)细菌(革兰氏阳性)和双层(diderm)细菌(革兰氏阴性)之间过渡的中间类型。像分枝杆菌属(Mycobacterium)的耐酸生物体在其细胞壁内含有大量的被称为分枝菌酸的脂质物质,所述分枝菌酸耐受被常规方法诸如革兰氏染料染色。
如以上说明的,本发明的试剂盒可以包括至少两种组分,选择组分,所述选择组分使得能够富集并选择携带敏化组分的细菌群体,所述细菌群体因此是对抗生素敏感的群体或具有降低的或消除的耐受性的群体。
应领会的是,本发明的选择组分可以是携带或包含至少一个原始间隔区(protospaces)的任何遗传元件或载体,所述原始间隔区显示出与包含于致病性细菌基因内的至少一个原始间隔区至少最低同一性(具体地约70%或更多的最低同一性)和/或被包含于本发明的敏化组分内的至少一个间隔区识别。此类选择组分可以是例如另外编码可以损害、杀死或消除细菌细胞的有毒元件或蛋白的质粒。更具体地,它还可以是编码基因的DNA注入性实体(DNA-injected entity),所述基因通过灭活细菌的用于细菌生长的必要元件或以其它方式破坏用于细菌生长的必要组分来杀死细菌。例如编码此类基因并通过噬菌体产物衍生的专门蛋白机构注射的DNA。
在仍然一些具体的实施方案中,本发明的试剂盒使用的选择组分可以包含至少一种裂解性噬菌体。在更具体的实施方案中,此类噬菌体可以包含含有至少一个原始间隔区的核酸序列,所述至少一个原始间隔区充当敏化组分的间隔区的靶。
术语噬菌体意指在原核生物诸如细菌内感染并复制的病毒。应注意的是,术语“噬菌体(bacteriophage)”与术语“噬菌体(phage)”是同义的。噬菌体包括封装DNA或RNA基因组的蛋白,所述DNA或RNA基因组可以编码仅几个或上百个基因,从而产生具有相对简单或精细结构的病毒体。因此,噬菌体属于生物圈中最常见和多样化的实体。根据国际病毒分类命名委员会(International Committee on Taxonomy of Viruses,ICTV),鉴于核酸的形态学和类型(DNA或RNA,单链或双链,线形或环形)对噬菌体分类。目前已经认知了感染细菌和/或古菌(archaea)(以前被归类为古细菌的原核域(domain))的约19个噬菌体科。许多噬菌体对特定的属或种或细胞株是特异性的。
如上所述,在某些具体且非限制性的实施方案中,用作本发明的试剂盒的选择组分的噬菌体可以是裂解性噬菌体。裂解性噬菌体是通过完成裂解循环而不是进入溶源性途径来遵循裂解途径的噬菌体。裂解性噬菌体经历病毒复制,导致细胞膜的裂解、细胞的破坏、以及能够感染其他细胞的后代噬菌体颗粒的释放。
在某些实施方案中,本发明的试剂盒的选择组分的裂解性噬菌体可以是经遗传修饰的噬菌体,所述经遗传修饰的噬菌体包含至少一种原始间隔区,所述原始间隔区与包含于细菌致病性基因内的至少一个核酸序列具有至少70%的同一性。在更具体的实施方案中,此类噬菌体可以包含与包含于细菌致病性基因内的至少一个核酸序列具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的至少一个原始间隔区。
在另外的实施方案中,敏化组分可以包含至少一种重组载体,所述重组载体包含编码至少一个cas蛋白的重组核酸序列。应注意的是,载体可以另外包含至少一个所述CRISPR阵列的核酸序列。在某些实施方案中,此类载体可以是包含本文描述的CRISPR***的任何质粒、构建体、噬菌粒或产生的噬菌体。
如本文所用,术语“重组DNA”、“重组核酸序列”或“重组基因”指包含编码本发明的CRISPR***之一的开放阅读框的核酸。
因此,在一些实施方案中,本发明的敏化元件可以是包含cas蛋白和本发明的所述CRISPR阵列中的至少一种的任何载体。如本文所使用的“载体(Vectors)”或“运载体(Vehicles)”包括诸如质粒、噬菌粒、病毒、噬菌体、可整合的DNA片段的载体和其他运载体,所述运载体能够将DNA片段整合到宿主的基因组中,或使得能够表达未整合的遗传元件。载体通常是含有期望的核酸序列和可操作地连接的遗传控制元件的自我复制的DNA或RNA构建体,所述遗传控制元件在合适的宿主细胞中被识别并实现期望的间隔区的翻译。通常,遗传控制元件可以包括原核启动子***或真核启动子表达控制***。此类***通常包括转录启动子、提高RNA表达水平的转录增强子。载体通常含有允许载体独立于宿主细胞复制的复制起点。在仍然一些可选的实施方案中,本发明使用的表达载体可以包含将本发明的期望的CRISPR***整合到细菌染色体中所必需的元件。
因此,术语控制和调节元件包括启动子、终止子和其他表达控制元件。Goeddel[Goeddel.等,Gene Expression Technology:Methods in Enzymology 185,AcademicPress,San Diego,Calif.(1990)]中描述了此类调节元件。例如,控制DNA序列的表达的很多种表达控制序列中的任一种在与DNA序列可操作地连接时可以被用在这些载体中以利用本发明的方法表达编码任何期望的蛋白的DNA序列。
载体可以另外地包括适当的限制性位点、抗生素耐受性或用于选择含有载体的细胞的其他标志物。质粒是最常用的载体形式,但发挥等价功能并且是本领域已知的或变成本领域已知的其它形式的载体也适用于本文。参见例如Pouwels等,Cloning Vectors:aLaboratory Manual(1985和增补),Elsevier,NY;和Rodriquez等(编辑)Vectors:a Surveyof Molecular Cloning Vectors and their Uses,Buttersworth,Boston,Mass(1988),其通过引用并入本文。
在仍然一些其它的实施方案中,本发明的敏化元件可以是包含本发明的CRISPR***的噬菌粒。如本文所用的“噬菌粒”是被修饰为携带噬菌体包装位点并且还可以编码噬菌体蛋白的质粒。噬菌粒通常可以包含至少一个噬菌体包装位点和复制起点(ori)。在一些实施方案中,本公开内容的噬菌粒还可以编码噬菌体包装位点和/或参与噬菌体包装的蛋白。
仍然另外地,在某些实施方案中,本发明的敏化元件可以是经遗传修饰的噬菌体。更具体地,此类经遗传修饰的噬菌体可以包含:靶向包含于所述裂解性噬菌体内的至少一个核酸序列的至少一个CRISPR间隔区和靶向包含于所述至少一个致病性基因内的核酸序列的至少一个CRISPR间隔区。以这种方式,本发明的敏化组分可以靶向和/或灭活充当选择组分的裂解性噬菌体和感兴趣的致病性基因两者。
更具体地,本发明人构思了裂解性噬菌体(作为选择组分)或温和性噬菌体(作为敏化组分),特别是温度敏感的温和性噬菌体的用途。如本文所用的“温和性噬菌体”涉及如下具体实施方案:其中在特定温度(例如在36℃或更低,例如20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃或35℃),噬菌体喜欢溶源性,而较高的温度诱导噬菌体的裂解产生。如本文以上所述,裂解性噬菌体是使用裂解循环的噬菌体。裂解循环导致感染的细胞及其膜的破坏。裂解性和溶源性噬菌体循环之间的关键区别是,在裂解性噬菌体中,病毒DNA作为单独的分子存在于细菌细胞内并与宿主细菌DNA分开复制。在溶源性噬菌体循环中,病毒DNA的位置是在宿主细胞内,因此在这两种情况中,病毒/噬菌体都利用宿主DNA机构复制,但是在裂解性噬菌体循环中,噬菌体是与宿主细胞分开的自由浮动的分子。
在一些实施方案中,作为选择组分或敏化组分用于本发明的试剂盒的噬菌体可以是如下类型的噬菌体:选择性地感染细菌的致病性类型、或可以在混合细菌群体中具有致病性和非致病性成员的细菌的类型;或可以感染混合细菌群体中的不同类型的细菌。此类混合细菌群体被发现于医院表面。重要地,一些耐受性病原体诸如屎肠球菌(Enterococcusfaecium)、金黄色葡萄球菌(Staphylococcus aureus)、克雷伯氏肺炎杆菌(Klebsiellapneumonia)、鲍曼不动杆菌(Acinetobacter baumanni)、铜绿假单胞菌(Pseudomonasaeruginosa)和肠杆菌属物种(Enterobacter species)(本文中也被称为ESKAPE生物体或细菌)对发达国家和发展中国家两者中的大部分医院感染负责。这些病原体导致大多数的医院感染,并有效逃脱了抗生素的作用(18、19)。因此,对这些物种或者甚至仅其中一些的高效且有效的处理可以显著降低由耐受性病原体感染引起的死亡和经济负担。
因此,在一些实施方案中,本发明的试剂盒使用的噬菌体可以是对特定细菌属、种或株特异的噬菌体。在某些实施方案中,噬菌体可以是对细菌菌株特异的,所述细菌菌株可以是以下中的至少一种的成员:大肠杆菌(Escherichia coli)、链球菌属物种(Streptococcus spp.)、葡萄球菌属物种(Staphylococcus spp.)、梭菌属物种(Clostridium spp.)、杆菌属物种(Bacillus spp.)、沙门氏菌属物种(Salmonella spp.)、螺杆菌属物种(Helicobacter spp.)、奈瑟菌属物种(Neisseria spp.)(特别是淋病奈瑟菌(N.gonorrhoeae)和脑膜炎奈瑟菌(N.meningitidis))或铜绿假单胞菌。
该类型的噬菌体的非限制性实例可以是λgt11噬菌体。还构思了cI基因被改变为cI857等位基因的其他λ噬菌体,因为它们将表现出相似的生长模式。优选地,选择噬菌体以使得其允许稳定地***至少1kb的外源DNA,更优选地至少5kb的外源DNA。根据另一个实施方案,噬菌体包含具有最小基因的缺失突变体并且能够高效溶源化。
能够感染另外的细菌的噬菌体的鉴定在本领域技术人员的范围内。用于感染细菌的噬菌体可以能够整合到***、革兰氏阴性细菌或耐酸生物体等中。
如上所述,在一些实施方案中,充当本发明的***或试剂盒中的选择元件的裂解性噬菌体可以是经遗传修饰的噬菌体。此类噬菌体可以在遗传上被工程化以包含为原始间隔区的至少一个核酸序列。在更具体的实施方案中,此类原始间隔区可显示出与至少一个原始间隔区,换言之包含于细菌的致病性基因内的核酸序列或其任何片段、部分(part)或部分(portion)至少70%的同一性。
在更具体的实施方案中,包含于本发明的敏化组分内的载体可以是经遗传修饰的温和性噬菌体,所述经遗传修饰的温和性噬菌体包含:靶向包含于(充当选择组分的)裂解性噬菌体内的核酸序列的至少一个CRISPR间隔区和靶向包含于所述细菌致病性基因内的核酸序列的至少一个CRISPR间隔区。
在另外的具体的实施方案中,本发明的CRISPR阵列的至少一个间隔区应与如下的核酸序列足够互补:包含于本发明的经遗传修饰的裂解性噬菌体(选择组分)内的原始间隔区并且还在细菌的靶致病性基因内。以这种方式,本发明的敏化组分的CRISPR阵列靶向并灭活裂解性噬菌体和靶致病性基因两者。
在仍然其它的具体的实施方案中,被本发明的CRISPR***靶向的细菌的靶致病性基因或从其转录的任何RNA可以是细菌内源性基因。应注意的是,如本文所用的“内源性基因”指源自特定生物体,在本案中为细菌的DNA,并且因此可以是其染色体DNA的一部分。
根据其它的实施方案,细菌的靶致病性基因可以是表染色体的。在一些具体且非限制性的实施方案中,此类非内源性基因可以通过水平转移获得。如本文所用的“表染色体基因(epichromosomal gene)”涉及可以作为染色体外DNA独立地复制,或在某些实施方案中可以整合入宿主染色体的遗传物质单元,特别地细菌中的DNA,例如质粒。
在一些具体的实施方案中,细菌的至少一种靶致病性基因可以是编码毒力因子或毒素的基因,从而致使所述细菌是毒性的。如本文所用的术语“毒性的”意指可引起细菌性疾病或感染的细菌。在一些实施方案中,毒性细菌是在不具有受损害的免疫***的人类受试者或任何其他生物体(包括但不限于哺乳动物、啮齿动物、鸟、鱼、爬行动物、昆虫或植物)中引起细菌性疾病或感染的那些细菌。通常,毒性细菌将产生被称为“毒力因子”的某些蛋白。毒性细菌与正常定殖一种或更多种健康宿主的组织的那些细菌是可区分的,并且因此对于所述正常定殖的那些细菌,在通常的治疗环境下它们并不期望被杀死,因为正常定殖的细菌通常不表达毒力因子,或相对于毒性细菌表达较低量的毒力因子。如以上讨论的,在一些实施方案中,本公开内容包括CRISPR***,所述CRISPR***包含编码靶向RNA的序列,所述靶向RNA针对编码毒力因子的细菌DNA序列。此类毒力因子包括但不必然限于涉及致病性粘附、定殖、入侵、生物膜形成或免疫应答抑制剂或毒素的细菌蛋白。毒力基因的实例包括但不限于编码毒素(例如,志贺毒素和霍乱毒素)、溶血素、菌毛(fimbrial)和非菌毛粘附素、蛋白酶、脂酶、内切核酸酶、内毒素和外毒素细胞毒性因子、微菌素(microcin)和大肠杆菌素以及本领域被鉴定的那些毒素的基因。来自编码这些毒力因子和其他毒力因子的广泛的细菌类型的细菌基因的序列是本领域已知的。毒力因子可以在细菌染色体上、或在细菌中的质粒上或两者上编码。在一些实施方案中,毒力因子可以由细菌超抗原基因诸如超抗原肠毒素基因编码,其一个非限制性实例是金黄色葡萄球菌Sek基因。金黄色葡萄球菌的另外的毒力因子包括但不限于:溶细胞毒素,诸如α-溶血素、β-溶血素、γ-溶血素、杀白细胞素(leukocidin)、Panton-Valentine杀白细胞素(PVL);外毒素,诸如毒性休克综合征毒素-1(TSST-1);肠毒素,诸如SEA、SEB、SECn、SED、SEE、SEG、SEH和SEI;以及表皮剥脱毒素(exfoliative toxin),诸如ETA和ETB。由其他类型的细菌表达的所有这些毒素的同源物在本文中也被构思为毒力基因靶标。
更具体地,如本文所用的术语“毒素”意指由细菌产生的物质,其可被分类为外毒素或内毒素。外毒素被产生并主动分泌;内毒素保持为细菌的一部分。通常,内毒素是细菌外膜的一部分,并且它直到细菌被免疫***杀死才被释放。
根据本发明的一些具体且非限制性实施方案,细菌毒力基因可以选自由以下组成的组:actA(在genebank登录号:NC_003210.1中给出了实例)、Tem(在genebank登录号:NC_009980中给出了实例)、Shv(在genebank登录号:NC_009648中给出了实例)、oxa-1(在genebank登录号:NW_139440中给出了实例)、oxa-7(在genebank登录号:X75562中给出了实例)、pse-4(在genebank登录号:J05162中给出了实例)、ctx-m(在genebank登录号:NC_010870中给出了实例)、ant(3”)-Ia(aadA1)(在genebank登录号:DQ489717中给出了实例)、ant(2”)-Ia(aadB)b(在genebank登录号:DQ176450中给出了实例)、aac(3)-IIa(aacC2)(在genebank登录号:NC_010886中给出了实例)、aac(3)-IV(在genebank登录号:DQ241380中给出了实例)、aph(3’)-Ia(aphA1)(在genebank登录号:NC_007682中给出了实例)、aph(3’)-IIa(aphA2)(在genebank登录号:NC_010170中给出了实例)、tet(A)(在genebank登录号:NC_005327中给出了实例)、tet(B)(在genebank登录号:FJ411076中给出了实例)、tet(C)(在genebank登录号:NC_010558中给出了实例)、tet(D)(在genebank登录号:NC_010558中给出了实例)、tet(E)(在genebank登录号:M34933中给出了实例)、tet(Y)(在genebank登录号:AB089608中给出了实例)、catI(在genebank登录号:NC_005773中给出了实例)、catIINC_010119、catIII(在genebank登录号:X07848中给出了实例)、floR(在genebank登录号:NC_009140中给出了实例)、dhfrI(在genebank登录号:NC_002525中给出了实例)、dhfrV(在genebank登录号:NC_010488中给出了实例)、dhfrVII(在genebank登录号:DQ388126中给出了实例)、dhfrIX(在genebank登录号:NC_010410中给出了实例)、dhfrXIII(在genebank登录号:NC_000962中给出了实例)、dhfrXV(在genebank登录号:Z83311中给出了实例)、suII(在genebank登录号:NC_000913中给出了实例)、suIII(在genebank登录号:NC_000913中给出了实例)、1类整合子3’-CS(在genebank登录号:AJ867812中给出了实例)、vat(在genebank登录号:NC_011742中给出了实例)、vatC(在genebank登录号:AF015628中给出了实例)、vatD(在genebank登录号:AF368302中给出了实例)、vatE(在genebank登录号:NC_004566中给出了实例)、vga(在genebank登录号:AF117259中给出了实例)、vgb(在genebank登录号:AF117258中给出了实例)和vgbB(在genebank登录号:AF015628中给出了实例)。
如上所述,本发明的试剂盒可以特异性地靶向任何致病性细菌基因,例如提供耐受性,或者换言之抑制(inhibit)、减少、阻抑(suppress)或减弱细菌对任何抗微生物剂的易感性的任何基因。如本文所用的术语“抗微生物剂”指具有抗微生物活性(杀细菌或抑细菌),即抑制生长和/或杀死细菌例如***和革兰氏阴性细菌的能力的任何实体。抗微生物剂可以是与不存在抗微生物剂相比,导致细菌的生长抑制或细菌的生活力降低至少约10%、20%、30%或至少约40%、或至少约50%或至少约60%或至少约70%或超过70%,例如75%、80%、85%、90%、95%、100%或在30%和70%之间的任何整数或更大的任何剂。换言之,抗微生物剂是与不存在抗微生物剂相比,使微生物细胞诸如细菌的群体减少至少约30%或至少约40%、或至少约50%或至少约60%或至少约70%或超过70%、或在30%至70%之间的任何整数的任何剂。在一个实施方案中,抗微生物剂是特异性地靶向细菌细胞的剂。在另一个实施方案中,抗微生物剂修改(即抑制或激活或增加)在细菌细胞中特异性地表达的途径。抗微生物剂可以包括任何化学品、肽(即抗微生物肽)、拟肽、实体或部分、或其混杂物的类似物,包括但不限于合成的和天然存在的非蛋白实体。在一些实施方案中,抗微生物剂是具有化学部分的小分子。例如,化学部分包括未取代或取代的烷基部分、芳香族部分或杂环基部分,包括大环内酯类、细霉素(leptomycin)和相关天然产物或其类似物。抗微生物剂可以是已知具有期望活性和/或性质的任何实体,或者可以选自不同化合物的文库。
如上所述,本发明的试剂盒、***和方法的敏化元件可以靶向提供抗生素耐受性的任何基因。如本文所用,术语“耐受性”并不意指暗示细菌细胞群体对特定的抗生素化合物100%耐受,而是包括耐受抗生素或其任何衍生物的细菌。更具体地,术语“细菌耐受性基因”指赋予约100%、90%、80%、70%、60%、50%、40%、30%、20%或10%保护免于抗生素化合物的基因,从而逆转对所述抗生素化合物的易感性及其敏感性。
因此,在一些实施方案中,细菌致病性基因可以是提供对本文以上描述的任何抗细菌化合物的耐受性的任何基因。
又另外地,在其它实施方案中,细菌的至少一种靶致病性基因可以是编码抗生素耐受性因子的基因。
如本文所用的术语“抗生素耐受性基因”指例如通过编码破坏所述抗生素化合物的酶、通过编码阻止抗生素化合物进入微生物的表面蛋白、通过主动将其输出或通过成为抗生素靶标的突变形式而赋予抗生素耐受性,从而阻止其抗生素功能的基因。
多种细菌携带的抗生素耐受性基因是本领域已知的,并且如果期望,任何特定细菌中的抗生素耐受性基因的序列可以被确定。在某些非限制性实施方案中,本公开内容包括CRISPR***,所述CRISPR***包含编码靶向RNA的间隔区,所述靶向RNA针对包含抗生素耐受性基因的细菌DNA序列。在一些实施方案中,耐受性基因赋予对青霉素类抗生素的窄谱β-内酰胺抗生素的耐受性。在其它实施方案中,耐受性基因赋予对甲氧西林(例如甲氧西林或苯唑西林)或氟氯西林(flucloxacillin)或双氯西林(dicloxacillin)或这些抗生素中的一些或全部的耐受性。因此,在一些实施方案中,CRISPR***适合于选择性地靶向通俗地称为甲氧西林耐受性金黄色葡萄球菌(MRSA)中的抗生素耐受性基因,所述甲氧西林耐受性金黄色葡萄球菌实际上指对大多数或全部青霉素类不敏感或具有降低的敏感性的金黄色葡萄球菌菌株。在其他实施方案中,CRISPR***适合于靶向万古霉素耐受性金黄色葡萄球菌(VRSA)中的万古霉素耐受性。在某些实施方案中,万古霉素耐受性金黄色葡萄球菌也可以耐受利奈唑胺(linezolid)(ZYVOXTM)、达托霉素(daptomycin)(CUBICINTM)和奎奴普丁(quinupristin)/达福普汀(dalfopristin)(SYERCIDTM)中的至少一种。
另外的抗生素耐受性基因包括但不限于:磷霉素(fosfomycin)耐受性基因fosB;四环素耐受性基因tetM;卡那霉素核苷酸基转移酶aadD;双官能团氨基糖苷修饰酶基因aacA-aphD;氯霉素乙酰转移酶cat;莫匹罗星(mupirocin)耐受性基因ileS2;万古霉素耐受性基因vanX、vanR、vanH、vraE、vraD;甲氧西林耐受性因子femA、fmtA、mecl;链霉素腺苷酰转移酶spcl、spc2、antl、ant2;壮观霉素腺苷转移酶spd、ant9、aadA2和任何其他耐受性基因。
在一些具体实施方案中,致病性基因可以是编码赋予对任何β-内酰胺抗生素化合物的耐受性的任何基因产物的基因。在更具体的实施方案中,此类基因可以编码至少一种β-内酰胺酶。如本文所使用的,术语“β-内酰胺酶”表示能够催化β-内酰胺酶底物诸如含有β-内酰胺的分子(诸如β-内酰胺抗生素)或其衍生物的裂解的蛋白。
β-内酰胺酶基于其氨基酸序列被分组成四个分子类别(A、B、C和D)。A类酶具有约29kDa的分子量,并优先水解青霉素。A类酶的实例包括RTEM和金黄色葡萄球菌的β-内酰胺酶。B类酶包括比其他类别的β-内酰胺酶具有更宽的底物谱的金属酶。C类酶具有约39kDa的分子量,并且包括革兰氏阴性细菌的染色体头孢菌素酶,所述染色体头孢菌素酶对革兰氏阴性细菌对多种传统和新设计的抗生素的耐受性负责。另外,C类酶还包括P99阴沟肠杆菌(P99Enterobacter cloacae)的内酰胺酶,所述内酰胺酶对使得该肠杆菌属的种成为美国医院中最广泛传播的菌剂(bacterial agent)之一负责。D类酶是表现出独特的底物谱的丝氨酸水解酶。
如上所述,在更具体的实施方案中,本发明的试剂盒和***可以针对可以赋予对任何β内酰胺抗生素的耐受性的任何基因。如本文使用的术语“β-内酰胺”或“β内酰胺抗生素”指在其分子结构中含有β-内酰胺环的任何抗生素剂。
β-内酰胺抗生素是包括不同的类别的一大组抗生素,诸如天然的和半合成青霉素、克拉维酸(clavulanic acid)、碳青霉烯类、青霉素衍生物(青霉烷类(penams))、头孢菌素类(头孢烯类)、头霉素类(cephamycin)和单环β内酰胺类(monobactam),即在其分子结构中含有β-内酰胺环的任何抗生素剂。它们是最广泛使用的一组抗生素。虽然不是真正的抗生素,但是β-内酰胺酶抑制剂往往被包括在该组中。
β-内酰胺抗生素是D-丙氨酰-D-丙氨酸(新生肽聚糖层的前体NAM/NAG-肽亚基上的末端氨基酸残基)的类似物。β-内酰胺抗生素和D-丙氨酰-D-丙氨酸之间的结构相似性防止新生肽聚糖层的最终交联(转肽作用),破坏细胞壁合成。
在正常情况下,肽聚糖前体是细菌细胞壁的重组的标志,并且结果是触发自溶性细胞壁水解酶的活化。交联被β-内酰胺抑制引起肽聚糖前体的积累,触发存在的肽聚糖被自溶性水解酶消化,而不产生新的肽聚糖。结果,β-内酰胺抗生素的杀细菌作用被进一步增强。
通常,β-内酰胺根据其核心环结构被分类和分组,其中每组可以被分为不同类别。术语“青霉烷”用于描述青霉素抗生素成员的核心骨架。即含有噻唑烷环的β-内酰胺。青霉素含有与五元环稠合的β-内酰胺环,其中环中的原子之一是硫并且环是完全饱和的。青霉素可以包括窄谱青霉素,诸如苄星青霉素(benzathine penicillin)、苄青霉素(青霉素G)、苯氧甲基青霉素(phenoxymethylpenicillin)(青霉素V)、普鲁卡因青霉素和苯唑西林。窄谱青霉素酶耐受性青霉素包括甲氧西林、双氯西林和氟氯西林。该窄谱β-内酰胺酶耐受性青霉素可以包括替莫西林(temocillin)。中谱(moderate spectrum)青霉素包括例如阿莫西林和氨苄青霉素。广谱青霉素包括复合阿莫西林-克拉维酸(co-amoxiclav)(阿莫西林+克拉维酸)。最后,青霉素组还包括超广谱(extended spectrum)青霉素,例如阿洛西林(azlocillin)、羧苄青霉素(carbenicillin)、替卡西林(ticarcillin)、美洛西林(mezlocillin)和哌拉西林(piperacillin)。
该类的其他成员包括:匹氨西林(pivampicillin)、海他西林(hetacillin)、巴氨西林(bacampicillin)、美坦西林(metampicillin)、酞氨西林(talampicillin)、依匹洛林(epicillin)、羧苄青霉素(carbenicillin)、卡茚西林(carindacillin)、替卡西林、阿洛西林、哌拉西林、美洛西林、美西林(mecillinam)、匹美西林(pivmecillinam)、磺苄西林(sulbenicillin)、氯甲西林(clometocillin)、普鲁卡因青霉素(procainebenzylpenicillin)、叠氮氨苄青霉素(azidocillin)、青霉素G双酯(penamecillin)、丙匹西林(propicillin)、苯氧乙基青霉素(phenethicillin)、邻氯青霉素(cloxacillin)和萘夫西林(nafcillin)。
含有吡咯烷环的β-内酰胺被称为碳青霉烷类抗生素(carbapenams)。碳青霉烷是为饱和的碳青霉烯的β-内酰胺化合物。它们主要作为至碳青霉烯类抗生素的途中的生物合成的中间体存在。
碳青霉烯类抗生素具有致使其对β-内酰胺酶高度耐受的结构,并且因此被认为是最广谱的β-内酰胺抗生素。碳青霉烯类抗生素在结构上与青霉素十分相似,但在结构的位置1中的硫原子已被碳原子取代,并因此该组的名称为碳青霉烯。碳青霉烯抗生素最初由卡特利链霉菌(Streptomyces cattleya)的天然来源的产物噻烯霉素(thienamycin)开发而来。碳青霉烯类抗生素组包括:比阿培南(biapenem)、多利培南(doripenem)、厄他培南(ertapenem)、亚胺培南(imipenem)、美罗培南(meropenem)、帕尼培南(panipenem)和PZ-601。
含有2,3-二氢噻唑环的β-内酰胺被命名为青霉烯类(penems)。青霉烯类在结构上与碳青霉烯类抗生素相似。然而,其中青霉烯类具有硫,碳青霉烯类具有另一个碳。不存在天然存在的青霉烯类;其所有都是合成制备的。青霉烯类的实例是法罗培南(faropenem)。
含有3,6-二氢-2H-1,3-噻嗪环的β-内酰胺被命名为头孢烯类(cephems)。头孢烯类是β-内酰胺抗生素的亚组,并且包括头孢菌素类和头霉素类。头孢菌素类是广谱半合成抗生素,其共有7-氨基头孢烷酸的核。也被认为是中谱的第一代头孢菌素类包括头孢氨苄(cephalexin)、头孢金素(cephalothin)和头孢唑啉(cefazolin)。被认为具有抗嗜血杆菌属(Haemophilus)活性的具有中谱的第二代头孢菌素类可包括头孢克洛(cefaclor)、头孢呋辛(cefuroxime)和头孢孟多(cefamandole)。表现出具有抗厌氧菌活性的中谱的第二代头霉素类包括头孢替坦(cefotetan)和头孢西丁(cefoxitin)。被认为具有广谱活性的第三代头孢菌素类包括头孢噻肟(cefotaxime)和头孢泊肟(cefpodoxime)。
最后,被认为具有增强的抵抗***的活性和β-内酰胺酶稳定性的广谱的***头孢菌素类包括头孢吡肟(cefepime)和头孢匹罗(cefpirome)。头孢菌素类还可以包括:头孢羟氨苄(cefadroxil)、头孢克肟(cefixime)、头孢丙烯(cefprozil)、头孢氨苄(cephalexin)、头孢金素、头孢呋辛、头孢孟多、头孢吡肟和头孢匹罗。
头霉素类与头孢菌素类非常相似,并且有时被分类为头孢菌素类。像头孢菌素类一样,头霉素类基于头孢烯核。头霉素类最初由链霉菌属产生,但合成的头霉素类也已经被生产。头霉素类在7-α位置拥有甲氧基,并且包括:头孢西丁、头孢替坦、头孢美唑(cefmetazole)和氟氧头孢(flomoxef)。
含有1,2,3,4-四氢吡啶环的β-内酰胺被命名为碳头孢烯类(carbacephems)。碳头孢烯类是基于头孢菌素(头孢烯)的结构而合成地制备的抗生素。碳头孢烯类与头孢烯类相似,但是具有替代硫的碳。碳头孢烯类的实例是氯碳头孢(loracarbef)。
单环内酰胺类是其中β-内酰胺环是单独的且不稠合到另一个环(与大多数具有两个环的其他β-内酰胺相反)的β-内酰胺化合物。他们只针对革兰氏阴性细菌起作用。单环内酰胺类的其他实例是替吉莫南(tigemonam)、诺卡菌素A(nocardicin A)和烟草毒素(tabtoxin)。
含有3,6-二氢-2H-1,3-噁嗪环的β-内酰胺被命名为氧头孢烯类(oxacephems)或克拉维烷类(clavams)。氧头孢烯类是与头孢烯类相似的分子,但具有替换硫的氧。因此,它们也被称为氧青霉烷类。氧青霉烷类的实例是克拉维酸。它们是合成地制备的化合物并且在自然界中尚未被发现。氧青霉烷类的其他实例包括拉氧头孢(moxalactam)和氟氧头孢。
另一组β-内酰胺抗生素是β-内酰胺酶抑制剂,例如克拉维酸。虽然它们表现出可忽略的抗微生物活性,但它们含有β内酰胺环。其唯一目的是通过结合β-内酰胺酶防止β-内酰胺抗生素被灭活,并且因此它们与β-内酰胺抗生素共施用。临床应用中的β-内酰胺酶抑制剂包括克拉维酸及其钾盐(通常与阿莫西林或替卡西林组合)、舒巴坦(sulbactam)和他唑巴坦(tazobactam)。
因此,应理解的是,本发明的试剂盒通过靶向并破坏抗生素耐受性基因而导致细菌群体对本文以上说明的任何抗生素化合物敏化。因此应领会的是,此类敏化增加了细菌对所述化合物的敏感性,从而增强其有效性,这可以导致所需量的减少。本发明还构思了用本发明的试剂盒和本文公开的任何抗生素化合物的组合处理。在又一些另外的实施方案中,本发明的试剂盒还可以包含至少一种抗生素化合物。在更具体的实施方案中,此类化合物可以是本发明公开的任何抗生素化合物。
在更具体的实施方案中,抗生素耐受性因子或基因,即本发明的试剂盒的靶致病性基因可以是以下中的任一种:超广谱β-内酰胺酶耐受性因子(ESBL因子)、CTX-M-15、β内酰胺酶、新德里金属-β-内酰胺酶(NDM)-1、2、5、6和四环素A(tetA)。
新德里金属-β-内酰胺酶(NDM-1)是致使细菌对所有当前使用的β-内酰胺抗生素耐受的酶。NDM-1耐受性谱包括碳青霉烯家族的抗生素,所述碳青霉烯家族的抗生素是治疗抗生素耐受性细菌感染的支柱。NDM-1的基因是编码被称为碳青霉烯酶的β-内酰胺酶的大基因家族中的一个成员。产生碳青霉烯酶的细菌众所周知的难以治疗。重要的是,NDM-1的基因可以通过水平基因转移从一种细菌菌株扩散到另一种菌株,并因此可以很容易地扩散。在某些具体且非限制性的实施方案中,NDM-1蛋白可以是蛋白_id CAZ39946.1的克雷伯氏肺炎杆菌金属-β-内酰胺酶基因blaNDM-1。在一些具体实施方案中,所述NDM-1蛋白可以包含由SEQ ID NO:75所示的核酸序列编码的氨基酸序列。在又一些另外的具体实施方案中,本发明的NDM-1蛋白可以包含SEQ ID NO:74所示的氨基酸序列。
又另外,如本文所用的CTX-M-15是最初在大肠杆菌、克雷伯氏肺炎杆菌和沙门氏菌属物种中描述的超广谱β-内酰胺酶(ESBL)的CTX-M家族(头孢噻肟酶(Cefotaximase)(CTX-M酶))的成员,但在其他肠杆菌科(Enterobacteriaceae),以及在包括铜绿假单胞菌在内的非肠杆菌科物种中快速出现。该家族包括CTX-M-3酶、CTX-M-9酶、CTX-M-14酶和CTX-M-15酶。在一些具体实施方案中,用作本发明的试剂盒的靶标的CTX-M-15可以是蛋白_idAAL02127.1的大肠杆菌β-内酰胺酶CTX-M-15。在一些具体实施方案中,所述CTX-M-15蛋白可以包含由SEQ ID NO:77所示的核酸序列编码的氨基酸序列。在又一些另外的具体实施方案中,本发明的CTX-M-15蛋白可以包含SEQ ID NO:76所示的氨基酸序列。
根据一些实施方案,本发明的试剂盒或***的敏化元件中的CRISPR阵列的至少一个间隔区可以包含靶向以下中的至少一种的核酸序列:CTX-M-15的至少一个原始间隔区、NDM-1的至少一个原始间隔区和包含于裂解性噬菌体基因组内的至少一个核酸序列。
必须领会的是,包含本文前述的任何耐受性赋予基因的约10至约50个核苷酸、具体地10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、56、47、48、49或50个核苷酸、或更具体地约35个核苷酸的任何序列、子序列或片段,可以被用作原始间隔区,并且因此被用作本发明的敏化组分、并且特别地包含于其中的特定间隔区的靶标。在一些具体实施方案中,包含NDM-1和CTX-M-15基因以及特别地具有或包含分别由SEQ ID NO:74和77中的任一个所示的核酸序列的那些基因中的至少一种的约10至约50个核苷酸的任何序列、子序列或片段,可以被用作适当且有效的原始间隔区。在一些具体实施方案中,此类原始间隔区可以包含至少一个原始间隔区邻近基序(PAM)序列。在另外的具体实施方案中,此类PAM序列可以是AAA、AAC、AAG、AAT、CAG、GAA、GAC、GAG、TAA、TAC、TAG、AGA、AGC、AGG、GGG、TGG、ATA、ATC、ATG、ATT、CTG、GTG、TTG中的任一种。在又一些其它的实施方案中,此类PAM可以是AWG,其中“W”可以表示“A”或“T”中的任一种。又另外,在某些实施方案中,本发明的原始间隔区可以包含原始间隔区序列的5’末端处的至少一个所述PAM序列。
在又一些其它的具体且非限制性的实施方案中,本发明的CRISPR***,特别是其敏化组分可以包含以下的至少一种:靶向CTX-M-15的至少一个原始间隔区的至少一个间隔区。在更具体的实施方案中,此类原始间隔区可以包含如由SEQ ID NO:49、50和51(本文也分别称为C1、C2和C3)中任一个所示的核酸序列、靶向NDM-1的至少一个原始间隔区的至少一个间隔区,具体地此类原始间隔区可以包含如由SEQ ID NO:46、47和48(在本文中也分别被称为N1、N2和N3)中的任一个所示的核酸序列。
又另外,为本发明的试剂盒的选择组分的经遗传修饰的裂解性噬菌体可以包含以下中的至少一种的至少一个原始间隔区:(a)CTX-M-15的至少一个原始间隔区。在一些具体实施方案中,此类原始间隔区可包含由SEQ ID NO:49、50和51(在本文中也分别被称为C1、C2和C3)中的任一个所示的核酸序列。在又一些其它的实施方案中,经遗传修饰的裂解性噬菌体可以另外或替代性地包含(b)NDM-1的至少一个原始间隔区。在更具体的实施方案中,此类原始间隔区可包含由SEQ ID NO:46、47和48(在本文中也分别被称为N1、N2和N3)中的任一个所示的核酸序列。应注意的是,在某些实施方案中,包含由SEQ ID NO:46、47和48中的任一个所示的核酸序列的NDM-1的原始间隔区可以被分别由SEQ ID NO:37、38和39所示的间隔区靶向。又另外,包含由SEQ ID NO:49、50和51中任一个所示的核酸序列的CTX-M-15的原始间隔区可以被分别由SEQ ID NO:40、41和42所示的间隔区靶向。
在某些实施方案中,本发明的选择组分可以包含至少一种裂解性噬菌体。在一些实施方案中,本发明的此类裂解性噬菌体可以是T7样病毒和T4样病毒中的至少一种。在另外的具体实施方案中,本发明的试剂盒使用的裂解性噬菌体可以是T7样病毒,具体地至少一种肠杆菌噬菌体T7。噬菌体T7是具有裂解性生命周期的DNA病毒。这些噬菌体属于有尾噬菌体目(Caudovirales),短尾噬菌体科(Podoviridae)和T7样病毒属。
应领会的是,任何合适的裂解性噬菌体可以被本发明的试剂盒、***和方法使用。一个非限制性实例可以是为肌尾噬菌体科(Myoviridae)的成员的噬菌体。肌尾噬菌体科的成员是具有由颈部分开的头-尾的特征结构的非包膜噬菌体。肌尾噬菌体科基因组是长度为约33.6-170Kb的线性dsDNA,其编码在操纵子中转录的多达200-300个蛋白。肌尾噬菌体科的大多数是裂解性噬菌体,缺乏变成溶源性(变成整合到宿主细菌的基因组中或在细菌的细胞质中形成环状复制子)所需的基因,但许多溶源性物种也被知晓。肌尾噬菌体科已被分成四个亚科,其中与本上下文最相关的是Tevenvirinae亚科(也称Teequatrovirinae,分类学ID:1198136),除其他以外,T4样病毒噬菌体属于该亚科。
因此,在更具体的实施方案中,裂解性噬菌体可以是至少一种降解宿主DNA的噬菌体,例如Tevenvirinae噬菌体的任何成员。
Tevenvirinae的成员具有以以下为特征的相似形态:长度为约110nm的中等细长的头部、具有领(collar)的114nm长的尾部、具有短刺突的基板(base plate)和六个扭结的长尾丝。基于头部形态该亚科被分成两个属(即T4样病毒和Schizot4样病毒),并且在属内基于蛋白同源性,已将物种分成多个组。完整的Tevenvirinae谱系包括来自T4样病毒属和Schizot4样病毒属的噬菌体。
具体地,本发明涉及T4样病毒噬菌体,包括不动杆菌属噬菌体133(Acinetobacterphage 133)、气单胞菌属噬菌体25(Aeromonas phage 25)、气单胞菌属噬菌体31、气单胞菌属噬菌体44RR2.8t、气单胞菌属噬菌体65、气单胞菌属噬菌体Aeh1、肠杆菌噬菌体SV14、广义肠杆菌噬菌体T4、广义弧菌噬菌体nt-1、未分类的T4样病毒物种(根据ICTV)。更具体地,本发明涉及来自以下的噬菌体:广义肠杆菌噬菌体T4物种,包括肠杆菌噬菌体C16、肠杆菌噬菌体FSalpha、肠杆菌噬菌体MV 72、肠杆菌噬菌体MV SS、肠杆菌噬菌体MV12、肠杆菌噬菌体MV13、肠杆菌噬菌体MV14、肠杆菌噬菌体MV9、肠杆菌噬菌体PST、肠杆菌噬菌体T2、肠杆菌噬菌体T4、肠杆菌噬菌体T6亚种;并且还涉及来自未分类T4样病毒物种的噬菌体,包括不动杆菌噬菌体Ac42、不动杆菌噬菌体Acj61、不动杆菌噬菌体Acj9、不动杆菌噬菌体ZZ1、不动杆菌噬菌体Aes002、不动杆菌噬菌体Aes007、不动杆菌噬菌体Aes012、不动杆菌噬菌体Aes120、不动杆菌噬菌体Aes123、不动杆菌噬菌体Aes144、不动杆菌噬菌体Aes151、不动杆菌噬菌体Aes508、不动杆菌噬菌体Aes509、不动杆菌噬菌体Aes512、不动杆菌噬菌体Aes516、不动杆菌噬菌体Aes517、不动杆菌噬菌体CC2、不动杆菌噬菌体phiAS4、不动杆菌噬菌体phiAS5、不动杆菌噬菌体PX29、伯克氏菌噬菌体42(Burkholderia phage 42)、柠檬酸杆菌噬菌体Miller(Citrobacter phage Miller)、阪崎肠杆菌噬菌体vB_CsaM_GAP161(Cronobacter phage vB_CsaM_GAP161)、噬蓝藻体2B096(Cyanophage 2B096)、噬蓝藻体2Bnp、噬蓝藻体2Gdp、噬蓝藻体4B092、噬蓝藻体4B09p、噬蓝藻体5Bd2、噬蓝藻体5Bnp、噬蓝藻体6Bnp、噬蓝藻体7E02p、噬蓝藻体7G09p、噬蓝藻体7Gmp、噬蓝藻体8B026、噬蓝藻体8B092、噬蓝藻体8G092、噬蓝藻体P-TIM3、噬蓝藻体S-TIM4、肠杆菌噬菌体1、肠杆菌噬菌体Ac3、肠杆菌噬菌体AR1、肠杆菌噬菌体Baker、肠杆菌噬菌体Bp7、肠杆菌噬菌体CC31、肠杆菌噬菌体CEV1、肠杆菌噬菌体DD VI、肠杆菌噬菌体ELY-1、肠杆菌噬菌体GEC-3S、肠杆菌噬菌体HX01、肠杆菌噬菌体IME08、肠杆菌噬菌体ime09、肠杆菌噬菌体JS、肠杆菌噬菌体JS10、肠杆菌噬菌体JS98-C3、肠杆菌噬菌体JSE、肠杆菌噬菌体K3、肠杆菌噬菌体KC69、肠杆菌噬菌体LZ1、肠杆菌噬菌体LZ10、肠杆菌噬菌体LZ2、肠杆菌噬菌体LZ3、肠杆菌噬菌体LZ4、肠杆菌噬菌体LZ5、肠杆菌噬菌体LZ6、肠杆菌噬菌体LZ7、肠杆菌噬菌体LZ8、肠杆菌噬菌体LZ9、肠杆菌噬菌体M1、肠杆菌噬菌体Mi、肠杆菌噬菌体MV BS、肠杆菌噬菌体nvv1、肠杆菌噬菌体Ox2、肠杆菌噬菌体Phi1、肠杆菌噬菌体Pol、肠杆菌噬菌体RB1、肠杆菌噬菌体RB10、肠杆菌噬菌体RB14、肠杆菌噬菌体RB15、肠杆菌噬菌体RB16、肠杆菌噬菌体RB18、肠杆菌噬菌体RB2、肠杆菌噬菌体RB21、肠杆菌噬菌体RB23、肠杆菌噬菌体RB25、肠杆菌噬菌体RB26、肠杆菌噬菌体RB27、肠杆菌噬菌体RB3、肠杆菌噬菌体RB30、肠杆菌噬菌体RB32、肠杆菌噬菌体RB33、肠杆菌噬菌体RB42、肠杆菌噬菌体RB43、肠杆菌噬菌体RB49、肠杆菌噬菌体RB5、肠杆菌噬菌体RB51、肠杆菌噬菌体RB6、肠杆菌噬菌体RB61、肠杆菌噬菌体RB62、肠杆菌噬菌体RB68、肠杆菌噬菌体RB69、肠杆菌噬菌体RB70、肠杆菌噬菌体RB8、肠杆菌噬菌体RB9、肠杆菌噬菌体SC1、肠杆菌噬菌体SCI、肠杆菌噬菌体SV76、肠杆菌噬菌体TuIa、肠杆菌噬菌体TuIb、肠杆菌噬菌体U4、肠杆菌噬菌体U5、肠杆菌噬菌体vB_EcoM-VR7、肠杆菌噬菌体vB_EcoM_ACG-C40、埃希氏菌噬菌体e11/2(Escherichia phage e11/2)、埃希氏菌噬菌体IME08、埃希氏菌噬菌体Lw1、埃希氏菌噬菌体LZ、埃希氏菌噬菌体LZ1、埃希氏菌噬菌体LZ9、埃希氏菌噬菌体vB_EcoM_JS09、埃希氏菌噬菌体vB_EcoM_PhAPEC2、埃希氏菌噬菌体wV7、克雷伯氏菌噬菌体KP15(Klebsiella phage KP15)、克雷伯氏菌噬菌体KP27、噬菌体LZ、噬菌体LZ11、原绿球藻噬菌体P-SSM2(Prochlorococcus phage P-SSM2)、原绿球藻噬菌体P-SSM4、沙门氏菌噬菌体S16(Salmonella phage S16)、沙雷氏菌噬菌体PS2(Serratia phage PS2)、志贺氏杆菌噬菌体Shfl2(Shigella phage Shfl2)、志贺氏杆菌噬菌体SP18、中华根瘤菌噬菌体phiM12(Sinorhizobium phage phiM12)、寡养单胞菌噬菌体IME13(Stenotrophomonasphage IME13)、寡养单胞菌噬菌体Smp14、聚球藻噬菌体metaG-MbCM1(Synechococcusphage metaG-MbCM1)、聚球藻噬菌体S-MbCM100、聚球藻噬菌体S-MbCM6、聚球藻噬菌体S-MbCM7、聚球藻噬菌体S-PM2、聚球藻噬菌体S-RSM4、聚球藻噬菌体syn9和耶尔森氏菌噬菌体PST亚种(Yersinia phage PST subspecies)(根据ICTV)。
应领会的是,本发明的选择组分可以包含感染大肠杆菌的任何裂解性噬菌体。在又一些其他的实施方案中,此类裂解性噬菌体可以是靶向任何致病性细菌的任何噬菌体。
如以上所述,本发明的选择可以是编码如本文前述的细菌杀伤者的DNA序列和至少一个原始间隔区。在又一些其他的具体且非限制性的实施方案中,选择组分可以包含至少一种裂解性噬菌体,特别地经遗传修饰的裂解性噬菌体。在一些具体实施方案中,此类裂解性噬菌体可以是至少一种T7噬菌体。在一些特别且非限制性的实施方案中,用作本发明的试剂盒中的选择组分的裂解性噬菌体可以是经遗传修饰的T7噬菌体,所述经遗传修饰的T7噬菌体包含NDM-1的一个原始间隔区,如由SEQ ID NO:46所示的N1,以及CTX-M-15的原始间隔区,如由SEQ ID NO:49所示的C1,所述噬菌体在本文被称为T7-N1C1。在一些实施方案中,重组的或经遗传修饰的裂解性噬菌体T7-N1C1可以包含如由SEQ ID NO:57所示的核酸序列。在又另一个实施方案中,本发明的选择元件可以是经遗传修饰的裂解性噬菌体,特别地包含NDM-1的两个原始间隔区,如分别由SEQ ID NO:46和47所示的N1和N2的T7噬菌体,所述噬菌体在本文被称为T7-N1N2。在一些实施方案中,重组的或经遗传修饰的裂解性噬菌体T7-N1N2可以包含如由SEQ ID NO:55所示的核酸序列。又另外,本发明的选择元件可以是经遗传修饰的裂解性噬菌体,特别地包含CTX-M-15的两个原始间隔区,例如如分别由SEQ IDNO:50和49所示的C2和C1的T7噬菌体,所述噬菌体在本文被称为T7C2C1。在一些实施方案中,重组的或经遗传修饰的裂解性噬菌体T7-C2C1可以包含如由SEQ ID NO:56所示的核酸序列。在又另一个实施方案中,本发明的选择元件可以是经遗传修饰的裂解性噬菌体,特别地包含CTX-M-15的一个原始间隔区,如由SEQ ID NO:50所示的C2,以及NDM-1的原始间隔区,如由SEQ ID NO:47所示的N2的T7噬菌体,所述噬菌体在本文被称为T7-C2N2。在一些实施方案中,重组的或经遗传修饰的裂解性噬菌体T7-C2N2可以包含如由SEQ ID NO:58所示的核酸序列。
在一些可选的实施方案中,本发明的试剂盒或***的选择组分可以是非工程化的噬菌体。相应地,本发明的敏化组分的CRISPR阵列应被设计成靶向此类噬菌体。因此,至少一个CRISPR间隔区必须与包含于所述裂解性噬菌体的必需基因内的核酸序列足够互补。
因此,在一些实施方案中,至少一个CRISPR间隔区靶向包含于所述裂解性噬菌体的必需基因内的核酸序列。在一些具体实施方案中,此类裂解性噬菌体可以是T7样病毒和T4样病毒中的至少一种。更具体的实施方案涉及肠杆菌噬菌体T7和肠杆菌噬菌体T4中的至少一种。在更具体的实施方案中,被用作本发明的试剂盒或***的选择组分的裂解性噬菌体可以是T4和T7中的至少一种。在此类具体的情况中,CRISPR阵列可以包含靶向并识别这些噬菌体的核酸序列的间隔区。
在一些具体且非限制性的实施方案中,此类间隔区可以包含靶向T7噬菌体中的原始间隔区的间隔区。更具体的实施方案涉及包含SEQ ID NO.43、44和45中的任一个的间隔区。在仍更具体的实施方案中,此类间隔区靶向分别包含SEQ ID NO.52、53和54中的任一个的核酸序列的原始间隔区。在更具体的实施方案中,这些原始间隔区被包含在本发明的裂解性噬菌体内。
应理解的是,作为本发明的另外的方面,本发明还包括如本文前述的任一种经遗传修饰的或工程化的裂解性噬菌体。
根据一些实施方案,用于本发明的试剂盒或***的敏化组分的噬菌体可以是λ噬菌体。在更具体的实施方案中,此类噬菌体可以是λ温和性噬菌体。
在更具体的实施方案中,温和性噬菌体的实例可以是具有如由SEQ ID NO.36(NCBI参考序列:NC_001416.1)所示的核酸序列的λ噬菌体。
例如,用于本发明的试剂盒和***的噬菌体包括但不限于能够感染任何医院细菌的裂解性或温和性的那些噬菌体。
再例如,噬菌体包括但不限于能够感染以下细菌的那些噬菌体(裂解性的或温和性的):包括但不限于变形菌门(proteobacteria)、厚壁菌门(Firmicutes)和拟杆菌门(Bacteroidetes)中的任一种。
又例如,噬菌体包括但不限于能够感染属于以下属的细菌的那些噬菌体:大肠杆菌、假单胞菌属、链球菌属、葡萄球菌属、梭菌属、肠球菌属、克雷伯氏菌属、不动杆菌属和肠杆菌属。
感染其他生物体并且特别地以上所列的ESKAPE生物体的其他裂解性噬菌体也可以被用作试剂盒中靶向这些生物体的选择剂。选择剂还可以是编码通过噬菌体壳体或另一种方法注射的细菌杀灭剂的DNA。在又一些其他的实施方案中,感染其他生物体并且特别地以上所列的ESKAPE生物体的其他温和性噬菌体也可以被用作试剂盒中靶向这些生物体的敏化组分。更具体地,应领会的是,任何噬菌体,无论是裂解性噬菌体或温和性噬菌体,可适用于本发明的目的,特别地作为本发明的选择组分和敏化组分。特别感兴趣的是,特异性地靶向任何“ESKAPE”病原体的噬菌体。如本文使用的,这些病原体包括但不限于屎肠球菌、金黄色葡萄球菌、克雷伯氏肺炎杆菌、鲍曼不动杆菌、铜绿假单胞菌、和肠杆菌属。
略举数例,裂解性或温和性的这些噬菌体可以包括但不限于对金黄色葡萄球菌特异的噬菌体,特别地以下中的至少一种:vB_Sau.My D1、vB_Sau My 1140、vB_SauM 142、Sb-1、vB_SauM 232、vB_SauS 175、vB_SauM 50、vB_Sau 51/18、vB_Sau.M.1、vB_Sau.M.2、vB_Sau.S.3、vB_Sau.M.4、vB_Sau.S.5、vB_Sau.S.6、vB_Sau.M.7、vB_Sau.S.8、vB_Sau.S.9、vB_Sau.M.10、vB_Sau.M.11。在又一些另外的实施方案中,对克雷伯氏肺炎杆菌特异的裂解性或温和性的噬菌体也可以适用于本发明。在更具体的实施方案中,这些噬菌体可以包括vB_Klp 1、vB_Klp 2、vB_Klp.M.1、vB_Klp.M.2、vB_Klp.P.3、vB_Klp.M.4、vB_Klp.M.5、vB_Klp.M.6、vB_Klp.7、vB_Klp.M.8、vB_Klp.M.9、vB_Klp.M.10、vB_Klp.P.11、vB_Klp.P.12、vB_Klp.13、vB_Klp.P.14、vB_Klp.15、vB_Klp.M.16。又另外,在某些实施方案中,对铜绿假单胞菌特异的噬菌体可以适用于本发明的选择组分和/或敏化组分或使用这些组分的任何试剂盒或方法。此类噬菌体的非限制性实例包括但不限于:vB_Psa.Shis 1、vB_PsaM PAT5、vB_PsaP PAT14、vB_PsaM PAT13、vB_PsaM ST-1、vB_Psa ст 27、vB_Psa ст 44K、vB_Psa ст44 M、vB_Psa 16、vB_Psa Ps-1、vB_Psa 8-40、vB_Psa 35K、vB_Psa 44、vB_Psa 1、vB_Psa9、vB_Psa 6-131M、vB_Psa ст 37、vB_Psa ст 45S、vB_Psa ст 45 M、vB_Psa ст 16 MU、vB_Psa ст 41、vB_Psa ст 44 MU、vB_Psa ст 43、vB_Psa ст 11 K、vB_Psa 1638、vB_Psa Ps-2、vB_Psa 35 CT、vB_Psa 35 M、vB_Psa S.Ch.L、vB_Psa R1、vB_Psa SAN、vB_Psa L24、vB_Psa F8、vB_Psa BT-4、vB_Psa BT-2(8)、vB_Psa BT-1(10)、vB_Psa BT-4-16、vB_Psa BT-5、vB_Psa F-2、vB_Psa B-CF、vB_Psa Ph7/32、vB_Psa Ph7/63、vB_Psa Ph5/32、vB_Psa Ph8/16、vB_Psa Ph11/1、vB_Psa、vB_Psa 3、vB_Psa 4、vB_Psa 5、vB_Psa 6、vB_Psa 7、vB_Psa.P.15、vB_Psa.17、vB_Psa.M.18、vB_Psa.28、vB_Psa.M.2、vB_Psa.M 3、vB_Psa.23、vB_Psa.P.8、vB_Psa.M.PST7、vB_Psa.M.C5、vB_Psa.M.D1038。在另外的实施方案中,对鲍曼不动杆菌特异的噬菌体可以适用于本发明。此类裂解性或温和性噬菌体可以包括以下中的任一种:vB_Aba B37、vB_Aba G865、vB_Aba G866、vB_Aba U7、vB_Aba U8、vB_Acb 1、vB_Acb2。在又一些另外的实施方案中,对肠杆菌属特异的噬菌体可以被用于本发明的试剂盒和方法,特别地vB_Eb 1、vB_Eb 2、vB_Eb 3、vB_Eb 4噬菌体中的任一种。在又一些另外的实施方案中,可使用粪肠球菌(enterococcus faecalis)特异性噬菌体。若干非限制性实例包括vB_Ec 1、vB_Ec 2、vB_Enf.S.4、vB_Enf.S.5噬菌体中的任一种。
在又一些另外的实施方案中,特异性地感染炭疽杆菌(Bacillus anthracis)的噬菌体也可适用于本发明,例如vB_BaK1、vB_BaK2、vB_BaK6、vB_BaK7、vB_BaK9、vB_BaK10、vB_BaK11、vB_BaK12、vB_BaGa4、vB_BaGa5、vB_BaGa6。又另外,对流产布鲁氏菌(Brucellaabortus)特异的噬菌体,例如Tb、vB_BraP IV、vB_BraP V、vB_BraP VI、vB_BraP VII、vB_BraP VIII、vB_BraP IX、vB_BraP X、vB_BraP XII、vB_BraP 12(b)、vB_BraP BA、vB_BraP544、vB_BraP 141я、vB_BraP 141m、vB_BraP 19я、vB_BraP 19m、vB_BraP 9;对犬种布鲁氏菌(Brucella canis)特异的噬菌体,特别地vB_BrcP 1066;对Clostridium perfigenesA.B.C.D.E特异的噬菌体,例如vB_CpPI、vB_CpII、vB_CpIII、vB_CpIV;对普通脱硫弧菌(Desulfovibrio vulgaris)特异的噬菌体,特别地vB_DvRCH1/M1、vB_DvH/P15、vB_DvH/M15;对粪肠球菌特异的那些噬菌体,特别地vB_Ec1、vB_Ec 2、vB_Enf.S.4、vB_Enf.S.5;对大肠杆菌特异的噬菌体,特别地vB_Eschc.pod 9、vB_Eschc.Pod 4、vB_Eschc.Shis 7、vB_Eschc.Shis 14、vB_Eschc.Shis 5、vB_Eschc.My 2、PhI-1、PhI-2、PhI3、PhI4、PhI5、T2、T4、T5、DDII、DDVI、DDVII、vB_Eschc.Shis 7/20、vB_Eschc.Shis 1161、vB_Eschc.Shis 8963、vB_Eschc 4、vB_Eschc 11/24、vB_Eschc.Shis 18、vB_Shis 3/14、vB_Sau A、vB_Shis G、vB_Eschc.Shis W、vB_Shis GE25、vB_Eschc.Shis 8962、vB_Eschc 90/25、vB_Eschc 5/25、vB_Eschc 12/25、vB_Eschc H、T3、T6、T7、vB_Eschc 4、vB_Eschc 121、vB_Eschc BaK2、vB_Eschc L7-2、vB_Eschc L7-3、vB_Eschc L7-7、vB_Eschc L7-8、vB_Eschc L7-9、vB_EschcL7-10、vB_EschcФ8、vB_Eschc.Shis 20、vB_Eschc.Shis 25、vB_Eschc.Shis 27、vB_Eschc.Shis MY、vB_Eschc 11、vB_Eschc 12、vB_Eschc13、vB_Eschc 17、vB_Eschc 18、vB_Eschc 19、vB_Eschc 20、vB_Eschc 21、vB_Eschc 22、vB_Eschc 23、vB_Eschc 24、vB_Eschc25、vB_Eschc 26、vB_Eschc 27、vB_Eschc 28、vB_Eschc 29、vB_Eschc 30、vB_Eschc 31、vB_Eschc 32、vB_Eschc 34、vB_Eschc 35、vB_Eschc 37、vB_Eschc 38、vB_Eschc 39、vB_Eschc 44、vB_Eschc 45、vB_Eschc 46、vB_E.coli.M.1、vB_E.coli.M.2、vB_E.coli.P.3、vB_E.coli.P.4、vB_E.coli.P.5、vB_E.coli.P.6、vB_E.coli.P.7、vB_E.coli.P.8;对副伤寒沙门菌(Salmonella paratyphi)特异的噬菌体,特别地vB_SPB Diag 1、vB_SPB Diag 2、vB_SPB Diag 3、vB_SPB Diag 3b、vB_SPB Diag Jersey、vB_SPB Diag Beecles、vB_SPBDiag Taunton、vB_SPB DiagB.A.O.R、vB_SPB Diag Dundee、vB_SPBDiagWorksop、vB_SPBDiag E、vB_SPB Diag D、vB_SPB Diag F、vB_SPB Diag H;对Salmonella typhiabdominalis特异的,vB_Sta Diag A、vB_Sta Diag B1、vB_Sta Diag B2、vB_Sta Diag C1、vB_Sta Diag C2、vB_Sta Diag C3、vB_Sta Diag C4、vB_Sta Diag C5、vB_Sta Diag C6、vB_Sta Diag C7、vB_Sta Diag D1、vB_Sta Diag D2、vB_Sta Diag D4、vB_Sta Diag D5、vB_Sta Diag D6、vB_Sta Diag D7、vB_Sta Diag D8、vB_Sta Diag E1、vB_Sta Diag E2、vB_Sta Diag E5、vB_Sta Diag E10、vB_Sta Diag F1、vB_Sta Diag F2、vB_Sta Diag F5、vB_Sta Diag G、vB_Sta Diag H、vB_Sta Diag J1、vB_Sta Diag J2、vB_Sta Diag K、vB_Sta Diag L1、vB_Sta Diag L2、vB_Sta Diag M1、vB_Sta Diag M2、vB_Sta Diag N、vB_StaDiag O、vB_Sta Diag T、vB_Sta Diag Vi1、vB_Sta Diag27、vB_Sta Diag 28、vB_StaDiag38、vB_Sta Diag 39、vB_Sta Diag 40、vB_Sta Diag 42、vB_Sta Diag 46;对鼠伤寒沙门氏菌(Salmonella typhimurium)特异的,特别地vB_Stm.My 11、vB_Stm.My 28、vB_Stm.Shis 13、vB_Stm.My 760、vB_Stm.Shis 1、IRA、vB_Stm 16、vB_Stm 17、vB_Stm 18、vB_Stm 19、vB_Stm 20、vB_Stm 21、vB_Stm 29、vB_Stm 512、vB_Stm Diag I、vB_Stm Diag II、vB_Stm Diag III、vB_Stm Diag IV、vB_Stm Diag V、vB_Stm Diag VI、vB_Stm Diag VII、vB_Stm Diag VIII、vB_Stm Diag IX、vB_Stm Diag X、vB_Stm Diag XI、vB_Stm Diag XII、vB_Stm Diag XIII、vB_Stm Diag XIV、vB_Stm Diag XV、vB_Stm Diag XVI、vB_Stm DiagXVII、vB_Stm Diag XVIII、vB_Stm Diag XIX、vB_Stm Diag XX、vB_Stm Diag XXI、vB_StmDiag 1、vB_Stm Diag2、vB_Stm Diag 3、vB_Stm Diag 4、vB_Stm Diag 5、vB_Stm Diag 6、vB_Stm Diag 7、vB_Stm Diag 8、vB_Stm Diag 9、vB_Stm Diag 10、vB_Stm Diag 11、vB_Stm Diag 12、vB_Stm Diag 13、vB_Stm Diag 14、vB_Stm Diag 15、vB_Stm Diag 16、vB_Stm Diag 17、vB_Stm Diag 18、vB_Stm Diag 19、vB_Stm Diag 20、vB_Stm Diag 21、vB_Stm Diag 22、vB_Stm Diag 23、vB_Stm Diag 24、vB_Stm Diag 25、vB_Stm Diag 26、vB_Stm Diag 27、vB_Stm Diag 28、vB_Stm Diag 29、vB_Stm Diag 30、vB_Stm Diag 31、vB_Stm Diag 32、vB_Stm Diag 33、vB_Stm Diag 34、vB_Stm Diag 35、vB_Stm Diag 36、vB_Stm Diag 37、vB_Stm Diag 38、vB_Stm Diag 39、vB_Stm Diag 40、vB_Stm Diag 41、vB_Stm Diag 42、vB_Stm Diag 43、vB_Stm Diag 44、vB_Stm Diag 45、vB_Stm Diag 46、vB_Stm Diag 47、vB_Stm Diag 48、vB_Stm Diag 49、vB_Stm Diag 50、vB_Stm Diag 51、vB_Stm Diag 52、vB_Stm Diag 53、vB_Stm Diag 54、vB_Stm Diag 55、vB_Stm Diag 56、vB_Stm Diag 57、vB_Stm Diag 58、vB_Stm Diag 59、vB_Stm Diag 60、vB_Stm Diag 61、vB_Stm Diag 62、vB_Stm Diag 63、vB_Stm Diag 64、vB_Stm Diag 65、vB_Stm.P.1、vB_Stm.P.2、vB_Stm.P.3、vB_Stm.P.4;对宋内志贺氏菌(Shigella sonnei)特异的,特别地vB_Shs.Pod3、vB_Eschc.Shis 7/20、vB_Eschc.Shis 1161、vB_Eschc.Shis 8963、vB_Eschc.Shis 8962、vB_Shis GE25、vB_Eschc.Shis W、vB_Shis G、vB_Shis3/14、vB_Eschc.Shis 18、vB_Shis 1188、vB_Shis 1188Г、vB_Shis 1188Y、vB_Shis 1188X、vB_Shis5514、vB_Shis L7-2、vB_Shis L7-4、vB_Shis L7-5、vB_Shis L7-11、vB_Shis K3、vB_ShisTuI A、vB_Shis Ox2、vB_Shis SCL、vB_Shis Bak C2、vB_Shis 4/1188、vB_Shis 8962、vB_Shis 8963、vB_Shis XIV、vB_Shis 116、vB_Shis 106/8、vB_Shis 20、vB_Shis 90/25、vB_Shis87/25、vB_Shis 16/25、vB_Shs 7、vB_Shs 38、vB_Shs 92、vB_Shs 1391、vB_Shs.P.1、vB_Shs.P.2、vB_Shs.P.3。还应领会的是,对任何致病性细菌并且特别是对本文公开的任何致病性细菌特异的任何裂解性或温和性噬菌体,可以适用于本发明的试剂盒和方法或其任何组分,特别地选择组分和敏化组分。
在原核生物中,CRISPR***已经进化以通过靶向外源DNA或RNA而针对噬菌体攻击和不期望的质粒复制保护(16、20、21)。大肠杆菌CRISPR-Cas***基于存在于细菌基因组内的重复之间的、被称为间隔区的短的同源DNA序列靶向DNA分子。这些间隔区将CRISPR相关(Cas)蛋白引导至外源DNA内被称为原始间隔区的匹配(和/或互补)序列,所述原始间隔区随后被裂解。间隔区可以被合理地设计为靶向任何DNA序列,包括编码耐受性基因和裂解性噬菌体的那些。这允许将有益于细菌的特征(即赋予噬菌体耐受性的元件)与逆转药物耐受性的特征(即消除耐受性基因的元件)在遗传上连锁。该遗传连锁使得能够通过将裂解性噬菌体用作选择剂来选择敏化的细菌群体。携带对裂解性噬菌体的防御和敏化结构两者的细菌在处理的表面上存活,而缺乏这些因子的那些被裂解性噬菌体杀死。本发明的整合的结构被设计为不仅主动地根除存在的耐受性基因还消除基因细菌之间的水平转移。
在一些另外的实施方案中,温和性噬菌体还包含编码CRISPR前导序列的核酸序列。
如以上说明的,本发明的试剂盒的敏化组分可以包含至少一个Cas基因和CRISPR***。关于CRISPR***,如本领域技术人员将认知的,天然存在的CRISPR基因座的结构包括很多通常被称为“重复”的短重复序列。重复成簇存在并且在单个CRISPR基因座中已鉴定到最多达249个重复,并且重复通常被称为“间隔区”的介于中间的独特序列规则地间隔开。通常,CRISPR重复的长度从约24到47个碱基对(bp)变化并且是部分回文的。在一些实施方案中,包含于本发明的试剂盒的敏化组分中的CRISPR重复可以包括具有约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60或更多个bp的重复。重复通常以重复单元的聚簇(每个基因组多达约20个或更多个)排列。间隔区位于两个重复之间,并且通常每个间隔区具有长度从约20或更少至72或更多个bp的独特序列。因此,在某些实施方案中,本发明的敏化组分中使用的CRISPR间隔区各自可以包含在20至72个之间的核苷酸(nt)。更具体地,约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72或更多。很多间隔区与已知的噬菌体序列相同或与已知的噬菌体序列具有高度的同源性。除了重复和间隔区之外,CRISPR基因座还包括前导序列以及经常至少一个相关的Cas基因,特别地2个至6个或更多个的一组相关Cas基因。前导序列通常是直接邻接第一个重复的5’末端的最多达550bp的富含AT的序列。新的重复-间隔区单元被认为几乎总是被添加到前导和第一重复之间的CRISPR基因座。
如以上说明的,被用作本发明的试剂盒或***中的敏化元件的工程化的温和性噬菌体包含CRISPR(成簇、规则间隔的短回文重复)阵列,CRISPR阵列连同cas基因形成CRISPR***。如本文使用的,也被称为SPIDR(Spacer Interspersed Direct Repeats,间隔区散在正向重复)的CRISPR阵列组成最近描述的通常对特定的细菌物种特异的DNA基因座家族。CRISPR阵列是最先在大肠杆菌中被认知的一类独特的散在短序列重复(SSR)。在随后的几年,在结核分枝杆菌(Mycobacterium tuberculosis)、地中海富盐菌(Haloferaxmediterranei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、海栖热袍菌(Thermotoga maritima)和其他细菌以及古菌中发现了相似的CRISPR阵列。应理解的是,本发明构思了任何已知的CRISPR***,特别和本文公开的任何CRISPR***的用途。
如本文使用的,术语“CRISPR阵列多核苷酸”指包含足够的CRISPR重复以使得其能够下调(例如消除)互补基因的DNA或RNA区段。
根据一个实施方案,CRISPR阵列多核苷酸包含至少2个重复,所述至少2个重复,在它们之间具有1个间隔区。在又一些另外的实施方案中,本发明的敏化组分的CRISPR阵列可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个,特别是110、120、130、140、150、160、170、180、190、200或更多个间隔区。还应理解的是,本发明的敏化组分的间隔区可以是相同的或不同的间隔区。在更多的实施方案中,这些间隔区可以靶向相同的或不同的靶细菌病原体基因。在又一些其他的实施方案中,此类间隔区可以靶向至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个致病性细菌基因。
在示例性实施方案中,CRISPR阵列多核苷酸包含所有的CRISPR重复,以第一个CRISPR重复的第一个核苷酸开始并且以最后一个(末端)重复的最后一个核苷酸结束。
对于CRISPR***并且因此CRISPR阵列的分析和鉴定,多种计算机软件和网络资源是可用的。这些工具包括:用于CRISPR检测的软件,诸如PILERCR、CRISPR RecognitionTool和CRISPRFinder;预分析的CRISPR的在线资源库,诸如CRISPRdb;以及用于浏览微生物基因组中的CRISPR的工具,诸如Pygram。
已显示,分别在约40%和90%的测序的细菌和古菌基因组中发现了CRISPR***,并且本发明的发明人构思了来自所有此类CRISPR***的CRISPR阵列的用途。
根据一个实施方案,除了被替换以下调(例如消除)感兴趣的基因的间隔区(或多个间隔区)之外,CRISPR阵列多核苷酸包含与天然存在的(野生型)序列100%同源的核酸序列。
根据另一个实施方案,除了被替换以下调感兴趣的基因的间隔区(或多个间隔区)之外,CRISPR阵列多核苷酸包含与天然存在的(野生型)序列99%同源的核酸序列。在又一些其他的实施方案中,除了被替换以下调或消除感兴趣的基因并且特别地由其编码的RNA的间隔区(或多个间隔区)之外,CRISPR阵列多核苷酸包含与天然存在的(野生型)序列98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%同源的核酸序列。
如本文使用的,术语“间隔区”指在CRISPR阵列的多个短正向重复(即CRISPR重复)之间发现的非重复性间隔区序列。在一些优选的实施方案中,CRISPR间隔区位于两个相同的CRISPR重复之间。在一些实施方案中,CRISPR间隔区通过在位于两个CRISPR重复之间的DNA链段(DNA stretch)的序列分析来鉴定。
在一些优选的实施方案中,CRISPR间隔区天然地存在于两个相同的、短回文正向重复之间。应注意的是,本发明的间隔区可以位于或存在于两个相同或不相同的重复之间。
术语“基因的部分”或“包含于基因内的核酸序列”涉及来自基因的编码或非编码区域的部分。
如本文使用的术语“足够互补”指间隔区的序列充分互补以使得其能够下调基因的表达。
根据本发明该方面的一个实施方案,与基因的部分并且特别地由所述基因编码的RNA足够互补的序列是如下序列:所述序列与该基因至少约70%、约75%、约80%、约85%或约90%相同,或者至少约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%相同。在一些优选的实施方案中,该序列与基因100%互补。
由CRISPR***编码的靶向RNA可以是CRISPR RNA(crRNA)。由CRISPR间隔区编码的靶向RNA的序列受到对其的如下要求的限制,要指向(即,具有与其相同的区段或与其具有互补性)细菌的致病性基因中的在本文中也被称为“原始间隔区”的靶序列,除此之外,由CRISPR间隔区编码的靶向RNA的序列并不特别地受限制。此类原始间隔区包含如下核酸序列:与由包含于本发明的敏化***内的CRISPR间隔区编码的靶向RNA具有足够的互补性。
在一些实施方案中,crRNA包含以下或由以下组成:20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、30nt、31nt、32nt、33nt、34nt、35nt、36nt、37nt、38nt、39nt或40nt的间隔区(靶向)序列,接着是19-36nt的重复序列。在具体且非限制性的实施方案中,靶向间隔区将包含靶向代表性间隔区序列在本文中被说明的任一基因的区段或由其组成。
应注意的是,在一些实施方案中,本发明的CRISPR***的间隔区可以编码靶向RNA。“靶向RNA”是如下RNA:当从编码其的CRISPR***的部分转录时,至少包含与细菌染色体中的DNA序列或靶向的细菌内的质粒上的序列相同(除了在RNA的情况中将T替换为U)或互补(并且因此“靶向”)的RNA序列的区段。本公开内容的CRISPR***可以编码多于1个靶向RNA,并且靶向RNA可以指向细菌染色体或质粒或其组合中的一个或更多个序列。靶向RNA的序列因此指示了被本发明的敏化元件所携带的CRISPR***,特别地本发明的修饰的噬菌体靶向何处。
本发明的经修饰的CRISPR阵列还可以包含编码一个或更多个Cas蛋白的核酸序列(即cas基因)。
如本文使用的,术语“cas基因”指通常与编码Cas蛋白的侧翼CRISPR阵列偶联、相关联或靠近,或在编码Cas蛋白的侧翼CRISPR阵列附近的基因。
CRISPR阵列通常被发现于被命名为cas1至cas4的4个基因附近。这些基因的最常见排列是cas3-cas4-cas1-cas2。Cas3蛋白似乎是解旋酶,而Cas4类似外切核酸酶的RecB家族并含有半胱氨酸富集基序,暗示DNA结合。cas1基因(NCBI COG数据库代码:COG1518)是特别值得注意的,因为它充当了CRISPR***的通用标志物(连接至除了Pyrococcus abyssii的CRISPR***之外的所有CRISPR***)。cas2仍尚待表征。cas1-4通常以其与CRISPR基因座极为接近以及其跨细菌和古菌物种的广泛分布为特征。尽管并非所有的cas1-4基因与所有的CRISPR基因座相关联,但在多种亚型中它们全部被发现。
另外,在很多细菌物种中,存在与CRISPR结构相关联的另一种三基因簇,在本文中被称为cas IB、cas5和cas6。在一些实施方案中,cas基因选自cas1、cas2、cas3、cas4、casIb、cas5和/或cas6;其片段、变体、同源物和/或衍生物。在一些另外的实施方案中,使用两种或更多种cas基因的组合,包括任何合适的组合。
在一些实施方案中,cas基因包括DNA,而在一些其他的实施方案中,cas包括RNA。在一些实施方案中,核酸是基因组来源的,而在其他的实施方案中,其是合成来源或重组来源的。在一些实施方案中,cas基因是双链或单链的,代表正义链或反义链或其组合。
在一些实施方案中,优选cas基因是最邻近CRISPR基因座的5’末端处的前导序列或第一个CRISPR重复的cas基因,诸如cas4或cas6。
将领会到,一组给定的cas基因或蛋白通常与特定的CRISPR阵列内的给定重复序列相关联。因此,cas基因似乎对给定的DNA重复特异(即,cas基因和重复序列形成功能对)。
又另外,阐明了CRISPR–Cas***的三个主要类型:I型、II型和III型。
I型CRISPR-Cas***含有cas3基因,该cas3基因编码具有单独的解旋酶和DNA酶活性的大蛋白,此外还含有编码可能形成具有不同组成的Cascade样复合体的蛋白的基因。这些复合体含有已被包含在重复相关神秘蛋白(RAMP)中的很多蛋白,该重复相关神秘蛋白形成大的Cas蛋白超家族,并且含有至少一个RNA识别基序(RRM,也被称为铁氧还蛋白-折叠结构域)和特有的富含甘氨酸的环。基于广泛的序列和结构比较,RAMP超家族包括Cas5大家族和Cas6大家族。此外,Cas7(COG1857)蛋白代表了RAMP超家族内的另一个独特的大家族。
I型CRISPR-Cas***似乎靶向其中靶裂解由Cas3的HD核酸酶结构域催化的DNA。由于在若干种I型CRISPR-Cas***中,Cas4的RecB核酸酶结构域被融合至Cas1,Cas4反而能够潜在地在间隔区获得中发挥作用。应注意的是,任何I型CRISPR-Cas***,特别是I-A、B、C、D、E和F型中的任一种可以适用于本发明。
II型CRISPR-Cas***包括“HNH”型***(链球菌属样;对于脑膜炎奈瑟氏菌血清组A菌株Z2491或CASS4,也被称为Nmeni亚型),其中除了普遍存在的Cas1和Cas2之外,一种单个的、很大的蛋白Cas9似乎足够生成crRNA并裂解靶DNA。Cas9包含至少两个核酸酶结构域,靠近氨基末端的RuvC-样核酸酶结构域和在蛋白中部的HNH(或McrA样)核酸酶结构域,但是这些结构域的功能仍待阐明。然而,由于HNH核酸酶结构域在限制性酶中是丰富的,并且拥有内切核酸酶活性,其似乎对靶裂解负责。
II型***通过独特的机制裂解前crRNA(pre-crRNA),所述机制涉及在tracrRNA和前crRNA中的重复的一部分之间形成双链体;随后在该重复区域中发生前crRNA加工途径中的第一次裂解。该裂解由管家、双链RNA特异性RNA酶III在Cas9的存在下催化。又另外,应注意的是,II型***包括cas9、cas1、cas2、csn2和cas4基因中的至少一种。应领会的是,任何II型CRISPR-Cas***,特别是II-A或B型中的任一种可以适用于本发明。
III型CRISPR–Cas***包括聚合酶和RAMP模块,其中至少一些RAMP似乎参与类似于Cascade复合体的间隔区-重复转录子的加工。III型***还可被分成III-A亚型(也被称为Mtube或CASS6)和III-B亚型(也被称为聚合酶-RAMP模块)。III-A***亚型可以靶向质粒,如已经针对表皮葡萄球菌(S.epidermidis)在体内验证的,并且似乎可信的是,该亚型中编码的聚合酶样蛋白(COG1353)的HD结构域可能参与靶DNA的裂解。存在III-B型CRISPR–Cas***至少在体外能够靶向RNA的强烈证据,如针对来自P.furiosus的III-B***亚型显示的。应领会的是,属于III型CRISPR***的任何cas基因可以用于本发明的目的,例如cas6、cas10、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、cas1和cas2中的任一种。又另外,III-A型和III-B型***中的任一种可以用于本发明的试剂盒、组分和方法。特别感兴趣的是,特别是其中内源性致病性基因被本发明的试剂盒和方法靶向的情况中,III-B型***可以是有用的。
三种类型的CRISPR***在古菌和细菌的几大谱系中显示出明显的非一致分布。特别是,II型***迄今为止已被排他性地发现于细菌中,而III型***在古菌中更普遍。
通常,重复的聚簇前面为“前导”序列,一种几百个碱基对长的富含AT的区域,所述区域种内保守但种间不保守。CRISPR相关(“cas”)基因,与这些基因座相关联的一组保守的蛋白编码基因,通常存在于阵列的一侧。若干CRISPR基因座中的间隔区序列的分析显示,间隔区匹配来自外源的、可移动遗传元件序列,诸如噬菌体和质粒。约40%的测序的细菌基因组和约90%的来自古菌(原核生物)的那些序列含有至少一个CRISPR基因座。
CRISPR-Cas免疫***必须在自我和非自我之间区分,以避免自身免疫应答。在“I型和II型CRISPR-Cas***”中,含有原始间隔区邻近基序(PAM)序列的外源DNA被靶向以降解,而宿主的CRISPR基因座中的潜在靶不含有PAM并且从而被RNA指导的干扰复合体避开。
如以上所示,在某些实施方案中,本发明的试剂盒的敏化组分可以包含至少一个cas基因。在更具体的实施方案中,此类cas基因可以是I型、II型和III型CRISPR***中的至少一种的至少一个cas基因。
在一些特定实施方案中,此类至少一个cas基因可以是I-E型CRISPR***的至少一个cas基因。“IE型CRISPR”***指原产自K型大肠杆菌。其已显示出抑制噬菌体感染、消除(cure)质粒、阻止接合元件转移和杀死细胞。该CRISPR机构可被用于以可诱导和靶向的方式降解特定的细胞内DNA,保留其余DNA完整。
在又一些其他的实施方案中,包含于本发明的温和性噬菌体内的至少一种I-E型cas基因可以是cse1、cse2、cas7、cas5、cas6e和cas3基因中的至少一种。在某些实施方案中,除了cse1、cse2、cas7、cas5、cas6e和cas3基因中的至少一种之外,本发明的敏化组分还可以包含cas1和cas2基因中的至少一种。
在一些具体的实施方案中,本发明的敏化组分的cas基因包括cse1基因。在更具体的实施方案中,此类cse1基因编码大肠杆菌K-12菌株MG1655亚株的Cse1蛋白,如由蛋白_idAAC75802.1所示的。在更具体的实施方案中,cse1基因可以包含如由SEQ ID NO.60所示的核酸序列。在更具体的实施方案中,cse1基因编码包含如由SEQ ID NO.67所示的氨基酸序列的Cse1蛋白。在又一些另外的实施方案中,本发明的敏化组分包括cse2基因。在更具体的实施方案中,此类Cse2蛋白可以是大肠杆菌K-12菌株MG1655亚株Cse2蛋白,如由蛋白_idAAC75801.1所示的。在另外的实施方案中,本发明使用的Cse2蛋白可以由如SEQ ID NO.61所示的核酸序列编码。在更特别的实施方案中,cse2蛋白可以包含如由SEQ ID NO.68所示的氨基酸序列。又另外,在某些实施方案中,本发明的敏化组分可以包含cas7。在一些具体实施方案中,所述cas7蛋白可以是id AAC75800.1的大肠杆菌K-12菌株MG1655亚株Cas7蛋白。在一些实施方案中,Cas7蛋白由如SEQ ID NO.62所示的核酸序列编码。又另外的实施方案,涉及包含如由SEQ ID NO.69所示的氨基酸序列的Cas7蛋白。
又另外,本发明的敏化组分可以包含cas5。更具体地,id AAC75799.2的大肠杆菌K-12菌株MG1655亚株Cas5蛋白。在一些实施方案中,Cas5蛋白由如由SEQ ID NO.63所示的核酸序列编码。在另外的实施方案中,Cas5蛋白包含如由SEQ ID NO.70所示的氨基酸序列的Cas5蛋白。
在又一些另外的实施方案中,本发明的敏化组分可以包含cas6e。在更具体的实施方案中,Cas6e蛋白可以是id AAC75798.1的大肠杆菌K-12菌株MG1655亚株Cas6e蛋白。在某些实施方案中,本发明使用的Cas6e蛋白可以由SEQ ID NO.64所示的核酸序列编码。在另外的实施方案中,Cas6e蛋白可以包含由SEQ ID NO.71所示的氨基酸序列。在一些另外的实施方案中,本发明的温和性噬菌体还可以包含cas3基因。在更具体的实施方案中,cas3基因编码id AAC75803.1的大肠杆菌K-12菌株MG1655亚株Cas3蛋白。在另外的实施方案中,Cas3蛋白由SEQ ID NO.65所示的核酸序列编码。在另外的实施方案中,Cas3蛋白可以包含由SEQID NO.72所示的氨基酸序列。
应注意的是,本发明的试剂盒并且特别地根据本发明的其敏化组分适用于多种CRISPR-Cas蛋白直系同源物或同源物,所述直系同源物或同源物与如本文前述的所使用的cas蛋白具有至少50%、至少60%和特别地65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同源性或同一性。
存在很多用于从不同物种鉴定并分离候选直系同源物或功能同源物的熟知方法,其大部分利用核苷酸或蛋白水平上的序列相似度。然后利用常用软件程序使分离的候选物经历测序和序列比较,常用软件程序诸如NCBI(National Center for BiotechnologyInformation,国家生物技术信息中心)上的Basic Local Alignment Search Tool(BLAST)、由DNASTAR(Madison,Wis.)生产的LASERGENE生物信息学计算套件、或其他方法(例如Methods in Gene Biotechnology(CRC出版,Inc.1997)中的Wu等(编辑)“Information Superhighway and Computer Databases of Nucleic Acids andProteins”以及Bishop(编辑)“Guide to Human Genome Computing”第二版(Academic出版,Inc.1998)。
如上所述,在某些实施方案中,本发明的试剂盒、***和方法使用的CRISPRcascade基因可以属于大肠杆菌I-E型CRISPR***。尽管如此,如以上还表明的,应领会的是,任何其他CRISPR***可以适用于本发明的目的。
因此,在又一些另外和可选的实施方案中,本发明的试剂盒和***中使用的至少一个cas基因可以是II型CRISPR***(II-A型或II-B型)的至少一个cas基因。在更特别的实施方案中,本发明的试剂盒使用的II型CRISPR***的至少一个cas基因可以是cas9基因。应领会的是,此类***还可以包含cas1、cas2、csn2和cas4基因中的至少一种。
通过Cas9进行的双链DNA(dsDNA)裂解是“II型CRISPR-Cas”免疫***的标志。CRISPR相关蛋白Cas9是RNA指导的DNA内切核酸酶,所述内切核酸酶利用RNA:DNA互补性来鉴定用于序列特异性双链DNA(dsDNA)裂解的靶位点。被靶向的DNA序列被CRISPR阵列指定,所述CRISPR阵列是被短回文重复分开的一系列B30-40bp的间隔区。阵列被转录为前crRNA并被加工成更短的crRNA,所述更短的crRNA与Cas蛋白复合体相关联以靶向被称为原始间隔区的互补DNA序列。这些原始间隔区靶还必须具有靶识别所必需的、被称为原始间隔区邻近基序(PAM)的另外的相邻序列。结合后,Cas蛋白复合体充当DNA内切核酸酶以在靶处切割两条链,并且随后经由外切核酸酶活性发生DNA降解。
在一些具体的实施方案中,酿脓链球菌M1GAS的Cas9,具体地蛋白id:AAK33936.1的Cas9可以适用于本发明的试剂盒。在一些实施方案中,Cas9蛋白可以由SEQ ID NO.66所示的核酸序列编码。在另外的具体实施方案中,Cas9蛋白可以包含如由SEQ ID NO.73所示的氨基酸序列。如上所述,应认识到的是,经些许改变,该策略的应用可以被进一步扩大。例如,***可以被设计为通过靶向特定的噬菌体来特异性地消除噬菌体溶源化和转导,从而减少毒力基因转移的重要来源。该策略的另一种改变可以涉及由染色体元件(在本文中也被称为内源性基因)编码的耐受性基因,而不是在可移动元件上转移的那些基因。在此类例子中,靶向DNA将针对转移的CRISPR-Cas反向选择,因为它将杀死宿主。然而,耐受性元件的消除仍可以利用靶向RNA的CRISPR-Cas***例如III-B型***实现。尽管靶向RNA将消除由编码的基因赋予的耐受性,但它将无法杀死病原体,并且从而将避开针对递送的温和型噬菌体(delivering temperate phage)的反向选择。因此,与多种类型的CRISPR-Cas***的可用性组合的遗传工程化的间隔区的柔性和容易可以允许该策略的很多有用的变形。在该方面,本发明的发明人使用I-E亚型CRISPR-Cas而不是更频繁使用的IIA亚型这一事实表明,期望的结果可以用不同的亚型获得。因此,在一些实施方案中,为了靶向表染色体和染色体外致病性基因,可以使用I型、II型和III-A型CRISPR-Cas***,但是当靶病原体基因是内源性或染色体基因时,III-B型***可以适用于本发明的组分、试剂盒和方法。
又另外,在某些具体且非限制性实施方案中,本发明的敏化组分的经遗传修饰的溶源性λ噬菌体可以是被指定为IYMMPh3的噬菌体。在又更具体的实施方案中,此类经遗传修饰的噬菌体可以包含如由SEQ ID No.59所示的核酸序列。
本发明提供了靶向并破坏细菌病原体的致病性基因的高效试剂盒、***和方法。更具体地,此类细菌或细菌群体可以是抗生素耐受性细菌。特别感兴趣的是医院感染中涉及的任何细菌。术语“医院感染(Nosocomial Infections)”指医院获得性感染,即医院环境诸如表面和/或医务人员有利于其发展并且由患者在住院期间获得的感染。医院感染是由生物体对抗生素耐受潜在地导致的感染。医院感染对发病率和死亡率具有影响并具有显著的经济负担。鉴于抗生素耐受性的升高的水平和住院患者的提高的疾患严重程度,该问题需要急迫的解决方案。
在美国,疾病控制与预防中心(Centers for Disease Control and Prevention)评估了来自所有微生物类型的约170万医院相关感染,然而,革兰氏阴性感染被评估为占年度患者死亡的三分之二。革兰氏阴性细菌艰难梭菌(Clostridium difficile)现在被认为是在美国和欧洲的医院腹泻的主要原因。其他的常见医院生物体包括甲氧西林耐受性金黄色葡萄球菌、凝固酶阴性葡萄球菌(Staphylococci)、万古霉素耐受性肠球菌(Enteroccocci)、耐受性肠杆菌科(Enterobacteriaceae)、铜绿假单胞菌、不动杆菌属(Acinetobacter)和嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)。
医院感染病原体可被分成***(金黄色葡萄球菌、凝固酶阴性葡萄球菌)、革兰氏阳性球菌(粪肠球菌和屎肠球菌)、革兰氏阴性杆状生物体(克雷伯氏肺炎杆菌、产酸克雷伯氏菌(Klebsiella oxytoca)、大肠杆菌、Proteus aeruginosa、沙雷氏菌属物种(Serratia spp.))、革兰氏阴性杆菌(产气肠杆菌(Enterobacter aerogenes)、阴沟肠杆菌(Enterobacter cloacae))、需氧革兰氏阴性球杆菌(鲍曼不动杆菌、嗜麦芽寡养单胞菌)和革兰氏阴性需氧杆菌(嗜麦芽寡养单胞菌,先前也被称为嗜麦芽假单胞菌(Pseudomonasmaltophilia))。除了许多其他以外,铜绿假单胞菌是极其重要的医院革兰氏阴性需氧杆状病原体。
本发明的一些实施方案涉及本发明的试剂盒或***,所述试剂盒或***用于靶向并消除以下中的至少一种的任何菌株的细菌中的致病性基因:大肠杆菌、铜绿假单胞菌、金黄色葡萄球菌、酿脓链球菌、艰难梭菌、屎肠球菌、克雷伯氏肺炎杆菌、鲍曼不动杆菌和肠杆菌属物种(特别地,ESKAPE细菌)。
在更具体的实施方案中,细菌可以是以下中的任一种:铜绿假单胞菌、酿脓链球菌、艰难梭菌和金黄色葡萄球菌。
在另外的实施方案中,如在本文中本发明所指的细菌可以包括小肠结肠炎耶尔森氏菌(Yersinia enterocolitica)、假结核耶尔森氏菌(Yersinia pseudotuberculosis)、伤寒沙门氏菌、铜绿假单胞菌、霍乱弧菌(Vibrio cholerae)、宋内志贺菌、百日咳杆菌(Bordetella Pertussis)、恶性疟原虫(Plasmodium falciparum)、沙眼衣原体(Chlamydiatrachomatis)、炭疽杆菌(Bacillus anthracis)、幽门螺杆菌(Helicobacter pylori)和单核细胞增生性李斯特氏菌。
在其他具体的实施方案中,本发明的试剂盒或***特别地适合用于任何大肠杆菌菌株,特别地以下中的任一种:O157:H7大肠杆菌、肠聚集性大肠杆菌(EAEC)、肠出血性大肠杆菌(EHEC)、肠侵袭性大肠杆菌(EIEC)、肠致病性大肠杆菌(EPEC)、肠产毒性大肠杆菌(ETEC)和弥散粘附性大肠杆菌(DAEC)。
应领会的是,本发明的试剂盒或***的任何单元或组分或元件可以被包含于或存在于任何组合物、制备物或装置中。
又另外,应理解的是,本发明使用的任何组合物和制备物可以包括本发明的至少一个试剂盒;或至少一个其元件、组分或单元。在更具体的实施方案中,试剂盒或其任何元件或组分例如至少一个选择组分和至少一个敏化组分可以以任何合适的比例存在。例如,在约0.0001-10,000:0.0001-10,000之间。更具体地,0.0001:10000和10000:0.0001。在某些实施方案中,可以使用针对不同致病性基因和/或不同致病性细菌的试剂盒的混合物。在一些实施方案中,本公开内容包括本发明的经遗传修饰的噬菌体上的CRISPR***,所述CRISPR***靶向细菌群体内的细菌中的毒性细菌基因。细菌群体可以包括一种类型、但具有毒性膜和非毒性膜的细菌,或者细菌群体可以包括多种细菌物种,而在群体中只有某些物种具有毒性膜或非毒性膜。在一些实施方案中,混合的细菌群体包括至少两种不同的细菌菌株或细菌物种。在其他的实施方案中,混合的细菌群体可以包括从两种不同类型的细菌到最多达一千种或更多种不同类型的细菌。本发明的试剂盒和***可以只特异性地靶向包含致病性基因的细菌,并导致从任何同源或异源细菌群体特异性地且靶向地消除所述致病性基因。
本文展示的原理的证据向降低新兴药物耐受性病原体(针对其已开发出有限的武器)的威胁迈出了一步。它表明,用简单的遗传工程化,细菌可以对经批准且有用的抗生素敏化。该***可以是对医院表面的简单处理,并用于手部消毒杀菌剂并且可能用作益生菌食物添加剂,以逆转位于医院表面上以及医务人员的正常菌群中的病原体的耐受性。与选择耐受性病原体的抗生素和消毒剂相比,提议的处理富集并选择敏感性病原体。此外,如由实施例显示的,该***富集无法水平地转移或接受耐受性决定子的病原体,并且因此可以降低抗生素耐受性的扩散。富集的敏感性群体可以通过占据它们的生态位阻止新引进的耐受性病原体变得被确立(established)。
因为CRISPR-Cas***可以被编程为消除任何感兴趣的基因,所以该***可以被用于限制任何抗生素耐受性基因的转移。事实上,消除抗生素耐受性基因所需的间隔区的短序列使得几十个此类间隔区能够在单个阵列中构建,从而使得能够重新使用已对其发展耐受性的很多种抗生素。它还可以被编程为同时针对将被用于选择的若干种裂解性噬菌体保护,从而减少避开这些裂解性噬菌体的非敏化突变体的出现。此外,该***可以被用于靶向携带毒力基因的溶源性噬菌体或任何质粒或DNA元件,并且通过使用靶向RNA的CRISPR-Cas***,它甚至可以靶向由病原体自身编码的毒力基因。
CRISPR-Cas***针对质粒DNA以及针对裂解性噬菌体的活性被良好地确立。尽管如此,其在临床设置(clinical settings)中作为工具以致使病原体对抗生素敏感并且以减少耐受性决定子的水平基因转移的效用是新的。本文提供的原理的证据可以被应用于不同的病原体-噬菌体***,因为对于大多数病原体可以发现温和性噬菌体,并且可相容的CRISPR-Cas***应当在很多病原体中起作用。与抗生素和噬菌体疗法相比,提议的***的广泛应用将通过使细菌对抗生素更易感而非更耐受而潜在地改变医院感染的性质。
本发明的发明人构思了以上描述的温和性噬菌体感染表面例如固体或液体表面、或固体支持物、任何物质、或任何物品上的细菌群体,致使位于其上的抗生素不敏感的细菌变得对抗生素敏感的用途。
充当本发明的敏化组分的不同温和性噬菌体的混合物可以被应用于表面例如固体或液体表面、或固体支持物、任何物质或任何物品,每种温和性噬菌体具有不同的宿主特异性,各自携带CRISPR阵列,所述CRISPR阵列通过在CRISPR阵列的间隔区中编码与抗生素耐受性基因同源的序列而特异性地靶向这些抗生素耐受性基因。为了选择并富集携带阵列的细菌,阵列还可以携带针对裂解性噬菌体的间隔区,从而保护它们免于这些剂(agents)。可以将这些裂解性噬菌体散布于环境中以对病原体产生选择压力以携带敏化CRISPR阵列。将领会到的是,温和性噬菌体对其宿主不是杀菌性的,因为噬菌体未被修饰以表达对细菌有毒性的剂。
然后富集的抗生素敏感性群体可能通过占据其生态位而干扰新引进的耐受性病原体的确立。在本方法不使用噬菌体以直接杀死病原体的意义上,其不同于传统的噬菌体疗法。因此,不存在针对使用的噬菌体选择,而是选择携带噬菌体的病原体,因为它含有对裂解性噬菌体的耐受性。此外,该方法避免使用患者身体内部的噬菌体,从而克服了噬菌体疗法的毒性问题和其他缺陷,诸如通过脾和免疫***的噬菌体中和。该治疗的延伸使用还将导致替换医院人员的天然细菌菌群(皮肤、呼吸道和GI道)以携带较不耐受的病原体。
因此,应领会的是,在某些实施方案中,被用作本发明的试剂盒或***的敏化组分的温和性噬菌体可以被配制为喷雾剂、贴剂(stick)、涂剂(paint)、凝胶、霜剂、洗涤剂(wash)、擦拭剂(wipe)、泡沫、肥皂、油、溶液、洗液(lotion)、软膏、手部消毒杀菌剂或糊剂。
在又其他的实施方案中,被用作本发明的试剂盒或***的选择组分的裂解性噬菌体可以被配制为喷雾剂、贴剂、涂剂、凝胶、霜剂、洗涤剂、液体、擦拭剂、泡沫、肥皂、油、溶液、洗液、软膏或糊剂。
应注意的是,在某些实施方案中,本发明的试剂盒的敏化组分的温和性噬菌体和充当本发明的试剂盒的选择组分的裂解性噬菌体可以被同时应用,或依次应用。可选地,温和性和裂解性噬菌体可以在连续日应用。还应注意的是,这些组分的每一种可以被包括在任何组合物、制剂或媒介物中,所述组合物、制剂或媒介物(vehicle)可以任选地包含药学上可接受的载体、赋形剂、佐剂和/或稀释剂中的至少一种。还应领会的是,按照常规程序作为适合于外部应用或内部应用的组合物。当必要时,组合物还可以包括增溶剂或有利于其应用的任何化合物。
本发明的活性剂可以被配制为中性或盐的形式。药学上可接受的盐包括:与游离氨基基团形成的那些盐,诸如衍生自盐酸、磷酸、乙酸、草酸、酒石酸等的那些盐;以及与游离羧基基团形成的那些盐,诸如衍生自氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙、氢氧化铁、异丙胺、三乙胺、2-乙基氨基乙醇、组氨酸、普鲁卡因等的那些盐。
又另外,本发明的试剂盒和***及其任何组分可以作为单个每日剂量或多个每日剂量应用,优选地每1至7日应用。被特别地构思的是,此类应用可以每日1次、2次、3次、4次、5次或6次进行,或可以每日一次、每2日一次、每3日一次、每4日一次、每5日一次、每6日一次、每周一次、每2周一次、每3周一次、每4周一次或甚至每月一次进行。本发明的试剂盒或其任何组分的应用可以持续最多达1日、2日、3日、4日、5日、6日、1周、2周、3周、4周、1个月、2个月、3个月或甚至更久。具体地,应用可以持续从1日至1个月。更具体地,应用可以持续从1日至7日。在又一些其他的实施方案中,本发明的试剂盒和***或其任何组分的应用可以是常规程序,具体地处理例如医院环境中的表面、物品或任何物质的每日程序。
本发明的试剂盒和***或其任何组分的单次或多次应用依赖于所需要的量和频率而应用。在任何事件中,本发明的试剂盒和***及其任何组分应提供足够的量以有效地防止病原体细菌基因的水平转移,并且最重要地,以防止哺乳动物受试者中由包含病原体基因的细菌导致的任何所述病原体的紊乱。优选地,有效量可以应用一次,但可以定期地应用直到得到结果。
医院表面含有细菌群体的复杂混合物:它们中的一些是属于不同物种的耐受性病原体。对表面喷雾可以是靶向这些病原体的有效方法。在某些实施方案中,喷雾剂应含有编码CRISPRCas的温和性噬菌体以及裂解性噬菌体两者。在医院中,还可以以添加至肥皂或其他手部消毒杀菌剂的液体的形式进行递送。这些递送方法避免使用患者组织内部的噬菌体,从而克服了噬菌体疗法的毒性问题和其他缺陷。
如以上所述,该策略可以应用于处理医院表面和用于靶向医务人员的皮肤菌群的手部消毒杀菌剂、肥皂或其他液体。与选择耐受性病原体的抗生素和消毒剂相比,提议的治疗富集并选择敏感性病原体。具体别地,该策略可以进一步扩大至免疫受损患者于其中住院的医疗部门,在所述免疫瘦素患者中抗生素耐受性是威胁生命的状况。与选择耐受性病原体的抗生素和消毒剂相比,提议的处理富集并选择敏感性噬菌体。此外,该***富集不能水平地接受或转移耐受性决定子的病原体,并且因此还可以减少抗生素耐受性的扩散。富集的敏感群体可以通过占据其生态位阻止新引进的耐受性病原体变得被确立。
还应注意的是,将细菌细胞与靶向耐受性赋予质粒的特异性CRISPR-Cas构建体接触可以区分复杂细菌群体中的相同菌株内的抗生素耐受性病原体和抗生素敏感性病原体。
本发明的第二方面涉及干扰致病性基因在细菌之间的水平转移的方法。更具体地,该方法包括将含有携带此类致病性基因的细菌的固体表面与以下中的至少一种接触的步骤:(i)如本发明描述的至少一种选择组分;(ii)本发明的至少一种敏化组分;和(iii)包含(i)和(ii)中的至少一种的任何试剂盒,从而灭活致病性基因并干扰其水平转移。在一些实施方案中,本发明的试剂盒和***可以是本文前述的那些试剂盒和***中的任一种。
因此,本发明提供了用于阻止、减少、减弱、抑制和消除细菌群体中的致病性基因的水平转移的方法。如本文使用的“水平基因转移”(HGT)指基因在生物体之间以传统的繁殖之外的方式转移。也被称为横向基因转移(LGT),其与垂直转移相对,垂直转移是基因经由有性繁殖或无性繁殖从亲代传递子代。如以上所述,水平基因转移是细菌抗生素耐受性和毒力传递的主要原因。该水平基因转移往往涉及温和性噬菌体和质粒。对一个细菌物种中的抗生素耐受性负责的基因可以通过多种机制(例如经由F-菌毛)转移至另一个物种的细菌。在更具体的实施方案中,被本发明的试剂盒和方法干扰、抑制、消除或减少的水平转移可以是被允许DNA在细菌接合过程中在细菌之间转移的接合菌毛影响的HGT。更具体地,菌毛通常直径为6至7nm。在接合期间,从供体细菌形成的菌毛诱捕受体细菌、将其拉近、并最终引发交配桥(mating bridge)的形成和受控制的孔的形成,所述交配桥建立起直接接触,所述受控制的孔的形成允许DNA从供体转移至受体。偶然地,转移的DNA由抗生素耐受性基因(往往在质粒上编码)组成。还应理解的是,本发明的方法和试剂盒可以干扰导致致病性基因在细菌之间转移,特别是水平转移的任何途径和机制。还应注意的是,本发明的方法可以适用于干扰通过转导、通过自然感受态或通过转座子介导的HGT。
应理解的是,根据本发明干扰水平转移可以包括以以下中的任一值的致病性基因在细菌之间的任何转移(例如水平转移)的任何消除、抑制、降低、缓和、减少、减弱、遏制或阻滞:约1%至99.9%,特别地约1%至约5%、约5%至10%、约10%至15%、约15%至20%、约20%至25%、约25%至30%、约30%至35%、约35%至40%、约40%至45%、约45%至50%、约50%至55%、约55%至60%、约60%至65%、约65%至70%、约75%至80%、约80%至85%、约85%至90%、约90%至95%、约95%至99%、或约99%至99.9%。
在更具体的实施方案中,此类干扰可以是与在不存在本发明的试剂盒和方法下发生的转移相比,细菌致病性基因的水平转移的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或约100%。
本发明还提供了预防哺乳动物受试者中由含有致病性基因的细菌的细菌感染导致的病理状况的方法。该方法包括将受试者附近的至少一种固体或液体表面、物质、物品或支持物与以下中的至少一种接触:(i)如本发明描述的至少一种选择组分;(ii)本发明的至少一种敏化组分;和(iii)包含(i)和(ii)中的至少一种的任何试剂盒,从而靶向并灭活可以包含在存在于此类受试者的环境中的细菌中的致病性基因。以这种方式,本发明的方法导致细菌中的这些致病性基因的灭活,从而预防可以由表达至少一个完整的致病性基因的细菌导致的病理状况。在一些实施方案中,本发明描述的任何试剂盒可以被用于本发明的任何方法。
在一些具体的实施方案中,本发明的方法包括以下步骤:将(特别地,受试者附近的)表面特别是固体表面或液体表面、物品、或任何物质与温和性噬菌体即本发明的敏化组分接触,并且随后将固体表面与裂解性噬菌体即本发明的试剂盒或***的选择组分接触。
如本文使用的术语“接触”指放置本发明的温和性噬菌体(和任选地裂解性噬菌体),以使得其直接或间接与细菌细胞接触。因此,本发明构思了将本发明的温和性噬菌体(和任选地裂解性噬菌体)应用至期望的表面和/或直接应用至细菌细胞两者。
可以使用本领域已知的任何方法,包括喷雾、散布、润湿、浸泡(immersing)、浸渍(dipping)、涂布、超声焊接(ultrasonic welding)、焊接(welding)、结合或粘附,实现表面与本发明的试剂盒,并且特别地与温和性噬菌体(敏化组分)和裂解性噬菌体(选择组分)的接触。
本发明预想了将很多种表面与本发明的噬菌体接触,所述表面包括织物、纤维、泡沫、膜、混凝土、砌体(masonry)、玻璃、金属、塑料、聚合物等。
根据特别的实施方案,噬菌体与医院、***、老人院、或其他的此类护理设施(care facility)中存在的表面接触。
与健康相关的其他表面包括水纯化、水储存和水递送涉及的那些物品和食物加工涉及的那些物品的内面和外面。因此本发明预想了包被食品或饮料工厂中的固体表面。
与健康相关的表面还可以包括:提供营养品、环境卫生或疾病预防中涉及的那些家居用品的内面和外面。因此,本发明的噬菌体还可以被用于消毒厕缸、导管、NG管、吸入器等。
在其他的实施方案中,本发明的试剂盒可以应用于被治疗的受试者的附近。表述“被治疗的受试者的附近”涉及所述受试者周围的四周,根据本发明的试剂盒可以应用于其上以防止抗生素耐受性基因的水平转移。因此,要理解的是,“所述受试者的附近”包括在所述受试者的最多达至少约1厘米(cm)、2cm、3cm、4cm、5cm、6cm、7cm、8m、9m、10cm、20cm、30cm、40cm、50cm、60cm、70cm、80cm、90cm、1米(m)、2m、3m、4m、5m、6m、7m、8m、9m、10m、11m、12m、13m、14m、15m、16m、17m、18m、19m、20m、30m、40m或甚至50m的范围内存在的所有物体。术语“所述受试者的附近”还涉及如下物体:在将其放置到被治疗的受试者的所述范围内之前,对其应用本发明的试剂盒。
根据一个实施方案,本发明的试剂盒或其任何组分或任何噬菌体可以每12小时、每日、每周6次、每周5次、每周4次、每周3次、每周2次或甚至每周1次应用至固体表面。
应领会的是,在一些实施方案中,本发明的方法可以使用如在上文由本发明定义的任何试剂盒和***。更具体地,在一些实施方案中,本发明的方法使用的试剂盒的选择组分可以是包含以下的任何DNA序列:被敏化组分的至少一个间隔区识别的至少一个原始间隔区,和编码至少一种毒性剂或任何细菌杀灭剂的序列。在又一些其他的实施方案中,选择组分可以包含至少一种裂解性噬菌体。在一些具体的实施方案中,此类裂解性噬菌体可以是至少一种经遗传修饰的噬菌体,所述经遗传修饰的噬菌体包含与包含于所述细菌致病性基因内的至少一种核酸序列具有至少70%的同一性的至少一种原始间隔区。在另外的实施方案中,本发明的方法使用的试剂盒的敏化组分可以包含至少一种重组载体,所述重组载体包含编码至少一种cas蛋白的核酸序列。此类载体还可以包含所述CRISPR阵列的至少一个的核酸序列。
又另外,此类载体可以是至少一种经遗传修饰的噬菌体,所述经遗传修饰的噬菌体包含:靶向包含于所述裂解性噬菌体内的至少一种核酸序列的至少一个CRISPR间隔区;和靶向包含于所述至少一种致病性基因内的核酸序列的至少一个CRISPR间隔区,从而靶向并灭活裂解性噬菌体和所述致病性基因两者。
在某些实施方案中,靶细菌致病性基因可以是至少一种细菌内源性基因或可选地表染色体基因。在某些实施方案中,致病性基因可以是抗生素耐受性基因。可选地,致病性基因可以是编码毒力因子和至少一种毒素中的至少一种的基因。在某些实施方案中,由本发明的方法使用的试剂盒靶向的抗生素耐受性基因可以编码选自由以下组成的组的耐受性因子:CTX-M-15、新德里金属-β-内酰胺酶(NDM)-1,2,5,6、超广谱β内酰胺酶耐受性因子(ESBL因子)、β内酰胺酶、和四环素A(tetA)。在更具体的实施方案中,本发明的方法使用的试剂盒的敏化组分的至少一个CRISPR间隔区可以包含靶向以下中的至少一种的核酸序列:CTX-M-15的至少一个原始间隔区、NDM-1、2、5、6的至少一个原始间隔区、ESBL因子的至少一个原始间隔区、β内酰胺酶的至少一个原始间隔区、tetA的至少一个原始间隔区和裂解性噬菌体的至少一个原始间隔区。
更具体地,CTX-M-15的至少一个原始间隔区可以包含如由SEQ ID NO.49、50和51中的任一种所示的核酸序列,并且NDM-1的至少一个所述原始间隔区可以包含如由SEQ IDNO.46、47和48中的任一种所示的核酸序列。
在又一些另外的实施方案中,被用作本发明的方法使用的试剂盒的选择组分的经遗传修饰的裂解性噬菌体可以包含以下中的至少一种:(a)CTX-M-15的至少一个原始间隔区,包含如由SEQ ID NO.49、50和51中的任一种所示的核酸序列;和(b)NDM-1的至少一个所述原始间隔区,包含如由SEQ ID NO.46、47和48中的任一种所示的核酸序列。
在某些特别且可选的实施方案中,本发明的方法使用的试剂盒的敏化组分可以包含靶向包含于裂解性噬菌体的必需基因内的核酸序列的至少一个CRISPR间隔区。更具体地,此类裂解性噬菌体可以是T7样病毒和T4样病毒中的至少一种。在一些具体的实施方案中,此类T7样病毒可以是至少一种肠杆菌噬菌体T7。
在又一些其他的实施方案中,本发明的方法使用的试剂盒的敏化组分可以包含噬菌体,特别是λ温和性噬菌体。又另外,本发明的方法使用的试剂盒的敏化组分的至少一个cas基因可以是I型、II型和III型CRISPR***中的至少一种的至少一个cas基因。
在一些具体的实施方案中,本发明的方法使用的试剂盒的敏化组分可以包含I-E型CRISPR***的至少一个cas基因。在更具体的实施方案中,此类I-E型cas基因可以是cse1、cse2、cas7、cas5e、cas6和cas3基因中的至少一种。在一些可选的实施方案中,本发明的方法使用的试剂盒的敏化组分的至少一个cas基因可以是II型CRISPR***的至少一个cas基因。在更具体的实施方案中,II型CRISPR***的至少一个cas基因可以是cas9基因。还应注意的是,本发明的方法和试剂盒可以靶向以下中的至少一种的任何菌株的至少一个细菌:大肠杆菌、铜绿假单胞菌、金黄色葡萄球菌、酿脓链球菌、艰难梭菌、屎肠球菌、克雷伯氏肺炎杆菌、鲍曼不动杆菌和肠杆菌属物种。在更具体的实施方案中,此类细菌可以是选自由以下组成的组的至少一种大肠杆菌菌株:O157:H7大肠杆菌、肠聚集性大肠杆菌(EAEC)、肠出血性大肠杆菌(EHEC)、肠侵袭性大肠杆菌(EIEC)、肠致病性大肠杆菌(EPEC)、肠产毒性大肠杆菌(ETEC)和弥散粘附性大肠杆菌(DAEC)。
在另外的实施方案中,本发明的方法使用的试剂盒的温和性噬菌体和裂解性噬菌体中的至少一种可以被配制为喷雾、贴剂、涂剂、凝胶、霜剂、洗涤剂、擦拭剂、泡沫、肥皂、液体、油、溶液、洗液、软膏或糊剂。
本发明的另一方面涉及经遗传修饰的温和性噬菌体。更具体地,温和性噬菌体可以包含至少一个CRISPR阵列。在更具体的实施方案中,CRISPR的至少一个间隔区与包含于细菌的至少一个致病性基因内的核酸序列(即所述基因的一部分)互补,以靶向并灭活细菌中的至少一个致病性基因。还应注意的是,所述CRISPR阵列的至少一个间隔区与包含于裂解性噬菌体内的核酸序列足够互补,以靶向并灭活裂解性噬菌体。以这种方式,被本发明的温和性噬菌体感染的细菌对裂解性噬菌体不敏感且耐受。
本发明的又另外的方面涉及本发明描述的任何经遗传修饰的裂解性噬菌体。
如本文使用的,术语“多核苷酸”或“核酸序列”指核酸的聚合物,诸如脱氧核糖核酸(DNA)或核糖核酸(RNA)。如本文使用的,“核酸”(亦或核酸分子或核苷酸)指任何单链或双链的DNA或RNA多核苷酸;寡核苷酸;通过聚合酶链式反应(PCR)产生的片段和通过连接、切割、内切核酸酶反应和外切核酸酶反应中的任一种产生的片段。核酸分子可以包括天然存在的核苷酸的单体(诸如DNA和RNA)或天然存在的核苷酸的类似物(例如,天然存在的核苷酸的α对映体的形式)或修饰的核苷酸或其任何组合。在本文中该术语还包括cDNA,即通过逆转录酶(RNA依赖的DNA聚合酶)的反应从RNA模板产生的互补或拷贝DNA。
在该方面,“分离的多核苷酸”是从生物体的基因组分离的核酸分子。例如,如下的DNA分子是分离的DNA分子:已经从细胞的基因组DNA分离的、编码本发明的试剂盒使用的cas基因或其任何衍生物或同源物以及包含于本发明的试剂盒的CRISPR间隔区和重复内的序列。分离的核酸分子的另一个实例是未被整合到生物体的基因组中的化学合成的核酸分子。已从特定物种分离的核酸分子比来自该物种的染色体的完整DNA分子小。
本发明还涉及包含本发明的多核苷酸的重组DNA构建体,特别地编码本发明的cas-CRISPR***的那些多核苷酸或其变体、同源物或衍生物。本发明的构建体还可以包含可操作地连接到本发明的核酸序列的另外的元件,诸如启动子、调控元件和控制元件、转录信号、表达信号和其他信号。如本文使用的,术语“重组DNA”或“重组基因”指包含编码本发明的蛋白之一的开放阅读框的核酸。
又另外,本发明还提供了包括以下步骤的治疗方法:将治疗有效量的本发明的试剂盒,任选地与至少一种抗生素化合物特别地前文公开的任何抗生物组合施用至罹患感染性疾病的受试者。还应注意的是,本发明的试剂盒或其任何组分的应用可以形成对罹患感染性疾病或状况的受试者的补充性治疗方案。
与感染性状况相关紊乱相符合的术语“治疗”可以指以下中的一种或更多种:消除、降低或减少与所述传染性状况相关的紊乱的严重程度或频率。该治疗可以在当与所述感染相关的紊乱发生开始时进行,或可以连续施用,例如通过每1至14日施用来预防或减少有所述状况倾向的个体中的感染性状况的发生。
术语“预防”指预防或降低生物或医疗事件的发生,特别地与感染性疾病相关的紊乱的发生或再发生的风险,所述与感染性疾病相关的紊乱是研究者、兽医、医师、或其他临床医生力图在组织、***、动物或人类中防止的,并且术语“预防有效量”被意图指将实现该目标的药物组合物的量。因此,在特定的实施方案中,本发明的方法在预防,即防止与感染性疾病有关的状况中特别有效。因此,被施用所述组合物的受试者较不可能经历与所述感染性状况相关的症状,所述症状也较不可能在在过去已经经历它们的受试者中再发生。
如本文使用的术语“改善”涉及由根据本发明的组合物和方法引起的症状的减少和受试者状况的改善,其中所述改善可以通过以下形式表现:与细菌感染相关的病理过程的抑制、其程度的显著降低、或患病受试者生理状态的改善。
术语“抑制”以及该术语的所有变化形式被意图包括病理症状的进程和恶化或者与所述病理过程的症状或过程相关的病理过程的进程的限制或禁止。
术语“消除”涉及病理症状和可能的病理病因的基本根除或去除,任选地根据以下描述的本发明的方法。
术语“延迟”、“延迟发作”、“减缓”及其所有变化形式被意图包括减慢病理性紊乱或感染性疾病的进程和/或恶化以及减慢其进程、进一步恶化或进展的其症状,以晚于不存在根据本发明的治疗出现。
如本文使用的术语“方法”指用于完成给定任务的方式(manners)、方法(means)、技术和程序,包括但不限于化学、药理、生物、生化和医疗领域的实践者已知或已经从已知的方式、方法、技术和程序开发的那些方式、方法、技术和程序。
如本文使用的,术语“治疗”包括废除、基本抑制、减慢或逆转状况的进程,基本改善状况的临床或审美(aesthetical)症状,或基本防止状况的临床和审美症状的出现。
如本文使用的,由于“疾病”、“紊乱”、“状况”等涉及受试者的健康,所以它们可交换使用并且具有属于此类术语的每个或全部的意思。
本发明涉及需要其的受试者或患者的治疗。“患者”或“有需要的受试者”意指可以被以上提到的病原体感染并且期望本文描述的预防性(preventive)和预防性(prophylactic)试剂盒、***和方法的任何生物体,包括人类;家养和非家养哺乳动物,诸如犬科和猫科、牛科、类人猿、马科和鼠科受试者;啮齿动物;家养鸟类;水产养殖;鱼和外来观赏鱼。应领会的是,治疗的受试者还可以是任何爬行动物或动物园动物。更具体地,本发明的试剂盒和方法意图预防哺乳动物中的病理状况。“哺乳动物受试者”意指期望提议的疗法的任何哺乳动物,包括人类、马科、犬科和猫科受试者,最特别地是人类。应注意的是,特别地在非人类受试者的情况中,本发明的方法可以利用如下施用进行:经由注射、饮水、饲喂、喷雾、口腔灌食(oral gavage)和直接施用至需要其的受试者的消化道。
又另外,应注意的是,本发明还提供了用于通过将本发明的试剂盒及其任何组分应用到细菌群体来使所述细菌群体对至少一种抗生素化合物敏化或增加所述群体对至少一种抗生素化合物的敏感性的方法。
在又一些另外的方面,本发明提供了用于使用本发明的试剂盒及其任何组分,来防止或降低细菌或细菌群体对至少一种抗生素化合物的耐受性的方法。
本发明还提供了用于通过将本发明的试剂盒或其任何组分应用到包含所述细菌的表面上来处理致病性细菌的爆发的方法。
应领会的是,本发明的某些特征还可以在单个实施方案中组合提供,为了清楚起见,所述特征被描述于独立的实施方案的上下文中。相反,本发明的多种特征还可以单独提供,或以任何合适的子组合提供,或合适时在描述的本发明的任何其他实施方案中提供,简略起见,所述多种特征被描述于单个实施方案的上下文中。在多种实施方案的上下文中描述的某些特征并不被认为是那些实施方案的必需特征,除非实施方案无那些元素则不起作用。
如本文以上描绘的以及如在以下权利要求部分中请求保护的本发明的多种实施方案和方面在以下实施例中找到实验支持。
本文使用的所有科学和技术术语具有本领域通常使用的意思,除非另外指明。本文提供的定义是为了便于理解本文频繁使用的某些术语并且并不意味着限制本公开内容的范围。
如本文使用的术语“约”指±10%。术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有”及其同源词意指“包含但不限于”。术语“基本上由……组成”意指组合物、方法或结构可以包括另外的成分、步骤和/或部分,但前提是另外的成分、步骤和/或部分不实质性地改变请求保护的***、试剂盒、组合物、方法或结构的基础特征和新特征。
如本文使用的术语“约”指示可以偏离所指的值,比所指的值高或低多达1%、更具体地5%、更具体地10%、更具体地15%、并且在一些情况中多达20%的值,偏离范围包括整数值,并且如果适用也包括非整数值,构成连续的范围。如本文使用的术语“约”指±10%。
术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有”及其同源词意指“包括但不限于”。该术语包括术语“由……组成”和“基本上由……组成”。术语“基本上由……组成”意指组合物或方法可以包括另外的成分和/或步骤,但前提是另外的成分和/或步骤不实质性地改变请求保护的组合物或方法的基础特征和新特征。贯穿本说明书和实施例和后面的权利要求,除非上下文另外需要,术语“包含(comprise)”和变化形式诸如“包含(comprises)”和“包含(comprising)”将被理解为隐含包括陈述的整数或步骤或者整数或步骤的组,但不排除任何其他的整数或步骤或者整数或步骤的组。
应注意的是,本发明的多种实施方案可以以范围的形式存在。应理解的是,以范围形式的说明仅仅为了方便和简洁,并且不应被解释为对本发明的范围的僵化限制。相应地,范围的说明应被理解为已具体地公开了所有可能的子范围以及该范围内的单个的数值。例如,诸如从1到6的范围的说明应被认为已具体地公开了诸如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等的子范围,以及该范围内的单个的数值例如1、2、3、4、5和6。不管范围的宽度,这都适用。无论何时本文指示数值范围,其意指包括所指示的范围内的任何引述的数值(分数或整数)。术语“范围在(ranging/ranges between)”第一个指示数和第二个指示数“之间”以及“范围为从(ranging/ranges from)”第一个指示数“到(to)”第二个指示数在本文可交换使用并且意指包括第一个指示数和第二个指示数及其之间的所有分数和整数。
应领会的是,本发明的某些特征还可以在单个实施方案中组合提供,为了清楚起见,所述特征被描述于独立的实施方案的上下文中。相反,本发明的多种特征还可以单独提供,或以任何合适的子组合提供,或合适时在描述的本发明的任何其他实施方案中提供,简略起见,所述多种特征被描述于单个实施方案的上下文中。在多种实施方案的上下文中描述的某些特征并不被认为是那些实施方案的必需特征,除非实施方案无那些元素则不起作用。
如本文以上描绘的以及如在以下权利要求部分中请求保护的本发明的多种实施方案和方面在以下实施例中找到实验支持。
公开的和描述的将被理解为本发明不被限制于本文公开的特定实施例、方法步骤和组合物,因为此类方法步骤和组合可以稍微变化。还要理解的是,本文使用的术语是只是为了描述特定实施方案的目的,并且不意图是限制性的,因为本发明的范围将仅由所附的权利要求及其等价物限定。
必须要注意的是,如本说明书和所附的权利要求中使用的,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代物,除非内容另外明确规定。
以下实施例是发明人在执行本发明的方面中采用的技术的代表。应领会的是,尽管这些技术是本发明的实践的优选实施方案的示例,本领域技术人员根据本公开内容将认识到可以进行很多修改而不偏离本发明的精神和意图的范围。
实施例
现在参考以下实施例,所述实施例连同以上说明以非限制性方式例证了本发明的一些实施方案。
总体来说,本文使用的命名法以及在本发明中使用的实验室程序包括分子、生物化学、微生物学和重组DNA技术。此类技术在文献中被详尽地解释。参见,例如"MolecularCloning:A laboratory Manual"Sambrook等,(1989);"Current Protocols in MolecularBiology"卷I-III Ausubel,R.M.,编辑(1994);Ausubel等,"Current Protocols inMolecular Biology",John Wiley和Sons,Baltimore,Maryland(1989);Perbal,"APractical Guide to Molecular Cloning",John Wiley&Sons,New York(1988);Watson等,"Recombinant DNA",Scientific American Books,New York;Birren等(编辑)"GenomeAnalysis:A Laboratory Manual Series",卷1-4,Cold Spring Harbor LaboratoryPress,New York(1998);如美国专利第4,666,828、4,683,202、4,801,531、5,192,659和5,272,057号中所示的方法学;"Cell Biology:A Laboratory Handbook",卷I-III Cellis,J.E.,编辑(1994);Freshney,Wiley-Liss,N.Y.的"Culture of Animal Cells-A Manualof Basic Technique"(1994),第三版;"Current Protocols in Immunology"卷I-IIIColigan J.E.,编辑(1994);Stites等(编辑),"Basic and Clinical Immunology"(第8版),Appleton&Lange,Norwalk,CT(1994);Mishell和Shiigi(编辑),"Selected Methodsin Cellular Immunology",W.H.Freeman和Co.,New York(1980);可用的免疫测定被大量地描述于专利和科学文件中,参见例如美国专利第3,791,932、3,839,153、3,850,752、3,850,578、3,853,987、3,867,517、3,879,262、3,901,654、3,935,074、3,984,533、3,996,345、4,034,074、4,098,876、4,879,219、5,011,771和5,281,521号;"OligonucleotideSynthesis"Gait,M.J.,编辑(1984);“Nucleic Acid Hybridization"Hames,B.D.,和Higgins S.J.,编辑(1985);"Transcription and Translation"Hames,B.D.和HigginsS.J.,编辑(1984);"Animal Cell Culture"Freshney,R.I.,编辑(1986);"ImmobilizedCells and Enzymes"IRL出版社,(1986);"A Practical Guide to Molecular Cloning"Perbal,B.,(1984)以及"Methods in Enzymology"卷1-317,Academic出版社;"PCRProtocols:A Guide To Methods And Applications",Academic Press,San Diego,CA(1990);Marshak等,"Strategies for Protein Purification and Characterization-ALaboratory Course Manual"CSHL出版社(1996);其如同在本文中充分陈述地全部通过引用并入。遍布此文档提供了其他一般参考文件。其中的程序被认为是本领域熟知的并且被提供以方便读者。本文包含的所有信息通过引用并入本文。
实验程序
试剂、菌株和质粒
Luria-Bertani(LB)培养基(10g/L胰蛋白胨、5g/L酵母提取物和5g/L NaCl)和琼脂糖来自Acumedia。含有在蒸馏水中的1.6%(w/v)细菌用胰蛋白胨(Acumedia)、1%(w/v)细菌用酵母提取物(Acumedia)和0.5%(w/v)NaCl(Acumedia)的2YT培养基。抗生素、溶菌酶、L-***糖和麦芽糖来自Calbiochem。氯化钠和硫酸镁来自Merck。限制性酶、连接酶和High-Fidelity DNA聚合酶来自New England Biolabs。本研究中使用的细菌菌株、质粒和噬菌体被列于表1。
表1.细菌菌株、质粒和噬菌体
质粒构建
利用标准分子生物学技术构建质粒。通过PCR扩增DNA区段。PCR产物和载体通过限制性酶的标准消化根据制造商的说明书进行。由GenScript合成的pIYEC1质粒编码由T7启动子转录的CRISPR阵列,所述CRISPR阵列编码:靶向ndm-1基因的三个间隔区(N1、N2、N3,这些间隔区由SEQ ID NO.37、38、39所示,并且其相应的原始间隔区如由SEQ ID NO.46、47、48所示),靶向ctx-M-15基因的三个间隔区(C1、C2、C3,这些间隔区由SEQ ID NO.40、41、42所示。所述间隔区靶向包含SEQ ID NO.49、50、51中的任一个的核酸序列的原始间隔区),和靶向T4噬菌体基因组的三个间隔区(T1、T2、T3,这些间隔区由SEQ ID NO.43、44、45所示。所述间隔区靶向包含SEQ ID NO.52、53、54中的任一个的核酸序列的原始间隔区)。pIYEC2与pIYEC1相似,除了它还编码氯霉素耐受性标志物。为了构建pIYEC2,使用寡核苷酸IY344F和IY344R扩增来自pKD3(22)的氯霉素耐受性标志物。将均被HindIII消化的扩增的DNA和pIYEC1连接以得到pIYEC2。通过使用pNDM的寡核苷酸IY246F和IY246R以及pCTX的IY346F和IY346R,将编码ndm-1或ctx-M-15的PCR片段连接至含有源自质粒pCas1+2(23)的复制起点和strr标志物的另一个PCR片段来构建pNDM和pCTX质粒。通过将不相关DNA片段连接至源自质粒pCas1+2的复制起点和strr标志物来构建质粒pVEC。构建质粒pTRX1、pTRX2、pTRX3、pTRX4和pTRX5以将原始间隔区***到T7基因组中(表1)。质粒编码trxA基因,一种针对生长在缺乏trxA的宿主上的T7的阳性选择标志物,侧翼为期望的原始间隔区并且随后是分别相应于T7基因1.3的末端和T7基因1.4的起始的50bp上游和下游DNA序列。使用表2和3中所示的引物通过PCR扩增T7噬菌体构建噬菌体,所述T7噬菌体编码侧翼为翻转酶(flippase)识别位点的trxA基因。得到的PCR产物被用作模板,用于使用引物IY260F和IY260R(SEQ IDNO.24和25,表2)的PCR。将最终的PCR片段连接至pGEM-T载体(Promega)。构建的载体通过DNA测序被验证为编码期望的片段。
表2.寡核苷酸引物
基于同源重组的基因工程
如先前描述的进行使用短同源侧翼末端的同源重组(24)。为了将CRISPR干扰所需的6个cas基因***到T7控制下,发明人首先将T7启动子克隆到大肠杆菌K-12的cas3和cse1基因的上游。在32℃将携带pSIM6质粒的大肠杆菌RE1001(表1)的过夜培养物1:100稀释于用100μg/mL氨苄青霉素补充的50mL新鲜LB中并通气,直到OD600达到0.4-0.6。然后将培养物在振荡水浴中在42℃热诱导15min,用于表达red重组酶,然后在冰水中孵育10min。然后将培养物在4℃在4600×g离心10min。移除上清液,并在冰冷的双蒸水(ddH2O)中洗涤团块3次。将团块重悬在200μL冰冷的ddH2O中并保持在冰上。然后将培养物用~500ng的PCR产物电穿孔,所述PCR产物编码融合至卡那霉素或氯霉素耐受性标志物的T7启动子,所述卡那霉素或氯霉素耐受性标志物的侧翼为位于cas3基因(片段T7cas3::kan)和cse1基因(片段T7cse1::cm)的原始启动子的侧翼的50bp序列。通过使用引物RK41F和在其5’末端编码T7启动子的引物RK41R(表1)从BW25113ΔyeeX(表1)PCR扩增编码FRT位点的卡那霉素耐受性基因来构建T7cas3::kan片段。然后用RK42F和RK42R(表1)扩增PCR片段,编码cas3的最接近的5’区域的50-bp同源物。通过使用引物RK43F和在其5’末端编码T7启动子的引物RK43R(表1)从pKD3质粒(表1)PCR扩增编码FRT位点的氯霉素片段来构建T7cse1::cm片段。然后用RK44F和RK44R(表1)扩增PCR片段,编码cseI的最接近的5’区域的50-bp同源物。使用电感受态细菌的50μL等分试样在0.2cm池中在25μF、2.5kV和200Ω进行这些片段的电穿孔。电穿孔后,将1mL的2YT培养基添加至池,然后在32℃通气持续3h。然后将培养物接种到用25μg/mL卡那霉素和17.5μg/mL氯霉素补充的LB琼脂板上并在32℃孵育过夜。将重组菌落在25μg/mL卡那霉素和17.5μg/mL氯霉素板上划线并在42℃孵育以消除温度敏感性pSIM6质粒。通过使用RK33R和RK29R的DNA测序,单个菌落被验证为编码期望的置换。将在T7启动子下编码cas3和cse1的整个操纵盒转导至RE1001菌株并使用两种抗生素标志物选择,以得到RK6471菌株。如先前描述的使cas基因缺失(25)。简而言之,将大肠杆菌DY378用约500ng PCR产物电穿孔,所述PCR产物通过使用引物IY80F和IY80R扩增质粒pKD3产生(表1和2)。该扩增的DNA编码氯霉素耐受性标志物,所述氯霉素耐受性标志物在一端的侧翼为50bp的cas3启动子的序列,并且在另一端的侧翼为50bp的CRISPR前导序列。在用17.5μg/mL氯霉素补充的LB琼脂板上选择期望的重组体。然后如描述的(26)利用P1转导将缺失转移至IYB5101,得到IYB5666。
为了构建在T7启动子下编码cas基因的λ噬菌体,将IYB5297/pSIM6的过夜培养物在具有适当抗生素的25mL LB培养基中稀释50倍,并在32℃生长至0.5的OD600。然后在振荡水浴中在42℃对培养物热诱导恰好4min,用于从λ噬菌体和质粒两者表达重组酶。将诱导的样品在冰浆上立即冷却,并且然后在4℃在4600×g持续10min使成团。将团块在冰冷的ddH2O中洗涤2次,重悬在200μL冰冷的ddH2O中,并保持在冰上,直至用~1600ng凝胶纯化的PCR产物电穿孔,所述PCR产物通过使用引物IY333F和IY333R扩增RK6471的基因组DNA获得。电感受态细胞的25μL的等分试样被用于在0.2cm池中、在25μF、2.5kV和200Ω的每次电穿孔。电穿孔后,使细菌在32℃振荡水浴中在1mL LB中生长持续1h并接种在含有17μg/mL氯霉素的选择板上。使用由质粒pCP20编码的翻转酶重组酶移除氯霉素耐受性标志物(24),并且氯霉素敏感性菌落被用于在42℃的噬菌体诱导。所得的编码从T7启动子转录的6个cas基因但缺乏CRISPR阵列的噬菌体λcas被用于使BL21-AI溶源化,得到IYB5614。如以上描述的,通过使用用引物IY347F和IY347R从扩增pIYEC2获得的PCR片段将工程化的CRISPR阵列***到IYB5614/pSIM6。得到的菌株IYB5656携带λcas-CRISPR,所述λcas-CRISPR编码从T7启动子转录的6个cas基因和CRISPR阵列,所述CRISPR阵列编码针对ndm-1、ctx-M-15和T4噬菌体基因组的间隔区。
表3.用于构建细菌、噬菌体和质粒的寡核苷酸和模板
噬菌体T7的同源重组
如描述的(29)通过使用质粒pTRX1、pTRX2、pTRX3、pTRX4和pTRX5构建编码期望的原始间隔区的T7噬菌体。
转化效率测定
在用25μg/mL卡那霉素和10μg/mL氯霉素补充的10mL LB培养基中,在32℃,将大肠杆菌IYB5670和IYB5671的过夜培养物1:50稀释并通气。当培养物达到0.2的OD600时,添加0.2%L-***糖,并将培养物在32℃孵育,直至OD600达到0.5-0.6。然后将细菌在4℃在4600×g离心,丢弃上清液并将细菌重悬在1mL冰冷的ddH2O中并转移至1.5mL管。使细胞在4℃、在13000×g旋转沉降持续1min。在另外的洗涤步骤之后,将细胞悬浮在250μL冰冷的ddH2O中。然后将细菌细胞(50μL)混合在具有12ng pVEC、pNDM或pCTX质粒的冰冷的0.2-mm电穿孔池(Bio-Rad)中。在Bio-Rad微脉冲发生器中,在200Ω、25μF和1.8kV对混合物施以脉冲。施以脉冲后紧接着,添加含有0.2%L-***糖的0.1mL 2YT肉汤,并在32℃对细胞通气持续1h。将反应的多种稀释物涂布到用50μg/mL链霉素和0.2%L-***糖补充的LB琼脂板上。将板在32℃过夜孵育。计数选择板上出现的菌落,并相应地计算每mL的CFU数。
裂解性噬菌体生长效率的测定
在用25μg/mL卡那霉素补充的10mL LB培养基中,在32℃,将大肠杆菌IYB5670和IYB5671的过夜培养物1:50稀释并通气。当培养物达到0.2的OD600时,添加0.2%L-***糖,并将培养物在32℃孵育,直至OD600达到0.5-0.6。将细菌通过离心收获并浓缩至~3的OD600。将来自浓缩的培养物IYB5670和IYB5671的1mL与用0.2%L-***糖补充的10mL软琼脂混合,并散布到用25μg卡那霉素和0.2%L-***糖补充的LB琼脂板上。在琼脂固化后,将板在32℃孵育40min。将15微升噬菌体稀释物涂布到软琼脂上,允许干燥,并且然后在32℃孵育持续15h。对若干种稀释物计数噬菌斑形成单位,并相应地计算其每mL的数目。
溶源化
在用50μg/mL链霉素、10mM MgSO4和0.2%(w/v)麦芽糖补充的LB培养基中,将携带pNDM、pCTX或对照质粒(pVEC)的IYB5666的过夜培养物1:50稀释。使培养物生长至0.5的OD600并且然后在13000g离心1min。将上清液丢弃并将团块重悬在用10mM MgSO4和0.2%(w/v)麦芽糖补充的LB培养基中。将10μL处理的培养物在1.5mL管中以~10的感染复数(multiplicity of infection)与10μL噬菌体λcas或λcas-CRISPR混合,并在室温孵育持续30min。然后添加用0.2%L-***糖补充的60μL LB培养基,并使培养物在32℃通气持续另外的2.5h。然后将培养物1:10稀释,并将84μL散布到含有5μg/mL四环素和0.2%L-***糖的LB板上和含有5.5×105T7-C1N1噬菌体的3mL软琼脂上。将板在32℃孵育36h。为了确定质粒丢失,将20-48个存活的菌落重悬到0.1mL LB中,并利用板复制器(replicator)将悬浮液涂布到用5μg/mL四环素和0.2%L-***糖补充、具有或不具有50μg/mL链霉素的LB琼脂板上。对链霉素敏感的菌落被确定为在缺乏链霉素的培养基上生长但在具有链霉素的培养基上不生长的那些菌落。
实施例1
通过λ噬菌体递送CRISPR-Cas***
在细菌中CRISPR-Cas***已经进化以限制核酸诸如噬菌体、质粒或其他寄生元件的转移。这些***由侧翼为被称为间隔区的相似大小的序列的约30bp的短重复的阵列组成(图1)。间隔区充当不期望的核酸的分子“标记”。如果***编码在序列上与侵入的DNA分子的任何部分相同的间隔区,则该DNA分子将从细胞消除(26、27)。该消除由“感知(sense)”对齐、并靶向和破坏侵入的分子的特定蛋白进行。最近,报道了由邻近CRISPR阵列的单个基因组成的CRISPR/Cas***在大肠杆菌中是有活性的(27)。显示该***靶向具有与CRISPR阵列中的间隔区相同的序列的质粒。
本发明的***包括两种组分或元件,第一组分是敏化元件,所述敏化元件是温和性噬菌体,所述温和性噬菌体被设计为引起CRISPR介导的致病性基因例如赋予对抗生素的耐受性的基因的灭活。因此,抗生素耐受性基因的灭活致使细菌对此类抗生素剂敏感。本发明的***的第二组分是被用于选择的裂解性噬菌体。本发明的一些实施方案包括经遗传修饰的裂解性噬菌体,所述经遗传修饰的裂解性噬菌体包含与致病性基因中的原始间隔区相同的原始间隔区,所述致病性基因被本发明的敏化组分的温和性噬菌体中的CRISPR阵列的间隔区识别。
为了使携带抗生素耐受性基因的细菌敏化,先构建靶向ndm-1和ctx-M-15基因的可转移的CRISPR-Cas***(如图1显示的)。这些基因编码赋予对碳青霉烯类抗生素的耐受性的超广谱β内酰胺酶,β内酰胺抗生素往往是抵抗耐受性病原体的有效抗生素的最后防线(28)。聚合酶链式反应(PCR)被用于扩增CRISPR cascade基因(cse1、cse2、cas7、cas5和cas6e)以及大肠杆菌I-E型CRISPR***的cas3。通过同源重组将PCR产物引入到λ前噬菌体中。这些基因编码足够消除编码靶向的原始间隔区的DNA分子的蛋白(29)。编码靶向耐受性基因ndm-1和ctx-M-15的保守序列的间隔区的CRISPR阵列也被引入到相同的溶源性细菌中,紧跟着cas基因的下游,如图1中所示。然后诱导前噬菌体,并且其子代被用于使初始(naive)大肠杆菌细菌溶源化。被设计为靶向并破坏编码ndm-1和ctx-M-15基因的质粒的工程化CRISPR-Cas***因此通过溶源化可转移到细菌。
溶源化的细菌可以胜过携带耐受性质粒的细菌,说明转移的前噬菌体的遗传适应消耗小于测试的质粒的遗传适应消耗(图2)。
实施例2
溶源化的细菌阻断转化
将用编码CRISPR-Cas***的λ噬菌体(λcas-CRISPR)或用缺乏CRISPR阵列的相似噬菌体(λcas)作为阴性对照溶源化的初始大肠杆菌制成感受态并用对照质粒或编码全都赋予链霉素耐受性的ndm-1或ctx-M-15的质粒转化。通过计数获得链霉素耐受性的菌落来确定转化效率。与λcas的溶源性细菌相比,λcas-CRISPR的溶源性细菌用对照质粒相当良好地转化。相比之下,如图3中显示的,用靶向的质粒转化这些溶源性细菌的效率低约3个数量级。这些结果明确表明,溶源化的CRISPR-Cas***可以被转化至细菌,并且此外,该***特异性地阻止抗生素耐受性元件通过质粒转化而水平基因转移。为了证明溶源化还可以消除确立的耐受性质粒,发明人使耐受性细菌溶源化并确定了质粒丢失。质粒特异性地从用λcas-CRISPR而非λcas溶源化的细菌消除(图4)。总体而言,这些结果表明CRISPR-Cas***可以通过温和性噬菌体转移至细菌内以特异性地阻止抗生素耐受性元件的水平基因转移。
实施例3
免于裂解性噬菌体的保护
敏化CRISPR-Cas***的期望特征是同时赋予携带其的病原体以优势的能力。例如,对裂解性噬菌体的耐受性将使得能够选择并富集暴露于其的敏化的病原体。因此,发明人接着将编码原始间隔区的裂解性T7噬菌体遗传工程化,所述原始间隔区与由转移的CRISPR-Cas***靶向的ndm-1和ctx-M-15间隔区相同。这些工程化的噬菌体因此将同时靶向耐受性基因。这些相似的原始间隔区被有意地克隆,以确保溶源性细菌可以不丢失敏化元件,也不丢失噬菌体耐受性。另外,靶向噬菌体的合成的原始间隔区而不是天然存在的序列不为溶源性细菌提供针对野生型噬菌体的保护,并且因此不干扰自然生态平衡。用λcas-CRISPR或λcas使初始大肠杆菌溶源化,并且然后用工程化T7噬菌体感染细菌。如图5中清楚显示的,与用对照λcas噬菌体溶源化的细菌相比,用λcas-CRISPR溶源化的细菌不耐受对照T7-gp8的生长。相比之下,这些溶源性细菌以至少4个数量级耐受T7噬菌体的生长,所述T7噬菌体编码ndm-1的两个原始间隔区(T7-N1-N2,SEQ ID NO.55)或ctx-M-15的两个原始间隔区(T7-C2C1,SEQ ID NO.56)或各一个(T7-N1C1,SEQ ID NO.57或T7-C2N2,SEQ IDNO.58)(图5)。这些结果表明溶源化的CRISPR-Cas***可以被转移至细菌并保护它们免于经修饰的T7噬菌体,从而将病原体对抗生素的敏化与对裂解性噬菌体的耐受性连锁。此外,该***仅向编码人工匹配的原始间隔区的噬菌体赋予耐受性,表明该***不干扰自然生态相互作用。
实施例4
裂解性噬菌体选择敏化的细菌
转移的CRISPR-Cas***防止质粒转化并同时保护溶源化的细菌免于裂解性噬菌体。这表明溶源化可以被用于敏化抗生素耐受性细菌,并且敏化的细菌的群体可以通过裂解性噬菌体富集。为了模拟可以应用到医院表面或皮肤的菌群上的处理,接着繁殖携带对照、编码ctx-M-15或ndm-1的质粒的细菌。
然后将编码CRISPR-Cas***(λcas-CRISPR)或对照(λcas)噬菌体的溶源性噬菌体添加至培养物。然后将培养物覆盖在含有T7-N1C1裂解性噬菌体的琼脂板上,针对所述T7-N1C1裂解性噬菌体,溶源化的细菌具有CRISPR-Cas介导的保护。孵育过夜后,计数存活的菌落(图6A)。在所有的培养物中,与用对照λcas噬菌体处理的那些菌落相比,多超过20倍的用靶向λcas-CRISPR噬菌体处理的菌落对工程化T7-N1C1噬菌体耐受(图6B)。将用λcas-CRISPR或λcas处理的噬菌体耐受性菌落接种到具有或缺乏链霉素的板上,以测试赋予抗生素耐受性的质粒的丢失。如预期的,携带非靶向的质粒(pVEC)的培养物在两种类型的溶源化中维持链霉素耐受性。但是,用λcas-CRISPR溶源化并同时携带靶向的质粒(pNDM或pCTX)的所有细菌变得对链霉素敏感,而用λcas处理的所有细菌维持该耐受性(图6C)。最后,为了表明在相同细菌中的多重耐受性也可以被消除,发明人使用携带两种不同抗生素耐受性质粒(pNDM*+pCTX)的细菌重复以上描述的程序。如预期的,在该情况中,用λcas-CRISPR处理的细菌培养物抵抗裂解性噬菌体,应为它们携带抗噬菌体间隔区(图6B)。在裂解性噬菌体感染中存活并用λcas-CRISPR处理的细菌被消除两种耐受性质粒,而用λcas处理的存活者维持耐受性质粒(图6C)。总而言之,这些实验提供了如下原理的证据:递送CRISPR-Cas***的工程化温和性噬菌体可以连同工程化裂解性噬菌体一起使用,以有利于多重耐受性决定子的同时丢失,降低其水平转移,并富集表现出两种特征的细菌群体。总的来说,这些实验表明了将递送CRISPR-Cas***的工程化温和性噬菌体连同工程化裂解性噬菌体一起使用以有利于多重耐受性决定子的同时丢失,降低其水平转移,并富集表现出两种特征的细菌群体的可行性。
实施例5
体内测试
本发明的发明人接着测试了本技术减少小鼠被药物耐受性病原体感染的能力。使用小鼠笼模拟医院房间,并且使用小鼠来模拟患者。遍布所有的笼子散布ESBL-耐受性病原体。通过喷洒敏化噬菌体然后裂解性噬菌体持续数天,来评价工程化噬菌体富集药物敏感性病原体群体的效率。然后将小鼠放入这些笼子或未处理的笼子。用抗生素处理发展细菌疾病的小鼠。预期噬菌体处理的笼子中的小鼠将被抗生素治愈,而对照笼子中的小鼠将死于细菌疾病。
应注意的是,CRISPR***还可以靶向通过噬菌体水平转移的毒力因子,诸如志贺毒素和霍乱毒素,从而降低病原体感染的严重程度。另外,靶向RNA分子的CRISPR/Cas***可以被用于靶向基因组的耐受性决定子和毒力因子。可以使用RNA靶向***而不逆向选择,因为细菌基因组维持完整,而只有特定的毒力因子被沉默。发明人检查了这些可能性。
尽管本发明已经结合其具体的实施方案被描述,明显的是,很多改变、修改和变化形式对于本领域技术人员将是明显的。因此,意图包括落在所附权利要求的精神和宽广范围内的所有此类改变、修改和变化形式。
本说明书中提到的所有出版物、专利和专利申请在此通过引用以其整体并入本说明书,达到如同具体地且单独地说明每个单独的出版物、专利或专利申请通过引用并入本文的程度。另外,本申请中的任何参考文献的引用和识别将不被理解为承认此类参考文件可用作本发明的现有技术。达到章节标题被使用时,它们不应被理解为必要的限制的程度。
序列表
<110> 雷蒙特亚特特拉维夫大学有限公司
<120> 细菌基因的靶向消除
<130> 2379894
<150> US 62/084,703
<151> 2014-11-26
<160> 77
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY344F
<400> 1
accgaagctt tgaatatcct ccttagttcc 30
<210> 2
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY344R
<400> 2
cgccaagctt acggggcaac ctcatgtcaa gtgtaggctg gagctgcttc 50
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY246F
<400> 3
atggaattgc ccaatattat 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY246R
<400> 4
tcagcgcagc ttgtcggcca 20
<210> 5
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY247F
<400> 5
gaactaaatc aggcacttga gcatcaagat tggtg 35
<210> 6
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY247R
<400> 6
caccaatctt gatgctcaag tgcctgattt agttc 35
<210> 7
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY346F
<400> 7
atggttaaaa aatcactgcg ccagt 25
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY346R
<400> 8
ttacaaaccg tcggtgacga 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY142Fb
<400> 9
cacacggtca cactgcttcc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物MG110R
<400> 10
cgatgccctt gagagccttc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物MG17F
<400> 11
ataagtcgga caccatggca 20
<210> 12
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY80F
<400> 12
aatagcccgc tgatatcatc gataatacta aaaaaacagg gaggctatta gtgtaggctg 60
gagctgcttc 70
<210> 13
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY80R
<400> 13
accttaatgt aacatttcct tattattaaa gatcagctaa ttctttgttt tgaatatcct 60
ccttagttcc 70
<210> 14
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY333F
<400> 14
atgcgtaatg tgtgtattgc cgttgctgtc tttgccgcac ttgcggtgac ccggaatgaa 60
attaatacga ctc 73
<210> 15
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY333R
<400> 15
aacctgtcgc actccagaga agcacaaagc ctcgcaatcc agtgcaaagc tcacagtgga 60
gccaaagata 70
<210> 16
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY347F
<400> 16
ggccagctaa atcgatggga tgtggcttgc tatctttggc tccactgtga gggatgtgct 60
gcaaggcgat 70
<210> 17
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY347R
<400> 17
aacctgtcgc actccagaga agcacaaagc ctcgcaatcc agtgcaaagc acggggcaac 60
ctcatgtcaa 70
<210> 18
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY309F
<400> 18
accctcaaga gaaaatgtaa aagctgtctt tcgctgctga gggtgacgat cccgcgatcc 60
gtcagcctgc agttc 75
<210> 19
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY309R
<400> 19
ccgaaggtga gccagtgtga aagctgtctt tcgctgctga gggtgacgat cccgctgtag 60
gctggagctg cttcg 75
<210> 20
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY340Fa
<400> 20
accctcaaga gaaaatgtaa aagctgagca ccgcattagc cgctgcattg atgctgatcc 60
gtcagcctgc agttc 75
<210> 21
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY340Fb
<400> 21
accctcaaga gaaaatgtaa aagctgattg ctcacgttgg cggcccggct agcgtgatcc 60
gtcagcctgc agttc 75
<210> 22
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY340Ra
<400> 22
ccgaaggtga gccagtgtga gtacgtccgc cgtttgcgca tacagcggca cactttgtag 60
gctggagctg cttcg 75
<210> 23
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY340Rb
<400> 23
ccgaaggtga gccagtgtga accgccagcg cgaccggcag gttgatctcc tgctttgtag 60
gctggagctg cttcg 75
<210> 24
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY260F
<400> 24
tggctctttg cggcacccat cgttcgtaat gttccgtggc accgaggaca accctcaaga 60
gaaaatgtaa 70
<210> 25
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物IY260R
<400> 25
ccaaccttct taaacataaa gtgtctcctt ataaacgcag aaaggcccac ccgaaggtga 60
gccagtgtga 70
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK41F
<400> 26
ggaattactt cgcttcgcc 19
<210> 27
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK41R
<400> 27
cctccttatc tccctatagt gagtcgtatt aatttcattc cggggatccg tcgacc 56
<210> 28
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK42F
<400> 28
aaacgcgttt ctttggctta aaaagggaat gtgggttaca cgaagggtaa tgtaggctgg 60
agctgcttcg 70
<210> 29
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK42R
<400> 29
ggattttccc cagtaatggc atatatattt aaaaggttcc attaatagcc cctccttatc 60
tccctatagt 70
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK43F
<400> 30
gcagcattac acgtcttgag 20
<210> 31
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK43R
<400> 31
ctccttatct ccctatagtg agtcgtatta atttctgaat atcctcctta gttcc 55
<210> 32
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK44F
<400> 32
ttcgggaatg attgttatca atgacgataa taagaccaat aacggtttat gtgtaggctg 60
gagctgcttc 70
<210> 33
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK44R
<400> 33
cgcgggcgta cagggatcca gttatcaata agcaaattca tttgttctcc ctccttatct 60
ccctatagtg 70
<210> 34
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK29R
<400> 34
gactctcgag gccactgatc tctactgcag 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物RK33R
<400> 35
gactctcgag gcaacagcag caacatcaag 30
<210> 36
<211> 48502
<212> DNA
<213> λ噬菌体
<400> 36
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660
agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720
cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780
ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840
ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900
tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960
aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020
ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080
gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140
cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200
caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260
atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320
cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380
agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440
gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500
cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560
aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620
atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680
ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740
tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800
cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860
attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920
tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980
accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040
ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100
gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160
tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220
gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280
agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340
acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400
agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460
gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520
gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580
ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640
acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700
ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760
gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820
tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880
acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940
cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000
ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060
ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120
tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180
aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240
atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300
acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360
cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420
aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480
ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540
gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600
gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660
gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720
ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780
gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840
ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900
cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960
aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020
tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080
ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140
caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200
gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260
gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320
gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380
gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440
cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500
ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560
cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620
cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680
cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740
cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800
cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860
ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920
tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980
catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040
aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100
ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160
gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220
gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280
tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340
aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400
tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460
gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520
ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580
gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640
tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700
tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760
aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820
cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880
taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940
tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000
tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060
ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120
tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180
aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240
cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300
cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360
gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420
aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480
tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540
ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600
gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660
ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720
atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780
agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840
gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900
agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960
acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020
aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080
gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140
tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200
catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260
tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320
gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380
gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440
tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500
ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560
agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620
ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680
ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740
gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800
tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860
ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920
tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980
ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280
agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340
gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400
aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460
ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520
tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580
actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640
ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700
cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760
tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820
cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880
gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940
aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000
ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060
ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120
acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180
ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240
tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300
cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360
tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420
gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480
ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540
gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600
tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660
ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720
aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780
agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840
accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900
tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960
ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020
tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080
acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140
cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200
atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260
gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320
ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380
agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440
cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500
gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560
atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620
ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680
cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740
ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800
aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860
tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920
cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980
ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040
tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100
cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160
agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220
tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460
ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520
aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580
ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640
ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700
agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760
ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820
aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880
atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940
aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000
agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060
gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120
ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180
acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240
agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300
aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360
cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420
ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480
gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540
cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600
tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660
ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720
ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780
cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840
gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900
cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960
tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020
atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080
tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140
ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200
tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260
ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320
gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380
tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440
cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500
gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560
aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620
ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680
tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740
cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800
gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860
gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920
ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980
agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040
tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100
ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160
cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220
gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020
tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080
gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140
cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200
cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260
gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320
tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380
taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440
aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500
cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560
cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620
gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680
acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740
ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800
tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860
acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920
gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980
aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040
ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100
cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160
ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220
agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280
ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340
aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400
cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460
ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520
gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580
cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640
aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700
tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760
acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820
cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880
gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940
agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000
cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060
gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120
tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180
aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240
ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300
ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360
gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420
gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480
tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540
ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600
aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660
tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720
gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780
tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840
ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900
cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960
gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020
ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080
ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140
gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200
tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260
tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320
gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380
atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440
acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500
gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560
ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620
gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680
atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740
aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800
tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860
ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920
atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980
ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040
gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100
taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160
gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220
attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280
aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340
atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400
attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460
acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520
tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580
tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640
tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700
tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760
tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820
ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880
aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940
tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000
aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060
cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120
ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180
aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240
ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300
ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360
ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420
accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480
gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540
ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600
gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660
atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720
ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780
gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840
ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900
agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960
tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020
caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080
tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140
ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200
ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260
ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320
catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380
gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440
aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500
aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560
taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620
gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680
ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740
gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800
atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860
aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920
tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980
tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040
gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100
aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160
tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220
aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280
tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340
tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400
atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460
gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520
atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580
ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640
ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700
gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760
tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820
gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880
atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940
cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000
accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060
gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120
tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180
tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240
aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300
ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360
ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420
cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480
gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540
aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600
ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720
tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780
gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840
tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900
gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960
gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020
accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080
cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140
tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200
atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260
caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320
ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380
tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440
tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500
gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560
ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620
ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680
ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740
cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800
ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860
catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920
tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980
ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040
cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100
gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160
gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220
ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280
tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340
cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400
agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460
tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520
gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580
agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640
ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700
gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760
catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820
aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880
atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940
tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000
tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060
aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120
tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180
agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240
ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300
accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360
gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420
gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480
gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540
ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600
tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660
cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720
cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780
cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840
atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900
gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960
acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020
tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080
gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140
aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200
cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260
cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320
ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380
ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440
catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500
gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560
ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620
ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680
gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740
ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800
tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860
ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920
ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980
agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040
tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100
tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160
tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220
accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280
cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340
atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400
ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460
atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520
aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580
accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640
ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700
cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760
ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820
cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880
ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940
tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000
ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060
gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120
tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180
agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240
agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300
agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360
cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420
aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480
tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540
cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600
ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660
cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720
gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780
cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840
cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900
acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960
tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020
actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080
ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140
tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200
cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260
ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320
gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380
cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440
ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500
atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560
tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620
atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680
tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740
taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800
aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860
caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920
cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980
ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040
ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100
ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160
atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220
cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280
ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340
cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400
ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460
cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520
ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580
atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640
cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700
ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760
atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820
cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880
tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940
aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000
caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060
ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120
acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180
ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240
gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300
ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360
ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420
aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480
gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540
gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600
cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660
tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720
cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780
tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840
atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900
tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960
ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020
ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080
tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140
tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200
atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260
ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320
agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380
cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440
attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500
tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560
gcatcacctt tggtaaaggt tctaagctca ggtgagaaca tccctgcctg aacatgagaa 37620
aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680
tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740
gcaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800
cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860
ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920
ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980
gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040
atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100
aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160
tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220
aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280
atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340
tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400
gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460
cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520
gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580
tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640
gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700
aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760
gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820
accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880
ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940
tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000
tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060
aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120
acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180
tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240
ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300
aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360
ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420
tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480
acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540
ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600
agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660
acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720
tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780
gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840
caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900
ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960
ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020
cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080
atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140
cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200
gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260
gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320
taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380
tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440
aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500
ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560
taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620
tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680
atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740
tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800
taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860
agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920
gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980
tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040
tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100
ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160
taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220
tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280
cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340
aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400
cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460
tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520
aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580
cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640
catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700
attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760
aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820
ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880
cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940
ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000
ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060
ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120
taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180
tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240
ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300
aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360
tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420
ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480
ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540
cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600
gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660
gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720
gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780
accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840
gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900
gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960
ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020
atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080
agcatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140
aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200
tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260
gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320
atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380
gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440
gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500
ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560
aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620
aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680
ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740
tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800
tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860
tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920
aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980
tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040
ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100
atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160
ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220
gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280
aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340
ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400
ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460
caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520
ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580
tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640
ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700
cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760
aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820
aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880
ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940
cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000
cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060
gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120
tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180
aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240
aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300
gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tggttcattc 45360
gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420
tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480
ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540
tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600
gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660
ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720
taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780
cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840
atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900
cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960
gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020
tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080
aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140
gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200
atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260
gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320
tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380
aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440
gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500
gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560
aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620
agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680
aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740
catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800
aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860
tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920
ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980
tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040
tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100
caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160
ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220
aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280
cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340
agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400
aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460
ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520
ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580
agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640
agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700
aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760
tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820
ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880
aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940
ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000
tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060
aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120
acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180
gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240
catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300
catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360
aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420
gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480
tccggtgatc cgacaggtta cg 48502
<210> 37
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗NDM间隔区(N1)
<400> 37
ctgagcaccg cattagccgc tgcattgatg ct 32
<210> 38
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗NDM间隔区(N2)
<400> 38
caggagatca acctgccggt cgcgctggcg gt 32
<210> 39
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗NDM间隔区(N3)
<400> 39
cgatgtcggt gccgtcgatc ccaacggtga ta 32
<210> 40
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗CTX-M-15间隔区(C1)
<400> 40
tgtgccgctg tatgcgcaaa cggcggacgt ac 32
<210> 41
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗CTX-M-15间隔区(C2)
<400> 41
ctgattgctc acgttggcgg cccggctagc gt 32
<210> 42
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗CTX-M-15间隔区(C3)
<400> 42
caggcagtcc agcctgaatg ctcgctgcac cg 32
<210> 43
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗T4间隔区(T1)
<400> 43
gatcgtatgc tatccattac accagcggga cg 32
<210> 44
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗T4间隔区(T2)
<400> 44
tctgcatcac gagtaccttt catagtacga at 32
<210> 45
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 抗T4间隔区(T3)
<400> 45
cggagggcaa gaaatagctt cacggtccat at 32
<210> 46
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> NDM原始间隔区(N1)
<400> 46
aagctgagca ccgcattagc cgctgcattg atgct 35
<210> 47
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> NDM原始间隔区(N2)
<400> 47
aagcaggaga tcaacctgcc ggtcgcgctg gcggt 35
<210> 48
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> NDM原始间隔区(N3)
<400> 48
aagcgatgtc ggtgccgtcg atcccaacgg tgata 35
<210> 49
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> CTX-M-15原始间隔区(C1)
<400> 49
aagtgtgccg ctgtatgcgc aaacggcgga cgtac 35
<210> 50
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> CTX-M-15原始间隔区(C2)
<400> 50
aagctgattg ctcacgttgg cggcccggct agcgt 35
<210> 51
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> CTX-M-15原始间隔区(C3)
<400> 51
aagcaggcag tccagcctga atgctcgctg caccg 35
<210> 52
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> T4原始间隔区(T1)
<400> 52
aaggatcgta tgctatccat tacaccagcg ggacg 35
<210> 53
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> T4原始间隔区(T2)
<400> 53
aagtctgcat cacgagtacc tttcatagta cgaat 35
<210> 54
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> T4原始间隔区(T3)
<400> 54
aagcggaggg caagaaatag cttcacggtc catat 35
<210> 55
<211> 2022
<212> DNA
<213> 人工序列
<220>
<223> 具有原始间隔区T7-N1N2的T7噬菌体
<400> 55
atgatgaaca ttaagactaa cccgtttaaa gccgtgtctt tcgtagagtc tgccattaag 60
aaggctctgg ataacgctgg gtatcttatc gctgaaatca agtacgatgg tgtacgcggg 120
aacatctgcg tagacaatac tgctaacagt tactggctct ctcgtgtatc taaaacgatt 180
ccggcactgg agcacttaaa cgggtttgat gttcgctgga agcgtctact gaacgatgac 240
cgttgcttct acaaagatgg ctttatgctt gatggggaac tcatggtcaa gggcgtagac 300
tttaacacag ggtccggcct actgcgtacc aaatggactg acacgaagaa ccaagagttc 360
catgaagagt tattcgttga accaatccgt aagaaagata aagttccctt taagctgcac 420
actggacacc ttcacataaa actgtacgct atcctcccgc tgcacatcgt ggagtctgga 480
gaagactgtg atgtcatgac gttgctcatg caggaacacg ttaagaacat gctgcctctg 540
ctacaggaat acttccctga aatcgaatgg caagcggctg aatcttacga ggtctacgat 600
atggtagaac tacagcaact gtacgagcag aagcgagcag aaggccatga gggtctcatt 660
gtgaaagacc cgatgtgtat ctataagcgc ggtaagaaat ctggctggtg gaaaatgaaa 720
cctgagaacg aagctgacgg tatcattcag ggtctggtat ggggtacaaa aggtctggct 780
aatgaaggta aagtgattgg ttttgaggtg cttcttgaga gtggtcgttt agttaacgcc 840
acgaatatct ctcgcgcctt aatggatgag ttcactgaga cagtaaaaga ggccacccta 900
agtcaatggg gattctttag cccatacggt attggcgaca acgatgcttg tactattaac 960
ccttacgatg gctgggcgtg tcaaattagc tacatggagg aaacacctga tggctctttg 1020
cggcacccat cgttcgtaat gttccgtggc accgaggaca accctcaaga gaaaatgtaa 1080
aagctgagca ccgcattagc cgctgcattg atgctgatcc gtcagcctgc agttcgaagt 1140
tcctatactt tctagagaat aggaacttcg tgtggtagaa tatcagctta ctattgcttt 1200
acgaaagcgt atccggtgaa ataaagtcaa cctttagttg gttaatgtta caccaacaac 1260
gaaaccaaca cgccaggctt attcctgtgg agttatatat gagcgataaa attattcacc 1320
tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt 1380
tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg 1440
acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg 1500
cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg 1560
cggcaaccaa agtgggcgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc 1620
tggcgtaaga agttcctata ctttctagag aataggaact tcgaagcagc tccagcctac 1680
aaagcaggag atcaacctgc cggtcgcgct ggcggttcac actggctcac cttcgggtgg 1740
gcctttctgc gtttataagg agacacttta tgtttaagaa ggttggtaaa ttccttgcgg 1800
ctttggcagc tatcctgacg cttgcgtata ttcttgcggt ataccctcaa gtagcactag 1860
tagtagttgg cgcttgttac ttagcggcag tgtgtgcttg cgtgtggagt atagttaact 1920
ggtaatacga ctcactaaag gaggtacaca ccatgatgta cttaatgcca ttactcatcg 1980
tcattgtagg atgccttgcg ctccactgta gcgatgatga ta 2022
<210> 56
<211> 2022
<212> DNA
<213> 人工序列
<220>
<223> 具有原始间隔区T7-C2C1的T7噬菌体
<400> 56
atgatgaaca ttaagactaa cccgtttaaa gccgtgtctt tcgtagagtc tgccattaag 60
aaggctctgg ataacgctgg gtatcttatc gctgaaatca agtacgatgg tgtacgcggg 120
aacatctgcg tagacaatac tgctaacagt tactggctct ctcgtgtatc taaaacgatt 180
ccggcactgg agcacttaaa cgggtttgat gttcgctgga agcgtctact gaacgatgac 240
cgttgcttct acaaagatgg ctttatgctt gatggggaac tcatggtcaa gggcgtagac 300
tttaacacag ggtccggcct actgcgtacc aaatggactg acacgaagaa ccaagagttc 360
catgaagagt tattcgttga accaatccgt aagaaagata aagttccctt taagctgcac 420
actggacacc ttcacataaa actgtacgct atcctcccgc tgcacatcgt ggagtctgga 480
gaagactgtg atgtcatgac gttgctcatg caggaacacg ttaagaacat gctgcctctg 540
ctacaggaat acttccctga aatcgaatgg caagcggctg aatcttacga ggtctacgat 600
atggtagaac tacagcaact gtacgagcag aagcgagcag aaggccatga gggtctcatt 660
gtgaaagacc cgatgtgtat ctataagcgc ggtaagaaat ctggctggtg gaaaatgaaa 720
cctgagaacg aagctgacgg tatcattcag ggtctggtat ggggtacaaa aggtctggct 780
aatgaaggta aagtgattgg ttttgaggtg cttcttgaga gtggtcgttt agttaacgcc 840
acgaatatct ctcgcgcctt aatggatgag ttcactgaga cagtaaaaga ggccacccta 900
agtcaatggg gattctttag cccatacggt attggcgaca acgatgcttg tactattaac 960
ccttacgatg gctgggcgtg tcaaattagc tacatggagg aaacacctga tggctctttg 1020
cggcacccat cgttcgtaat gttccgtggc accgaggaca accctcaaga gaaaatgtaa 1080
aagctgattg ctcacgttgg cggcccggct agcgtgatcc gtcagcctgc agttcgaagt 1140
tcctatactt tctagagaat aggaacttcg tgtggtagaa tatcagctta ctattgcttt 1200
acgaaagcgt atccggtgaa ataaagtcaa cctttagttg gttaatgtta caccaacaac 1260
gaaaccaaca cgccaggctt attcctgtgg agttatatat gagcgataaa attattcacc 1320
tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt 1380
tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg 1440
acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg 1500
cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg 1560
cggcaaccaa agtgggcgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc 1620
tggcgtaaga agttcctata ctttctagag aataggaact tcgaagcagc tccagcctac 1680
aaagtgtgcc gctgtatgcg caaacggcgg acgtactcac actggctcac cttcgggtgg 1740
gcctttctgc gtttataagg agacacttta tgtttaagaa ggttggtaaa ttccttgcgg 1800
ctttggcagc tatcctgacg cttgcgtata ttcttgcggt ataccctcaa gtagcactag 1860
tagtagttgg cgcttgttac ttagcggcag tgtgtgcttg cgtgtggagt atagttaact 1920
ggtaatacga ctcactaaag gaggtacaca ccatgatgta cttaatgcca ttactcatcg 1980
tcattgtagg atgccttgcg ctccactgta gcgatgatga ta 2022
<210> 57
<211> 2022
<212> DNA
<213> 人工序列
<220>
<223> 具有原始间隔区T7N1C1的T7噬菌体
<400> 57
atgatgaaca ttaagactaa cccgtttaaa gccgtgtctt tcgtagagtc tgccattaag 60
aaggctctgg ataacgctgg gtatcttatc gctgaaatca agtacgatgg tgtacgcggg 120
aacatctgcg tagacaatac tgctaacagt tactggctct ctcgtgtatc taaaacgatt 180
ccggcactgg agcacttaaa cgggtttgat gttcgctgga agcgtctact gaacgatgac 240
cgttgcttct acaaagatgg ctttatgctt gatggggaac tcatggtcaa gggcgtagac 300
tttaacacag ggtccggcct actgcgtacc aaatggactg acacgaagaa ccaagagttc 360
catgaagagt tattcgttga accaatccgt aagaaagata aagttccctt taagctgcac 420
actggacacc ttcacataaa actgtacgct atcctcccgc tgcacatcgt ggagtctgga 480
gaagactgtg atgtcatgac gttgctcatg caggaacacg ttaagaacat gctgcctctg 540
ctacaggaat acttccctga aatcgaatgg caagcggctg aatcttacga ggtctacgat 600
atggtagaac tacagcaact gtacgagcag aagcgagcag aaggccatga gggtctcatt 660
gtgaaagacc cgatgtgtat ctataagcgc ggtaagaaat ctggctggtg gaaaatgaaa 720
cctgagaacg aagctgacgg tatcattcag ggtctggtat ggggtacaaa aggtctggct 780
aatgaaggta aagtgattgg ttttgaggtg cttcttgaga gtggtcgttt agttaacgcc 840
acgaatatct ctcgcgcctt aatggatgag ttcactgaga cagtaaaaga ggccacccta 900
agtcaatggg gattctttag cccatacggt attggcgaca acgatgcttg tactattaac 960
ccttacgatg gctgggcgtg tcaaattagc tacatggagg aaacacctga tggctctttg 1020
cggcacccat cgttcgtaat gttccgtggc accgaggaca accctcaaga gaaaatgtaa 1080
aagctgagca ccgcattagc cgctgcattg atgctgatcc gtcagcctgc agttcgaagt 1140
tcctatactt tctagagaat aggaacttcg tgtggtagaa tatcagctta ctattgcttt 1200
acgaaagcgt atccggtgaa ataaagtcaa cctttagttg gttaatgtta caccaacaac 1260
gaaaccaaca cgccaggctt attcctgtgg agttatatat gagcgataaa attattcacc 1320
tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt 1380
tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg 1440
acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg 1500
cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg 1560
cggcaaccaa agtgggcgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc 1620
tggcgtaaga agttcctata ctttctagag aataggaact tcgaagcagc tccagcctac 1680
aaagtgtgcc gctgtatgcg caaacggcgg acgtactcac actggctcac cttcgggtgg 1740
gcctttctgc gtttataagg agacacttta tgtttaagaa ggttggtaaa ttccttgcgg 1800
ctttggcagc tatcctgacg cttgcgtata ttcttgcggt ataccctcaa gtagcactag 1860
tagtagttgg cgcttgttac ttagcggcag tgtgtgcttg cgtgtggagt atagttaact 1920
ggtaatacga ctcactaaag gaggtacaca ccatgatgta cttaatgcca ttactcatcg 1980
tcattgtagg atgccttgcg ctccactgta gcgatgatga ta 2022
<210> 58
<211> 2022
<212> DNA
<213> 人工序列
<220>
<223> 具有原始间隔区T7-C2N2的T7噬菌体
<400> 58
atgatgaaca ttaagactaa cccgtttaaa gccgtgtctt tcgtagagtc tgccattaag 60
aaggctctgg ataacgctgg gtatcttatc gctgaaatca agtacgatgg tgtacgcggg 120
aacatctgcg tagacaatac tgctaacagt tactggctct ctcgtgtatc taaaacgatt 180
ccggcactgg agcacttaaa cgggtttgat gttcgctgga agcgtctact gaacgatgac 240
cgttgcttct acaaagatgg ctttatgctt gatggggaac tcatggtcaa gggcgtagac 300
tttaacacag ggtccggcct actgcgtacc aaatggactg acacgaagaa ccaagagttc 360
catgaagagt tattcgttga accaatccgt aagaaagata aagttccctt taagctgcac 420
actggacacc ttcacataaa actgtacgct atcctcccgc tgcacatcgt ggagtctgga 480
gaagactgtg atgtcatgac gttgctcatg caggaacacg ttaagaacat gctgcctctg 540
ctacaggaat acttccctga aatcgaatgg caagcggctg aatcttacga ggtctacgat 600
atggtagaac tacagcaact gtacgagcag aagcgagcag aaggccatga gggtctcatt 660
gtgaaagacc cgatgtgtat ctataagcgc ggtaagaaat ctggctggtg gaaaatgaaa 720
cctgagaacg aagctgacgg tatcattcag ggtctggtat ggggtacaaa aggtctggct 780
aatgaaggta aagtgattgg ttttgaggtg cttcttgaga gtggtcgttt agttaacgcc 840
acgaatatct ctcgcgcctt aatggatgag ttcactgaga cagtaaaaga ggccacccta 900
agtcaatggg gattctttag cccatacggt attggcgaca acgatgcttg tactattaac 960
ccttacgatg gctgggcgtg tcaaattagc tacatggagg aaacacctga tggctctttg 1020
cggcacccat cgttcgtaat gttccgtggc accgaggaca accctcaaga gaaaatgtaa 1080
aagctgattg ctcacgttgg cggcccggct agcgtgatcc gtcagcctgc agttcgaagt 1140
tcctatactt tctagagaat aggaacttcg tgtggtagaa tatcagctta ctattgcttt 1200
acgaaagcgt atccggtgaa ataaagtcaa cctttagttg gttaatgtta caccaacaac 1260
gaaaccaaca cgccaggctt attcctgtgg agttatatat gagcgataaa attattcacc 1320
tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt 1380
tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg 1440
acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg 1500
cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg 1560
cggcaaccaa agtgggcgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc 1620
tggcgtaaga agttcctata ctttctagag aataggaact tcgaagcagc tccagcctac 1680
aaagcaggag atcaacctgc cggtcgcgct ggcggttcac actggctcac cttcgggtgg 1740
gcctttctgc gtttataagg agacacttta tgtttaagaa ggttggtaaa ttccttgcgg 1800
ctttggcagc tatcctgacg cttgcgtata ttcttgcggt ataccctcaa gtagcactag 1860
tagtagttgg cgcttgttac ttagcggcag tgtgtgcttg cgtgtggagt atagttaact 1920
ggtaatacga ctcactaaag gaggtacaca ccatgatgta cttaatgcca ttactcatcg 1980
tcattgtagg atgccttgcg ctccactgta gcgatgatga ta 2022
<210> 59
<211> 48528
<212> DNA
<213> 人工序列
<220>
<223> 具有cas蛋白和CRISPR阵列的重组λ噬菌体
IYMMPh3
<400> 59
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660
agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720
cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780
ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840
ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900
tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960
aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020
ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080
gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140
cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200
caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260
atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320
cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380
agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440
gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500
cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560
aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620
atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680
ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740
tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800
cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860
attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920
tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980
accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040
ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100
gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160
tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220
gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280
agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340
acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400
agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460
gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520
gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580
ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640
acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700
ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760
gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820
tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880
acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940
cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000
ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060
ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120
tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180
aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240
atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300
acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360
cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420
aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480
ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540
gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600
gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660
gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720
ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780
gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840
ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900
cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960
aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020
tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080
ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140
caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200
gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260
gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320
gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380
gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440
cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500
ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560
cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620
cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680
cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740
cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800
cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860
ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920
tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980
catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040
aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100
ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160
gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220
gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280
tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340
aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400
tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460
gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520
ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580
gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640
tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700
tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760
aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820
cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880
taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940
tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000
tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060
ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120
tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180
aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240
cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300
cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360
gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420
aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480
tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540
ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600
gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660
ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720
atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780
agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840
gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900
agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960
acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020
aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080
gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140
tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200
catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260
tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320
gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380
gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440
tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500
ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560
agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620
ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680
ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740
gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800
tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860
ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920
tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980
ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280
agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340
gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400
aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460
ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520
tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580
actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640
ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700
cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760
tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820
cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880
gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940
aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000
ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060
ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120
acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180
ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240
tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300
cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360
tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420
gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480
ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540
gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600
tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660
ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720
aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780
agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840
accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900
tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960
ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020
tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080
acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140
cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200
atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260
gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320
ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380
agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440
cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500
gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560
atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620
ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680
cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740
ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800
aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860
tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920
cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980
ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040
tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100
cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160
agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220
tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460
ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520
aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580
ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640
ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700
agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760
ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820
aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880
atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940
aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000
agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060
gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120
ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180
acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240
agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300
aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360
cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420
ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480
gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540
cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600
tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660
ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720
ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780
cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840
gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900
cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960
tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020
atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080
tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140
ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200
tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260
ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320
gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380
tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440
cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500
gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560
aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620
ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680
tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740
cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800
gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860
gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920
ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980
agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040
tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100
ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160
cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220
gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacccggaa 19020
tgaaattaat acgactcact atagggagat aaggaggggc tattaatgga accttttaaa 19080
tatatatgcc attactgggg aaaatcctca aaaagcttga cgaaaggaaa tgatattcat 19140
ctgttaattt atcattgcct tgatgttgct gctgttgcag attgctggtg ggatcaatca 19200
gtcgtactgc aaaatacttt ttgccgaaat gaaatgctat caaaacagag ggtgaaggcc 19260
tggctgttat ttttcattgc tcttcatgat attggaaagt ttgatatacg attccaatat 19320
aaatcagcag aaagttggct gaaattaaat cctgcaacgc catcacttaa tggtccatca 19380
acacaaatgt gccgtaaatt taatcatggt gcagccggtc tgtattggtt taaccaggat 19440
tcactttcag agcaatctct cggggatttt ttcagttttt ttgatgccgc tcctcatcct 19500
tatgagtcct ggtttccatg ggtagaggcc gttacaggac atcatggttt tatattacat 19560
tcccaggatc aagataagtc gcgttgggaa atgccagctt ctctggcatc ttatgctgcg 19620
caagataaac aggctcgtga ggagtggata tctgtactgg aagcattatt tttaacgcca 19680
gcggggttat ctataaacga tataccacct gattgttcat cactgttagc aggtttttgc 19740
tcgcttgctg actggttagg ctcctggact acaacgaata cctttctgtt taatgaggat 19800
gcgccttccg acataaatgc tctgagaacg tatttccagg accgacagca ggatgcgagc 19860
cgggtattgg agttgagtgg acttgtatca aataagcgat gttatgaagg tgttcatgca 19920
ctactggaca atggctatca acccagacaa ttacaggtgt tagttgatgc tcttccagta 19980
gctcccgggc tgacggtaat agaggcacct acaggctccg gtaaaacgga aacagcgctg 20040
gcctatgctt ggaaacttat tgatcaacaa attgcggata gtgttatttt tgccctccca 20100
acacaagcta ccgcgaatgc tatgcttacg agaatggaag cgagcgcgag ccacttattt 20160
tcatccccaa atcttattct tgctcatggc aattcacggt ttaaccacct ctttcaatca 20220
ataaaatcac gcgcgattac tgaacagggg caagaagaag cgtgggttca gtgttgtcag 20280
tggttgtcac aaagcaataa gaaagtgttt cttgggcaaa tcggcgtttg cacgattgat 20340
caggtgttga tatcggtatt gccagttaaa caccgcttta tccgtggttt gggaattggt 20400
cgaagtgttt taattgttga tgaagttcat gcttacgaca cctatatgaa cggcttgctg 20460
gaggcagtgc tcaaggctca ggctgatgtg ggagggagtg ttattcttct ttccgcaacc 20520
ctaccaatga aacaaaaaca gaaacttctg gatacttatg gtctgcatac agatccagtg 20580
gaaaataact ccgcatatcc actcattaac tggcgaggtg tgaatggtgc gcaacgtttt 20640
gatctgctag ctcatccaga acaactcccg ccccgctttt cgattcagcc agaacctatt 20700
tgtttagctg acatgttacc tgaccttacg atgttagagc gaatgatcgc agcggcaaac 20760
gcgggtgcac aggtctgtct tatttgcaat ttggttgacg ttgcacaagt atgctaccaa 20820
cggctaaagg agctaaataa cacgcaagta gatatagatt tgtttcatgc gcgctttacg 20880
ctgaacgatc gtcgtgaaaa agagaatcga gttattagca atttcggcaa aaatgggaag 20940
cgaaatgttg gacggatact tgtcgcaacc caggtcgtgg aacaatcact cgacgttgat 21000
tttgattggt taattactca gcattgtcct gcagatttgc ttttccaacg attgggccgt 21060
ttacatcgcc atcatcgcaa atatcgtccc gctggttttg agattcctgt tgccaccatt 21120
ttgctgcctg atggcgaggg ttacggacga catgagcata tttatagcaa cgttagagtc 21180
atgtggcgga cgcagcaaca tattgaggag cttaatggag catccttatt tttccctgat 21240
gcttaccggc aatggctgga tagcatttac gatgatgcgg aaatggatga gccagaatgg 21300
gtcggcaatg gcatggataa atttgaaagc gccgagtgtg aaaaaaggtt caaggctcgc 21360
aaggtcctgc agtgggctga agaatatagc ttgcaggata acgatgaaac cattcttgcg 21420
gtaacgaggg atggggaaat gagcctgcca ttattgcctt atgtacaaac gtcttcaggt 21480
aaacaactgc tcgatggcca ggtctacgag gacctaagtc atgaacagca gtatgaggcg 21540
cttgcactta atcgcgtcaa tgtacccttc acctggaaac gtagtttttc tgaagtagta 21600
gatgaagatg ggttactttg gctggaaggg aaacagaatc tggatggatg ggtctggcag 21660
ggtaacagta ttgttattac ctatacaggg gatgaaggga tgaccagagt catccctgca 21720
aatcccaaat aacttcggga atgattgtta tcaatgacga taataagacc aataacggtt 21780
tatgtgtagg ctggagctgc ttcgaagttc ctatactttc tagagaatag gaacttcgga 21840
ataggaacta aggaggatat tcagaaatta atacgactca ctatagggag ataaggaggg 21900
agaacaaatg aatttgctta ttgataactg gatccctgta cgcccgcgaa acggggggaa 21960
agtccaaatc ataaatctgc aatcgctata ctgcagtaga gatcagtggc gattaagttt 22020
gccccgtgac gatatggaac tggccgcttt agcactgctg gtttgcattg ggcaaattat 22080
cgccccggca aaagatgacg ttgaatttcg acatcgcata atgaatccgc tcactgaaga 22140
tgagtttcaa caactcatcg cgccgtggat agatatgttc taccttaatc acgcagaaca 22200
tccctttatg cagaccaaag gtgtcaaagc aaatgatgtg actccaatgg aaaaactgtt 22260
ggctggggta agcggcgcga cgaattgtgc atttgtcaat caaccggggc agggtgaagc 22320
attatgtggt ggatgcactg cgattgcgtt attcaaccag gcgaatcagg caccaggttt 22380
tggtggtggt tttaaaagcg gtttacgtgg aggaacacct gtaacaacgt tcgtacgtgg 22440
gatcgatctt cgttcaacgg tgttactcaa tgtcctcaca ttacctcgtc ttcaaaaaca 22500
atttcctaat gaatcacata cggaaaacca acctacctgg attaaaccta tcaagtccaa 22560
tgagtctata cctgcttcgt caattgggtt tgtccgtggt ctattctggc aaccagcgca 22620
tattgaatta tgcgatccca ttgggattgg taaatgttct tgctgtggac aggaaagcaa 22680
tttgcgttat accggttttc ttaaggaaaa atttaccttt acagttaatg ggctatggcc 22740
ccatccgcat tccccttgtc tggtaacagt caagaaaggg gaggttgagg aaaaatttct 22800
tgctttcacc acctccgcac catcatggac acaaatcagc cgagttgtgg tagataagat 22860
tattcaaaat gaaaatggaa atcgcgtggc ggcggttgtg aatcaattca gaaatattgc 22920
gccgcaaagt cctcttgaat tgattatggg gggatatcgt aataatcaag catctattct 22980
tgaacggcgt catgatgtgt tgatgtttaa tcaggggtgg caacaatacg gcaatgtgat 23040
aaacgaaata gtgactgttg gtttgggata taaaacagcc ttacgcaagg cgttatatac 23100
ctttgcagaa gggtttaaaa ataaagactt caaaggggcc ggagtctctg ttcatgagac 23160
tgcagaaagg catttctatc gacagagtga attattaatt cccgatgtac tggcgaatgt 23220
taatttttcc caggctgatg aggtaatagc tgatttacga gacaaacttc atcaattgtg 23280
tgaaatgcta tttaatcaat ctgtagctcc ctatgcacat catcctaaat taataagcac 23340
attagcgctt gcccgcgcca cgctatacaa acatttacgg gagttaaaac cgcaaggagg 23400
gccatcaaat ggctgatgaa attgatgcaa tggctttata tcgagcctgg caacaactgg 23460
ataatggatc atgtgcgcaa attagacgtg tttcagaacc tgatgaatta cgcgatatcc 23520
ctgcgtttta taggctggtg caaccttttg gttgggaaaa cccacgtcac cagcaggctc 23580
ttttgcgcat ggtgttttgc ctgagcgcag gaaagaatgt catccgacat caggacaaaa 23640
aatcggagca aacaacaggt atctcgttgg gaagagcttt agccaatagt ggaagaatta 23700
acgagcgccg tatctttcaa ttaattcggg ctgacagaac agccgatatg gtccagttac 23760
gtcgattact tactcacgcc gaacccgtac ttgactggcc attaatggcc aggatgttga 23820
cctggtgggg aaagcgcgaa cgccagcaac ttctggaaga ttttgtattg accacaaaca 23880
aaaatgcgta aggaaacctt tctatgtcta actttatcaa tattcatgtt ctgatctctc 23940
acagcccttc atgtctgaac cgcgacgata tgaacatgca gaaagacgct attttcggcg 24000
gcaaaagacg agtaagaatt tcaagtcaaa gccttaaacg tgcgatgcgt aaaagtggtt 24060
attacgcaca aaatattggt gaatccagtc tcagaaccat tcatcttgca caattacgtg 24120
atgttcttcg gcaaaaactt ggtgaacgtt ttgaccaaaa aatcatcgat aagacattag 24180
cgctgctctc cggtaaatca gttgatgaag ccgaaaagat ttctgccgat gcggttactc 24240
cctgggttgt gggagaaata gcctggttct gtgagcaggt tgcaaaagca gaggctgata 24300
atctggatga taaaaagctg ctcaaagttc ttaaggaaga tattgccgcc atacgtgtga 24360
atttacagca gggtgttgat attgcgctta gtggaagaat ggcaaccagc ggcatgatga 24420
ctgagttggg aaaagttgat ggtgcaatgt ccattgcgca tgcgatcact actcatcagg 24480
ttgattctga tattgactgg ttcaccgctg tagatgattt acaggaacaa ggttctgcac 24540
atctgggaac tcaggaattt tcatcgggtg ttttttatcg ttatgccaac attaacctcg 24600
ctcaacttca ggaaaattta ggtggtgcct ccagggagca ggctctggaa attgcaaccc 24660
atgttgttca tatgctggca acagaggtcc ctggagcaaa acagcgtact tatgccgctt 24720
ttaaccctgc ggatatggta atggttaatt tctccgatat gccactttct atggcaaatg 24780
cttttgaaaa agcggttaaa gcgaaagatg gctttttgca accgtctata caggcgttta 24840
atcaatattg ggatcgcgtt gccaatggat atggtctgaa cggagctgct gcgcaattca 24900
gcttatctga tgtagaccca attactgctc aagttaaaca aatgcctact ttagaacagt 24960
taaaatcctg ggttcgtaat aatggcgagg cgtgaacatg agatcttatt tgatcttgcg 25020
gcttgctggg ccaatgcaag cctgggggca gccgaccttt gaaggaacgc gacctaccgg 25080
aagatttccg acccgaagcg ggttattagg gctactcggg gcttgtcttg ggatccaacg 25140
tgatgatact tcttcattac aggcgttatc agagagtgtg caatttgcag tgcgctgcga 25200
tgaactcatt cttgacgatc gtcgtgtgtc tgtaacgggg ttgcgtgatt accatacagt 25260
ccttggagcg cgagaagatt accgtggttt gaaaagtcat gaaacgattc aaacatggcg 25320
cgaatattta tgtgatgcct cctttaccgt cgctctctgg ttaacacccc atgcaacgat 25380
ggttatctca gaacttgaaa aagcagtatt aaagcctcgg tatacacctt acctggggcg 25440
gagaagttgc ccactaacac acccgctttt tttggggaca tgtcaggcat cggatcctca 25500
gaaggcgcta ttaaattatg agcccgttgg cggcgatata tatagtgagg aatcagttac 25560
agggcatcat ttaaaattta cggcgcgcga cgaaccgatg atcaccttgc ctcgacaatt 25620
tgcttcccga gaatggtatg tgattaaagg aggtatggat gtatctcagt aaagtcatca 25680
ttgccagggc ctggagcagg gatctttacc aacttcacca gggattatgg catttatttc 25740
caaacagacc ggatgctgct cgtgattttc tttttcatgt tgagaagcga aacacaccag 25800
aaggctgtca tgttttattg cagtcagcgc aaatgcctgt ttcaactgcc gttgcgacag 25860
tcattaaaac taaacaggtt gaatttcaac ttcaggttgg tgttccactc tattttcggc 25920
ttcgggcaaa tccgatcaaa actattctcg acaatcaaaa gcgcctggac agtaaaggga 25980
atattaaacg ctgtcgggtt ccgttaataa aagaagcaga acaaatcgcg tggttgcaac 26040
gtaaattggg caatgcggcg cgcgttgaag atgtgcatcc catatcggaa cggccacagt 26100
atttttctgg tgatggtaaa agtggaaaga tccaaacggt ttgctttgaa ggtgtgctca 26160
ccatcaacga cgcgccagcg ttaatagatc ttgtacagca aggtattggg ccagctaaat 26220
cgatgggatg tggcttgcta tctttggctc cactgtgagg gatgtgctgc aaggcgatta 26280
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 26340
aattaatacg actcactata gggcccgggg gatccggaaa acaaagaatt agctgatctt 26400
taataataag gaaatgttac attaaggttg gtgggttgtt tttatgggaa aaaatgcttt 26460
aagaacaaat gtatactttt agagagttcc ccgcgccagc ggggataaac cgctgagcac 26520
cgcattagcc gctgcattga tgctgagttc cccgcgccag cggggataaa ccgcaggaga 26580
tcaacctgcc ggtcgcgctg gcggtgagtt ccccgcgcca gcggggataa accgcgatgt 26640
cggtgccgtc gatcccaacg gtgatagagt tccccgcgcc agcggggata aaccgtgtgc 26700
cgctgtatgc gcaaacggcg gacgtacgag ttccccgcgc cagcggggat aaaccgctga 26760
ttgctcacgt tggcggcccg gctagcgtga gttccccgcg ccagcgggga taaaccgcag 26820
gcagtccagc ctgaatgctc gctgcaccgg agttccccgc gccagcgggg ataaaccgga 26880
tcgtatgcta tccattacac cagcgggacg gagttccccg cgccagcggg gataaaccgt 26940
ctgcatcacg agtacctttc atagtacgaa tgagttcccc gcgccagcgg ggataaaccg 27000
cggagggcaa gaaatagctt cacggtccat atgagttccc cgcgccagcg gggataaacc 27060
ggtgatatcg catgcaagct ttgaatatcc tccttagttc ctattccgaa gttcctattc 27120
tctagaaagt ataggaactt cggcgcgcct acctgtgacg gaagatcact tcgcagaata 27180
aataaatcct ggtgtccctg ttgataccgg gaagccctgg gccaactttt ggcgaaaatg 27240
agacgttgat cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc 27300
gggcgtattt tttgagttgt cgagattttc aggagctaag gaagctaaaa tggagaaaaa 27360
aatcactgga tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc 27420
atttcagtca gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt 27480
tttaaagacc gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc 27540
ccgcctgatg aatgctcatc cggaattacg tatggcaatg aaagacggtg agctggtgat 27600
atgggatagt gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc 27660
gctctggagt gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt 27720
ggcgtgttac ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt 27780
cgtctcagcc aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga 27840
caacttcttc gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct 27900
gatgccgctg gcgattcagg ttcatcatgc cgtttgtgat ggcttccatg tcggcagatg 27960
cttaatgaat acaacagtac tgcgatgagt ggcagggcgg ggcgtaaggc gcgccattta 28020
aatgaagttc ctattccgaa gttcctattc tctagaaagt ataggaactt cgaagcagct 28080
ccagcctaca cttgacatga ggttgccccg tgctttgcac tggattgcga ggctttgtgc 28140
ttctctggag tgcgacaggt ttgatgacaa aaaattagcg caagaagaca aaaatcacct 28200
tgcgctaatg ctctgttaca ggtcactaat accatctaag tagttgattc atagtgactg 28260
catatgttgt gttttacagt attatgtagt ctgtttttta tgcaaaatct aatttaatat 28320
attgatattt atatcatttt acgtttctcg ttcagctttt ttatactaag ttggcattat 28380
aaaaaagcat tgcttatcaa tttgttgcaa cgaacaggtc actatcagtc aaaataaaat 28440
cattatttga tttcaatttt gtcccactcc ctgcctctgt catcacgata ctgtgatgcc 28500
atggtgtccg acttatgccc gagaagatgt tgagcaaact tatcgcttat ctgcttctca 28560
tagagtcttg cagacaaact gcgcaactcg tgaaaggtag gcggatcccc ttcgaaggaa 28620
agacctgatg cttttcgtgc gcgcataaaa taccttgata ctgtgccgga tgaaagcggt 28680
tcgcgacgag tagatgcaat tatggtttct ccgccaagaa tctctttgca tttatcaagt 28740
gtttccttca ttgatattcc gagagcatca atatgcaatg ctgttgggat ggcaattttt 28800
acgcctgttt tgctttgctc gacataaaga tatccatcta cgatatcaga ccacttcatt 28860
tcgcataaat caccaactcg ttgcccggta acaacagcca gttccattgc aagtctgagc 28920
caacatggtg atgattctgc tgcttgataa attttcaggt attcgtcagc cgtaagtctt 28980
gatctcctta cctctgattt tgctgcgcga gtggcagcga catggtttgt tgttatatgg 29040
ccttcagcta ttgcctctcg gaatgcatcg ctcagtgttg atctgattaa cttggctgac 29100
gccgccttgc cctcgtctat gtatccattg agcattgccg caatttcttt tgtggtgatg 29160
tcttcaagtg gagcatcagg cagacccctc cttattgctt taattttgct catgtaattt 29220
atgagtgtct tctgcttgat tcctctgctg gccaggattt tttcgtagcg atcaagccat 29280
gaatgtaacg taacggaatt atcactgttg attctcgctg tcagaggctt gtgtttgtgt 29340
cctgaaaata actcaatgtt ggcctgtata gcttcagtga ttgcgattcg cctgtctctg 29400
cctaatccaa actctttacc cgtccttggg tccctgtagc agtaatatcc attgtttctt 29460
atataaaggt tagggggtaa atcccggcgc tcatgacttc gccttcttcc catttctgat 29520
cctcttcaaa aggccacctg ttactggtcg atttaagtca acctttaccg ctgattcgtg 29580
gaacagatac tctcttccat ccttaaccgg aggtgggaat atcctgcatt cccgaaccca 29640
tcgacgaact gtttcaaggc ttcttggacg tcgctggcgt gcgttccact cctgaagtgt 29700
caagtacatc gcaaagtctc cgcaattaca cgcaagaaaa aaccgccatc aggcggcttg 29760
gtgttctttc agttcttcaa ttcgaatatt ggttacgtct gcatgtgcta tctgcgccca 29820
tatcatccag tggtcgtagc agtcgttgat gttctccgct tcgataactc tgttgaatgg 29880
ctctccattc cattctcctg tgactcggaa gtgcatttat catctccata aaacaaaacc 29940
cgccgtagcg agttcagata aaataaatcc ccgcgagtgc gaggattgtt atgtaatatt 30000
gggtttaatc atctatatgt tttgtacaga gagggcaagt atcgtttcca ccgtactcgt 30060
gataataatt ttgcacggta tcagtcattt ctcgcacatt gcagaatggg gatttgtctt 30120
cattagactt ataaaccttc atggaatatt tgtatgccga ctctatatct ataccttcat 30180
ctacataaac accttcgtga tgtctgcatg gagacaagac accggatctg cacaacattg 30240
ataacgccca atctttttgc tcagactcta actcattgat actcatttat aaactccttg 30300
caatgtatgt cgtttcagct aaacggtatc agcaatgttt atgtaaagaa acagtaagat 30360
aatactcaac ccgatgtttg agtacggtca tcatctgaca ctacagactc tggcatcgct 30420
gtgaagacga cgcgaaattc agcattttca caagcgttat cttttacaaa accgatctca 30480
ctctcctttg atgcgaatgc cagcgtcaga catcatatgc agatactcac ctgcatcctg 30540
aacccattga cctccaaccc cgtaatagcg atgcgtaatg atgtcgatag ttactaacgg 30600
gtcttgttcg attaactgcc gcagaaactc ttccaggtca ccagtgcagt gcttgataac 30660
aggagtcttc ccaggatggc gaacaacaag aaactggttt ccgtcttcac ggacttcgtt 30720
gctttccagt ttagcaatac gcttactccc atccgagata acaccttcgt aatactcacg 30780
ctgctcgttg agttttgatt ttgctgtttc aagctcaaca cgcagtttcc ctactgttag 30840
cgcaatatcc tcgttctcct ggtcgcggcg tttgatgtat tgctggtttc tttcccgttc 30900
atccagcagt tccagcacaa tcgatggtgt taccaattca tggaaaaggt ctgcgtcaaa 30960
tccccagtcg tcatgcattg cctgctctgc cgcttcacgc agtgcctgag agttaatttc 31020
gctcacttcg aacctctctg tttactgata agttccagat cctcctggca acttgcacaa 31080
gtccgacaac cctgaacgac caggcgtctt cgttcatcta tcggatcgcc acactcacaa 31140
caatgagtgg cagatatagc ctggtggttc aggcggcgca tttttattgc tgtgttgcgc 31200
tgtaattctt ctatttctga tgctgaatca atgatgtctg ccatctttca ttaatccctg 31260
aactgttggt taatacgctt gagggtgaat gcgaataata aaaaaggagc ctgtagctcc 31320
ctgatgattt tgcttttcat gttcatcgtt ccttaaagac gccgtttaac atgccgattg 31380
ccaggcttaa atgagtcggt gtgaatccca tcagcgttac cgtttcgcgg tgcttcttca 31440
gtacgctacg gcaaatgtca tcgacgtttt tatccggaaa ctgctgtctg gctttttttg 31500
atttcagaat tagcctgacg ggcaatgctg cgaagggcgt tttcctgctg aggtgtcatt 31560
gaacaagtcc catgtcggca agcataagca cacagaatat gaagcccgct gccagaaaaa 31620
tgcattccgt ggttgtcata cctggtttct ctcatctgct tctgctttcg ccaccatcat 31680
ttccagcttt tgtgaaaggg atgcggctaa cgtatgaaat tcttcgtctg tttctactgg 31740
tattggcaca aacctgattc caatttgagc aaggctatgt gccatctcga tactcgttct 31800
taactcaaca gaagatgctt tgtgcataca gcccctcgtt tattatttat ctcctcagcc 31860
agccgctgtg ctttcagtgg atttcggata acagaaaggc cgggaaatac ccagcctcgc 31920
tttgtaacgg agtagacgaa agtgattgcg cctacccgga tattatcgtg aggatgcgtc 31980
atcgccattg ctccccaaat acaaaaccaa tttcagccag tgcctcgtcc attttttcga 32040
tgaactccgg cacgatctcg tcaaaactcg ccatgtactt ttcatcccgc tcaatcacga 32100
cataatgcag gccttcacgc ttcatacgcg ggtcatagtt ggcaaagtac caggcatttt 32160
ttcgcgtcac ccacatgctg tactgcacct gggccatgta agctgacttt atggcctcga 32220
aaccaccgag ccggaacttc atgaaatccc gggaggtaaa cgggcatttc agttcaaggc 32280
cgttgccgtc actgcataaa ccatcgggag agcaggcggt acgcatactt tcgtcgcgat 32340
agatgatcgg ggattcagta acattcacgc cggaagtgaa ttcaaacagg gttctggcgt 32400
cgttctcgta ctgttttccc caggccagtg ctttagcgtt aacttccgga gccacaccgg 32460
tgcaaacctc agcaagcagg gtgtggaagt aggacatttt catgtcaggc cacttctttc 32520
cggagcgggg ttttgctatc acgttgtgaa cttctgaagc ggtgatgacg ccgagccgta 32580
atttgtgcca cgcatcatcc ccctgttcga cagctctcac atcgatcccg gtacgctgca 32640
ggataatgtc cggtgtcatg ctgccacctt ctgctctgcg gctttctgtt tcaggaatcc 32700
aagagctttt actgcttcgg cctgtgtcag ttctgacgat gcacgaatgt cgcggcgaaa 32760
tatctgggaa cagagcggca ataagtcgtc atcccatgtt ttatccaggg cgatcagcag 32820
agtgttaatc tcctgcatgg tttcatcgtt aaccggagtg atgtcgcgtt ccggctgacg 32880
ttctgcagtg tatgcagtat tttcgacaat gcgctcggct tcatccttgt catagatacc 32940
agcaaatccg aaggccagac gggcacactg aatcatggct ttatgacgta acatccgttt 33000
gggatgcgac tgccacggcc ccgtgatttc tctgccttcg cgagttttga atggttcgcg 33060
gcggcattca tccatccatt cggtaacgca gatcggatga ttacggtcct tgcggtaaat 33120
ccggcatgta caggattcat tgtcctgctc aaagtccatg ccatcaaact gctggttttc 33180
attgatgatg cgggaccagc catcaacgcc caccaccgga acgatgccat tctgcttatc 33240
aggaaaggcg taaatttctt tcgtccacgg attaaggccg tactggttgg caacgatcag 33300
taatgcgatg aactgcgcat cgctggcatc acctttaaat gccgtctggc gaagagtggt 33360
gatcagttcc tgtgggtcga cagaatccat gccgacacgt tcagccagct tcccagccag 33420
cgttgcgagt gcagtactca ttcgttttat acctctgaat caatatcaac ctggtggtga 33480
gcaatggttt caaccatgta ccggatgtgt tctgccatgc gctcctgaaa ctcaacatcg 33540
tcatcaaacg cacgggtaat ggattttttg ctggccccgt ggcgttgcaa atgatcgatg 33600
catagcgatt caaacaggtg ctggggcagg cctttttcca tgtcgtctgc cagttctgcc 33660
tctttctctt cacgggcgag ctgctggtag tgacgcgccc agctctgagc ctcaagacga 33720
tcctgaatgt aataagcgtt catggctgaa ctcctgaaat agctgtgaaa atatcgcccg 33780
cgaaatgccg ggctgattag gaaaacagga aagggggtta gtgaatgctt ttgcttgatc 33840
tcagtttcag tattaatatc cattttttat aagcgtcgac ggcttcacga aacatctttt 33900
catcgccaat aaaagtggcg atagtgaatt tagtctggat agccataagt gtttgatcca 33960
ttctttggga ctcctggctg attaagtatg tcgataaggc gtttccatcc gtcacgtaat 34020
ttacgggtga ttcgttcaag taaagattcg gaagggcagc cagcaacagg ccaccctgca 34080
atggcatatt gcatggtgtg ctccttattt atacataacg aaaaacgcct cgagtgaagc 34140
gttattggta tgcggtaaaa ccgcactcag gcggccttga tagtcatatc atctgaatca 34200
aatattcctg atgtatcgat atcggtaatt cttattcctt cgctaccatc cattggaggc 34260
catccttcct gaccatttcc atcattccag tcgaactcac acacaacacc atatgcattt 34320
aagtcgcttg aaattgctat aagcagagca tgttgcgcca gcatgattaa tacagcattt 34380
aatacagagc cgtgtttatt gagtcggtat tcagagtctg accagaaatt attaatctgg 34440
tgaagttttt cctctgtcat tacgtcatgg tcgatttcaa tttctattga tgctttccag 34500
tcgtaatcaa tgatgtattt tttgatgttt gacatctgtt catatcctca cagataaaaa 34560
atcgccctca cactggaggg caaagaagat ttccaataat cagaacaagt cggctcctgt 34620
ttagttacga gcgacattgc tccgtgtatt cactcgttgg aatgaataca cagtgcagtg 34680
tttattctgt tatttatgcc aaaaataaag gccactatca ggcagctttg ttgttctgtt 34740
taccaagttc tctggcaatc attgccgtcg ttcgtattgc ccatttatcg acatatttcc 34800
catcttccat tacaggaaac atttcttcag gcttaaccat gcattccgat tgcagcttgc 34860
atccattgca tcgcttgaat tgtccacacc attgattttt atcaatagtc gtagtcatac 34920
ggatagtcct ggtattgttc catcacatcc tgaggatgct cttcgaactc ttcaaattct 34980
tcttccatat atcaccttaa atagtggatt gcggtagtaa agattgtgcc tgtcttttaa 35040
ccacatcagg ctcggtggtt ctcgtgtacc cctacagcga gaaatcggat aaactattac 35100
aacccctaca gtttgatgag tatagaaatg gatccactcg ttattctcgg acgagtgttc 35160
agtaatgaac ctctggagag aaccatgtat atgatcgtta tctgggttgg acttctgctt 35220
ttaagcccag ataactggcc tgaatatgtt aatgagagaa tcggtattcc tcatgtgtgg 35280
catgttttcg tctttgctct tgcattttcg ctagcaatta atgtgcatcg attatcagct 35340
attgccagcg ccagatataa gcgatttaag ctaagaaaac gcattaagat gcaaaacgat 35400
aaagtgcgat cagtaattca aaaccttaca gaagagcaat ctatggtttt gtgcgcagcc 35460
cttaatgaag gcaggaagta tgtggttaca tcaaaacaat tcccatacat tagtgagttg 35520
attgagcttg gtgtgttgaa caaaactttt tcccgatgga atggaaagca tatattattc 35580
cctattgagg atatttactg gactgaatta gttgccagct atgatccata taatattgag 35640
ataaagccaa ggccaatatc taagtaacta gataagagga atcgattttc ccttaatttt 35700
ctggcgtcca ctgcatgtta tgccgcgttc gccaggcttg ctgtaccatg tgcgctgatt 35760
cttgcgctca atacgttgca ggttgctttc aatctgtttg tggtattcag ccagcactgt 35820
aaggtctatc ggatttagtg cgctttctac tcgtgatttc ggtttgcgat tcagcgagag 35880
aatagggcgg ttaactggtt ttgcgcttac cccaaccaac aggggatttg ctgctttcca 35940
ttgagcctgt ttctctgcgc gacgttcgcg gcggcgtgtt tgtgcatcca tctggattct 36000
cctgtcagtt agctttggtg gtgtgtggca gttgtagtcc tgaacgaaaa ccccccgcga 36060
ttggcacatt ggcagctaat ccggaatcgc acttacggcc aatgcttcgt ttcgtatcac 36120
acaccccaaa gccttctgct ttgaatgctg cccttcttca gggcttaatt tttaagagcg 36180
tcaccttcat ggtggtcagt gcgtcctgct gatgtgctca gtatcaccgc cagtggtatt 36240
tatgtcaaca ccgccagaga taatttatca ccgcagatgg ttatctgtat gttttttata 36300
tgaatttatt ttttgcaggg gggcattgtt tggtaggtga gagatctgaa ttgctatgtt 36360
tagtgagttg tatctattta tttttcaata aatacaattg gttatgtgtt ttgggggcga 36420
tcgtgaggca aagaaaaccc ggcgctgagg ccgggttatt cttgttctct ggtcaaatta 36480
tatagttgga aaacaaggat gcatatatga atgaacgatg cagaggcaat gccgatggcg 36540
atagtgggta tcatgtagcc gcttatgctg gaaagaagca ataacccgca gaaaaacaaa 36600
gctccaagct caacaaaact aagggcatag acaataacta ccgatgtcat atacccatac 36660
tctctaatct tggccagtcg gcgcgttctg cttccgatta gaaacgtcaa ggcagcaatc 36720
aggattgcaa tcatggttcc tgcatatgat gacaatgtcg ccccaagacc atctctatga 36780
gctgaaaaag aaacaccagg aatgtagtgg cggaaaagga gatagcaaat gcttacgata 36840
acgtaaggaa ttattactat gtaaacacca ggcatgattc tgttccgcat aattactcct 36900
gataattaat ccttaacttt gcccacctgc cttttaaaac attccagtat atcacttttc 36960
attcttgcgt agcaatatgc catctcttca gctatctcag cattggtgac cttgttcaga 37020
ggcgctgaga gatggccttt ttctgataga taatgttctg ttaaaatatc tccggcctca 37080
tcttttgccc gcaggctaat gtctgaaaat tgaggtgacg ggttaaaaat aatatccttg 37140
gcaacctttt ttatatccct tttaaatttt ggcttaatga ctatatccaa tgagtcaaaa 37200
agctcccctt caatatctgt tgcccctaag acctttaata tatcgccaaa tacaggtagc 37260
ttggcttcta ccttcaccgt tgttcggccg atgaaatgca tatgcataac atcgtctttg 37320
gtggttcccc tcatcagtgg ctctatctga acgcgctctc cactgcttaa tgacattcct 37380
ttcccgatta aaaaatctgt cagatcggat gtggtcggcc cgaaaacagt tctggcaaaa 37440
ccaatggtgt cgccttcaac aaacaaaaaa gatgggaatc ccaatgattc gtcatctgcg 37500
aggctgttct taatatcttc aactgaagct ttagagcgat ttatcttctg aaccagactc 37560
ttgtcatttg ttttggtaaa gagaaaagtt tttccatcga ttttatgaat atacaaataa 37620
ttggagccaa cctgcaggtg atgattatca gccagcagag aattaaggaa aacagacagg 37680
tttattgagc gcttatcttt ccctttattt ttgctgcggt aagtcgcata aaaaccattc 37740
ttcataattc aatccattta ctatgttatg ttctgagggg agtgaaaatt cccctaattc 37800
gatgaagatt cttgctcaat tgttatcagc tatgcgccga ccagaacacc ttgccgatca 37860
gccaaacgtc tcttcaggcc actgactagc gataactttc cccacaacgg aacaactctc 37920
attgcatggg atcattgggt actgtgggtt tagtggttgt aaaaacacct gaccgctatc 37980
cctgatcagt ttcttgaagg taaactcatc acccccaagt ctggctatgc agaaatcacc 38040
tggctcaaca gcctgctcag ggtcaacgag aattaacatt ccgtcaggaa agcttggctt 38100
ggagcctgtt ggtgcggtca tggaattacc ttcaacctca agccagaatg cagaatcact 38160
ggcttttttg gttgtgctta cccatctctc cgcatcacct ttggtaaagg ttctaagctc 38220
aggtgagaac atccctgcct gaacatgaga aaaaacaggg tactcatact cacttctaag 38280
tgacggctgc atactaaccg cttcatacat ctcgtagatt tctctggcga ttgaagggct 38340
aaattcttca acgctaactt tgagaatttt tgcaagcaat gcggcgttat aagcatttaa 38400
tgcattgatg ccattaaata aagcaccaac gcctgactgc cccatcccca tcttgtctgc 38460
gacagattcc tgggataagc caagttcatt tttctttttt tcataaattg ctttaaggcg 38520
acgtgcgtcc tcaagctgct cttgtgttaa tggtttcttt tttgtgctca tacgttaaat 38580
ctatcaccgc aagggataaa tatctaacac cgtgcgtgtt gactatttta cctctggcgg 38640
tgataatggt tgcatgtact aaggaggttg tatggaacaa cgcataaccc tgaaagatta 38700
tgcaatgcgc tttgggcaaa ccaagacagc taaagatctc ggcgtatatc aaagcgcgat 38760
caacaaggcc attcatgcag gccgaaagat ttttttaact ataaacgctg atggaagcgt 38820
ttatgcggaa gaggtaaagc ccttcccgag taacaaaaaa acaacagcat aaataacccc 38880
gctcttacac attccagccc tgaaaaaggg catcaaatta aaccacacct atggtgtatg 38940
catttatttg catacattca atcaattgtt atctaaggaa atacttacat atggttcgtg 39000
caaacaaacg caacgaggct ctacgaatcg agagtgcgtt gcttaacaaa atcgcaatgc 39060
ttggaactga gaagacagcg gaagctgtgg gcgttgataa gtcgcagatc agcaggtgga 39120
agagggactg gattccaaag ttctcaatgc tgcttgctgt tcttgaatgg ggggtcgttg 39180
acgacgacat ggctcgattg gcgcgacaag ttgctgcgat tctcaccaat aaaaaacgcc 39240
cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctgaggtcat tactggatct 39300
atcaacagga gtcattatga caaatacagc aaaaatactc aacttcggca gaggtaactt 39360
tgccggacag gagcgtaatg tggcagatct cgatgatggt tacgccagac tatcaaatat 39420
gctgcttgag gcttattcgg gcgcagatct gaccaagcga cagtttaaag tgctgcttgc 39480
cattctgcgt aaaacctatg ggtggaataa accaatggac agaatcaccg attctcaact 39540
tagcgagatt acaaagttac ctgtcaaacg gtgcaatgaa gccaagttag aactcgtcag 39600
aatgaatatt atcaagcagc aaggcggcat gtttggacca aataaaaaca tctcagaatg 39660
gtgcatccct caaaacgagg gaaaatcccc taaaacgagg gataaaacat ccctcaaatt 39720
gggggattgc tatccctcaa aacaggggga cacaaaagac actattacaa aagaaaaaag 39780
aaaagattat tcgtcagaga attctggcga atcctctgac cagccagaaa acgacctttc 39840
tgtggtgaaa ccggatgctg caattcagag cggcagcaag tgggggacag cagaagacct 39900
gaccgccgca gagtggatgt ttgacatggt gaagactatc gcaccatcag ccagaaaacc 39960
gaattttgct gggtgggcta acgatatccg cctgatgcgt gaacgtgacg gacgtaacca 40020
ccgcgacatg tgtgtgctgt tccgctgggc atgccaggac aacttctggt ccggtaacgt 40080
gctgagcccg gccaaactcc gcgataagtg gacccaactc gaaatcaacc gtaacaagca 40140
acaggcaggc gtgacagcca gcaaaccaaa actcgacctg acaaacacag actggattta 40200
cggggtggat ctatgaaaaa catcgccgca cagatggtta actttgaccg tgagcagatg 40260
cgtcggatcg ccaacaacat gccggaacag tacgacgaaa agccgcaggt acagcaggta 40320
gcgcagatca tcaacggtgt gttcagccag ttactggcaa ctttcccggc gagcctggct 40380
aaccgtgacc agaacgaagt gaacgaaatc cgtcgccagt gggttctggc ttttcgggaa 40440
aacgggatca ccacgatgga acaggttaac gcaggaatgc gcgtagcccg tcggcagaat 40500
cgaccatttc tgccatcacc cgggcagttt gttgcatggt gccgggaaga agcatccgtt 40560
accgccggac tgccaaacgt cagcgagctg gttgatatgg tttacgagta ttgccggaag 40620
cgaggcctgt atccggatgc ggagtcttat ccgtggaaat caaacgcgca ctactggctg 40680
gttaccaacc tgtatcagaa catgcgggcc aatgcgctta ctgatgcgga attacgccgt 40740
aaggccgcag atgagcttgt ccatatgact gcgagaatta accgtggtga ggcgatccct 40800
gaaccagtaa aacaacttcc tgtcatgggc ggtagacctc taaatcgtgc acaggctctg 40860
gcgaagatcg cagaaatcaa agctaagttc ggactgaaag gagcaagtgt atgacgggca 40920
aagaggcaat tattcattac ctggggacgc ataatagctt ctgtgcgccg gacgttgccg 40980
cgctaacagg cgcaacagta accagcataa atcaggccgc ggctaaaatg gcacgggcag 41040
gtcttctggt tatcgaaggt aaggtctggc gaacggtgta ttaccggttt gctaccaggg 41100
aagaacggga aggaaagatg agcacgaacc tggtttttaa ggagtgtcgc cagagtgccg 41160
cgatgaaacg ggtattggcg gtatatggag ttaaaagatg accatctaca ttactgagct 41220
aataacaggc ctgctggtaa tcgcaggcct ttttatttgg gggagaggga agtcatgaaa 41280
aaactaacct ttgaaattcg atctccagca catcagcaaa acgctattca cgcagtacag 41340
caaatccttc cagacccaac caaaccaatc gtagtaacca ttcaggaacg caaccgcagc 41400
ttagaccaaa acaggaagct atgggcctgc ttaggtgacg tctctcgtca ggttgaatgg 41460
catggtcgct ggctggatgc agaaagctgg aagtgtgtgt ttaccgcagc attaaagcag 41520
caggatgttg ttcctaacct tgccgggaat ggctttgtgg taataggcca gtcaaccagc 41580
aggatgcgtg taggcgaatt tgcggagcta ttagagctta tacaggcatt cggtacagag 41640
cgtggcgtta agtggtcaga cgaagcgaga ctggctctgg agtggaaagc gagatgggga 41700
gacagggctg catgataaat gtcgttagtt tctccggtgg caggacgtca gcatatttgc 41760
tctggctaat ggagcaaaag cgacgggcag gtaaagacgt gcattacgtt ttcatggata 41820
caggttgtga acatccaatg acatatcggt ttgtcaggga agttgtgaag ttctgggata 41880
taccgctcac cgtattgcag gttgatatca acccggagct tggacagcca aatggttata 41940
cggtatggga accaaaggat attcagacgc gaatgcctgt tctgaagcca tttatcgata 42000
tggtaaagaa atatggcact ccatacgtcg gcggcgcgtt ctgcactgac agattaaaac 42060
tcgttccctt caccaaatac tgtgatgacc atttcgggcg agggaattac accacgtgga 42120
ttggcatcag agctgatgaa ccgaagcggc taaagccaaa gcctggaatc agatatcttg 42180
ctgaactgtc agactttgag aaggaagata tcctcgcatg gtggaagcaa caaccattcg 42240
atttgcaaat accggaacat ctcggtaact gcatattctg cattaaaaaa tcaacgcaaa 42300
aaatcggact tgcctgcaaa gatgaggagg gattgcagcg tgtttttaat gaggtcatca 42360
cgggatccca tgtgcgtgac ggacatcggg aaacgccaaa ggagattatg taccgaggaa 42420
gaatgtcgct ggacggtatc gcgaaaatgt attcagaaaa tgattatcaa gccctgtatc 42480
aggacatggt acgagctaaa agattcgata ccggctcttg ttctgagtca tgcgaaatat 42540
ttggagggca gcttgatttc gacttcggga gggaagctgc atgatgcgat gttatcggtg 42600
cggtgaatgc aaagaagata accgcttccg accaaatcaa ccttactgga atcgatggtg 42660
tctccggtgt gaaagaacac caacaggggt gttaccacta ccgcaggaaa aggaggacgt 42720
gtggcgagac agcgacgaag tatcaccgac ataatctgcg aaaactgcaa ataccttcca 42780
acgaaacgca ccagaaataa acccaagcca atcccaaaag aatctgacgt aaaaaccttc 42840
aactacacgg ctcacctgtg ggatatccgg tggctaagac gtcgtgcgag gaaaacaagg 42900
tgattgacca aaatcgaagt tacgaacaag aaagcgtcga gcgagcttta acgtgcgcta 42960
actgcggtca gaagctgcat gtgctggaag ttcacgtgtg tgagcactgc tgcgcagaac 43020
tgatgagcga tccgaatagc tcgatgcacg aggaagaaga tgatggctaa accagcgcga 43080
agacgatgta aaaacgatga atgccgggaa tggtttcacc ctgcattcgc taatcagtgg 43140
tggtgctctc cagagtgtgg aaccaagata gcactcgaac gacgaagtaa agaacgcgaa 43200
aaagcggaaa aagcagcaga gaagaaacga cgacgagagg agcagaaaca gaaagataaa 43260
cttaagattc gaaaactcgc cttaaagccc cgcagttact ggattaaaca agcccaacaa 43320
gccgtaaacg ccttcatcag agaaagagac cgcgacttac catgtatctc gtgcggaacg 43380
ctcacgtctg ctcagtggga tgccggacat taccggacaa ctgctgcggc acctcaactc 43440
cgatttaatg aacgcaatat tcacaagcaa tgcgtggtgt gcaaccagca caaaagcgga 43500
aatctcgttc cgtatcgcgt cgaactgatt agccgcatcg ggcaggaagc agtagacgaa 43560
atcgaatcaa accataaccg ccatcgctgg actatcgaag agtgcaaggc gatcaaggca 43620
gagtaccaac agaaactcaa agacctgcga aatagcagaa gtgaggccgc atgacgttct 43680
cagtaaaaac cattccagac atgctcgttg aagcatacgg aaatcagaca gaagtagcac 43740
gcagactgaa atgtagtcgc ggtacggtca gaaaatacgt tgatgataaa gacgggaaaa 43800
tgcacgccat cgtcaacgac gttctcatgg ttcatcgcgg atggagtgaa agagatgcgc 43860
tattacgaaa aaattgatgg cagcaaatac cgaaatattt gggtagttgg cgatctgcac 43920
ggatgctaca cgaacctgat gaacaaactg gatacgattg gattcgacaa caaaaaagac 43980
ctgcttatct cggtgggcga tttggttgat cgtggtgcag agaacgttga atgcctggaa 44040
ttaatcacat tcccctggtt cagagctgta cgtggaaacc atgagcaaat gatgattgat 44100
ggcttatcag agcgtggaaa cgttaatcac tggctgctta atggcggtgg ctggttcttt 44160
aatctcgatt acgacaaaga aattctggct aaagctcttg cccataaagc agatgaactt 44220
ccgttaatca tcgaactggt gagcaaagat aaaaaatatg ttatctgcca cgccgattat 44280
ccctttgacg aatacgagtt tggaaagcca gttgatcatc agcaggtaat ctggaaccgc 44340
gaacgaatca gcaactcaca aaacgggatc gtgaaagaaa tcaaaggcgc ggacacgttc 44400
atctttggtc atacgccagc agtgaaacca ctcaagtttg ccaaccaaat gtatatcgat 44460
accggcgcag tgttctgcgg aaacctaaca ttgattcagg tacagggaga aggcgcatga 44520
gactcgaaag cgtagctaaa tttcattcgc caaaaagccc gatgatgagc gactcaccac 44580
gggccacggc ttctgactct ctttccggta ctgatgtgat ggctgctatg gggatggcgc 44640
aatcacaagc cggattcggt atggctgcat tctgcggtaa gcacgaactc agccagaacg 44700
acaaacaaaa ggctatcaac tatctgatgc aatttgcaca caaggtatcg gggaaatacc 44760
gtggtgtggc aaagcttgaa ggaaatacta aggcaaaggt actgcaagtg ctcgcaacat 44820
tcgcttatgc ggattattgc cgtagtgccg cgacgccggg ggcaagatgc agagattgcc 44880
atggtacagg ccgtgcggtt gatattgcca aaacagagct gtgggggaga gttgtcgaga 44940
aagagtgcgg aagatgcaaa ggcgtcggct attcaaggat gccagcaagc gcagcatatc 45000
gcgctgtgac gatgctaatc ccaaacctta cccaacccac ctggtcacgc actgttaagc 45060
cgctgtatga cgctctggtg gtgcaatgcc acaaagaaga gtcaatcgca gacaacattt 45120
tgaatgcggt cacacgttag cagcatgatt gccacggatg gcaacatatt aacggcatga 45180
tattgactta ttgaataaaa ttgggtaaat ttgactcaac gatgggttaa ttcgctcgtt 45240
gtggtagtga gatgaaaaga ggcggcgctt actaccgatt ccgcctagtt ggtcacttcg 45300
acgtatcgtc tggaactcca accatcgcag gcagagaggt ctgcaaaatg caatcccgaa 45360
acagttcgca ggtaatagtt agagcctgca taacggtttc gggatttttt atatctgcac 45420
aacaggtaag agcattgagt cgataatcgt gaagagtcgg cgagcctggt tagccagtgc 45480
tctttccgtt gtgctgaatt aagcgaatac cggaagcaga accggatcac caaatgcgta 45540
caggcgtcat cgccgcccag caacagcaca acccaaactg agccgtagcc actgtctgtc 45600
ctgaattcat tagtaatagt tacgctgcgg ccttttacac atgaccttcg tgaaagcggg 45660
tggcaggagg tcgcgctaac aacctcctgc cgttttgccc gtgcatatcg gtcacgaaca 45720
aatctgatta ctaaacacag tagcctggat ttgttctatc agtaatcgac cttattccta 45780
attaaataga gcaaatcccc ttattggggg taagacatga agatgccaga aaaacatgac 45840
ctgttggccg ccattctcgc ggcaaaggaa caaggcatcg gggcaatcct tgcgtttgca 45900
atggcgtacc ttcgcggcag atataatggc ggtgcgttta caaaaacagt aatcgacgca 45960
acgatgtgcg ccattatcgc ctggttcatt cgtgaccttc tcgacttcgc cggactaagt 46020
agcaatctcg cttatataac gagcgtgttt atcggctaca tcggtactga ctcgattggt 46080
tcgcttatca aacgcttcgc tgctaaaaaa gccggagtag aagatggtag aaatcaataa 46140
tcaacgtaag gcgttcctcg atatgctggc gtggtcggag ggaactgata acggacgtca 46200
gaaaaccaga aatcatggtt atgacgtcat tgtaggcgga gagctattta ctgattactc 46260
cgatcaccct cgcaaacttg tcacgctaaa cccaaaactc aaatcaacag gcgccggacg 46320
ctaccagctt ctttcccgtt ggtgggatgc ctaccgcaag cagcttggcc tgaaagactt 46380
ctctccgaaa agtcaggacg ctgtggcatt gcagcagatt aaggagcgtg gcgctttacc 46440
tatgattgat cgtggtgata tccgtcaggc aatcgaccgt tgcagcaata tctgggcttc 46500
actgccgggc gctggttatg gtcagttcga gcataaggct gacagcctga ttgcaaaatt 46560
caaagaagcg ggcggaacgg tcagagagat tgatgtatga gcagagtcac cgcgattatc 46620
tccgctctgg ttatctgcat catcgtctgc ctgtcatggg ctgttaatca ttaccgtgat 46680
aacgccatta cctacaaagc ccagcgcgac aaaaatgcca gagaactgaa gctggcgaac 46740
gcggcaatta ctgacatgca gatgcgtcag cgtgatgttg ctgcgctcga tgcaaaatac 46800
acgaaggagt tagctgatgc taaagctgaa aatgatgctc tgcgtgatga tgttgccgct 46860
ggtcgtcgtc ggttgcacat caaagcagtc tgtcagtcag tgcgtgaagc caccaccgcc 46920
tccggcgtgg ataatgcagc ctccccccga ctggcagaca ccgctgaacg ggattatttc 46980
accctcagag agaggctgat cactatgcaa aaacaactgg aaggaaccca gaagtatatt 47040
aatgagcagt gcagatagag ttgcccatcg acctgcaggg gggggggggc gctgaggtct 47100
gcctcgtgaa gaaggtgttg ctgactcata ccaggcctga atcgccccat catccagcca 47160
gaaagtgagg gagccacggt tgatgagagc tttgttgtag gtggaccagt tggtgatttt 47220
gaacttttgc tttgccacgg aacggtctgc gttgtcggga agatgcgtga tctgatcctt 47280
caactcagca aaagttcgat ttattcaaca aagccgccgt cccgtcaagt cagcgtaatg 47340
ctctgccagt gttacaacca attaaccaat tctgattaga aaaactcatc gagcatcaaa 47400
tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 47460
tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 47520
tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 47580
aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagc 47640
ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 47700
ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 47760
tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 47820
agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 47880
ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 47940
atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 48000
tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 48060
tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 48120
tataaatcag catccatgtt ggaatttaat cgcggcctcg agcaagacgt ttcccgttga 48180
atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 48240
gatgatatat ttttatcttg tgcaatgtaa catcagagat tttgagacac aacgtggctt 48300
tccccccccc ccctgcaggt cgttgacatg aggttgcccc gtattcagtg tcgctgattt 48360
gtattgtctg aagttgtttt tacgttaagt tgatgcagat caattaatac gatacctgcg 48420
tcataattga ttatttgacg tggtttgatg gcctccacgc acgttgtgat atgtagatga 48480
taatcattat cactttacgg gtcctttccg gtgatccgac aggttacg 48528
<210> 60
<211> 1509
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 60
atgaatttgc ttattgataa ctggatccct gtacgcccgc gaaacggggg gaaagtccaa 60
atcataaatc tgcaatcgct atactgcagt agagatcagt ggcgattaag tttgccccgt 120
gacgatatgg aactggccgc tttagcactg ctggtttgca ttgggcaaat tatcgccccg 180
gcaaaagatg acgttgaatt tcgacatcgc ataatgaatc cgctcactga agatgagttt 240
caacaactca tcgcgccgtg gatagatatg ttctacctta atcacgcaga acatcccttt 300
atgcagacca aaggtgtcaa agcaaatgat gtgactccaa tggaaaaact gttggctggg 360
gtaagcggcg cgacgaattg tgcatttgtc aatcaaccgg ggcagggtga agcattatgt 420
ggtggatgca ctgcgattgc gttattcaac caggcgaatc aggcaccagg ttttggtggt 480
ggttttaaaa gcggtttacg tggaggaaca cctgtaacaa cgttcgtacg tgggatcgat 540
cttcgttcaa cggtgttact caatgtcctc acattacctc gtcttcaaaa acaatttcct 600
aatgaatcac atacggaaaa ccaacctacc tggattaaac ctatcaagtc caatgagtct 660
atacctgctt cgtcaattgg gtttgtccgt ggtctattct ggcaaccagc gcatattgaa 720
ttatgcgatc ccattgggat tggtaaatgt tcttgctgtg gacaggaaag caatttgcgt 780
tataccggtt ttcttaagga aaaatttacc tttacagtta atgggctatg gccccatccg 840
cattcccctt gtctggtaac agtcaagaaa ggggaggttg aggaaaaatt tcttgctttc 900
accacctccg caccatcatg gacacaaatc agccgagttg tggtagataa gattattcaa 960
aatgaaaatg gaaatcgcgt ggcggcggtt gtgaatcaat tcagaaatat tgcgccgcaa 1020
agtcctcttg aattgattat ggggggatat cgtaataatc aagcatctat tcttgaacgg 1080
cgtcatgatg tgttgatgtt taatcagggg tggcaacaat acggcaatgt gataaacgaa 1140
atagtgactg ttggtttggg atataaaaca gccttacgca aggcgttata tacctttgca 1200
gaagggttta aaaataaaga cttcaaaggg gccggagtct ctgttcatga gactgcagaa 1260
aggcatttct atcgacagag tgaattatta attcccgatg tactggcgaa tgttaatttt 1320
tcccaggctg atgaggtaat agctgattta cgagacaaac ttcatcaatt gtgtgaaatg 1380
ctatttaatc aatctgtagc tccctatgca catcatccta aattaataag cacattagcg 1440
cttgcccgcg ccacgctata caaacattta cgggagttaa aaccgcaagg agggccatca 1500
aatggctga 1509
<210> 61
<211> 483
<212> DNA
<213> 大肠杆菌
<400> 61
atggctgatg aaattgatgc aatggcttta tatcgagcct ggcaacaact ggataatgga 60
tcatgtgcgc aaattagacg tgtttcagaa cctgatgaat tacgcgatat ccctgcgttt 120
tataggctgg tgcaaccttt tggttgggaa aacccacgtc accagcaggc tcttttgcgc 180
atggtgtttt gcctgagcgc aggaaagaat gtcatccgac atcaggacaa aaaatcggag 240
caaacaacag gtatctcgtt gggaagagct ttagccaata gtggaagaat taacgagcgc 300
cgtatctttc aattaattcg ggctgacaga acagccgata tggtccagtt acgtcgatta 360
cttactcacg ccgaacccgt acttgactgg ccattaatgg ccaggatgtt gacctggtgg 420
ggaaagcgcg aacgccagca acttctggaa gattttgtat tgaccacaaa caaaaatgcg 480
taa 483
<210> 62
<211> 1092
<212> DNA
<213> 大肠杆菌
<400> 62
atgtctaact ttatcaatat tcatgttctg atctctcaca gcccttcatg tctgaaccgc 60
gacgatatga acatgcagaa agacgctatt ttcggcggca aaagacgagt aagaatttca 120
agtcaaagcc ttaaacgtgc gatgcgtaaa agtggttatt acgcacaaaa tattggtgaa 180
tccagtctca gaaccattca tcttgcacaa ttacgtgatg ttcttcggca aaaacttggt 240
gaacgttttg accaaaaaat catcgataag acattagcgc tgctctccgg taaatcagtt 300
gatgaagccg aaaagatttc tgccgatgcg gttactccct gggttgtggg agaaatagcc 360
tggttctgtg agcaggttgc aaaagcagag gctgataatc tggatgataa aaagctgctc 420
aaagttctta aggaagatat tgccgccata cgtgtgaatt tacagcaggg tgttgatatt 480
gcgcttagtg gaagaatggc aaccagcggc atgatgactg agttgggaaa agttgatggt 540
gcaatgtcca ttgcgcatgc gatcactact catcaggttg attctgatat tgactggttc 600
accgctgtag atgatttaca ggaacaaggt tctgcacatc tgggaactca ggaattttca 660
tcgggtgttt tttatcgtta tgccaacatt aacctcgctc aacttcagga aaatttaggt 720
ggtgcctcca gggagcaggc tctggaaatt gcaacccatg ttgttcatat gctggcaaca 780
gaggtccctg gagcaaaaca gcgtacttat gccgctttta accctgcgga tatggtaatg 840
gttaatttct ccgatatgcc actttctatg gcaaatgctt ttgaaaaagc ggttaaagcg 900
aaagatggct ttttgcaacc gtctatacag gcgtttaatc aatattggga tcgcgttgcc 960
aatggatatg gtctgaacgg agctgctgcg caattcagct tatctgatgt agacccaatt 1020
actgctcaag ttaaacaaat gcctacttta gaacagttaa aatcctgggt tcgtaataat 1080
ggcgaggcgt ga 1092
<210> 63
<211> 675
<212> DNA
<213> 大肠杆菌
<400> 63
atgagatctt atttgatctt gcggcttgct gggccaatgc aagcctgggg gcagccgacc 60
tttgaaggaa cgcgacctac cggaagattt ccgacccgaa gcgggttatt agggctactc 120
ggggcttgtc ttgggatcca acgtgatgat acttcttcat tacaggcgtt atcagagagt 180
gtgcaatttg cagtgcgctg cgatgaactc attcttgacg atcgtcgtgt gtctgtaacg 240
gggttgcgtg attaccatac agtccttgga gcgcgagaag attaccgtgg tttgaaaagt 300
catgaaacga ttcaaacatg gcgcgaatat ttatgtgatg cctcctttac cgtcgctctc 360
tggttaacac cccatgcaac gatggttatc tcagaacttg aaaaagcagt attaaagcct 420
cggtatacac cttacctggg gcggagaagt tgcccactaa cacacccgct ttttttgggg 480
acatgtcagg catcggatcc tcagaaggcg ctattaaatt atgagcccgt tggcggcgat 540
atatatagtg aggaatcagt tacagggcat catttaaaat ttacggcgcg cgacgaaccg 600
atgatcacct tgcctcgaca atttgcttcc cgagaatggt atgtgattaa aggaggtatg 660
gatgtatctc agtaa 675
<210> 64
<211> 600
<212> DNA
<213> 大肠杆菌
<400> 64
atgtatctca gtaaagtcat cattgccagg gcctggagca gggatcttta ccaacttcac 60
cagggattat ggcatttatt tccaaacaga ccggatgctg ctcgtgattt tctttttcat 120
gttgagaagc gaaacacacc agaaggctgt catgttttat tgcagtcagc gcaaatgcct 180
gtttcaactg ccgttgcgac agtcattaaa actaaacagg ttgaatttca acttcaggtt 240
ggtgttccac tctattttcg gcttcgggca aatccgatca aaactattct cgacaatcaa 300
aagcgcctgg acagtaaagg gaatattaaa cgctgtcggg ttccgttaat aaaagaagca 360
gaacaaatcg cgtggttgca acgtaaattg ggcaatgcgg cgcgcgttga agatgtgcat 420
cccatatcgg aacggccaca gtatttttct ggtgatggta aaagtggaaa gatccaaacg 480
gtttgctttg aaggtgtgct caccatcaac gacgcgccag cgttaataga tcttgtacag 540
caaggtattg ggccagctaa atcgatggga tgtggcttgc tatctttggc tccactgtga 600
<210> 65
<211> 2667
<212> DNA
<213> 大肠杆菌
<400> 65
atggaacctt ttaaatatat atgccattac tggggaaaat cctcaaaaag cttgacgaaa 60
ggaaatgata ttcatctgtt aatttatcat tgccttgatg ttgctgctgt tgcagattgc 120
tggtgggatc aatcagtcgt actgcaaaat actttttgcc gaaatgaaat gctatcaaaa 180
cagagggtga aggcctggct gttatttttc attgctcttc atgatattgg aaagtttgat 240
atacgattcc aatataaatc agcagaaagt tggctgaaat taaatcctgc aacgccatca 300
cttaatggtc catcaacaca aatgtgccgt aaatttaatc atggtgcagc cggtctgtat 360
tggtttaacc aggattcact ttcagagcaa tctctcgggg attttttcag tttttttgat 420
gccgctcctc atccttatga gtcctggttt ccatgggtag aggccgttac aggacatcat 480
ggttttatat tacattccca ggatcaagat aagtcgcgtt gggaaatgcc agcttctctg 540
gcatcttatg ctgcgcaaga taaacaggct cgtgaggagt ggatatctgt actggaagca 600
ttatttttaa cgccagcggg gttatctata aacgatatac cacctgattg ttcatcactg 660
ttagcaggtt tttgctcgct tgctgactgg ttaggctcct ggactacaac gaataccttt 720
ctgtttaatg aggatgcgcc ttccgacata aatgctctga gaacgtattt ccaggaccga 780
cagcaggatg cgagccgggt attggagttg agtggacttg tatcaaataa gcgatgttat 840
gaaggtgttc atgcactact ggacaatggc tatcaaccca gacaattaca ggtgttagtt 900
gatgctcttc cagtagctcc cgggctgacg gtaatagagg cacctacagg ctccggtaaa 960
acggaaacag cgctggccta tgcttggaaa cttattgatc aacaaattgc ggatagtgtt 1020
atttttgccc tcccaacaca agctaccgcg aatgctatgc ttacgagaat ggaagcgagc 1080
gcgagccact tattttcatc cccaaatctt attcttgctc atggcaattc acggtttaac 1140
cacctctttc aatcaataaa atcacgcgcg attactgaac aggggcaaga agaagcgtgg 1200
gttcagtgtt gtcagtggtt gtcacaaagc aataagaaag tgtttcttgg gcaaatcggc 1260
gtttgcacga ttgatcaggt gttgatatcg gtattgccag ttaaacaccg ctttatccgt 1320
ggtttgggaa ttggtcgaag tgttttaatt gttgatgaag ttcatgctta cgacacctat 1380
atgaacggct tgctggaggc agtgctcaag gctcaggctg atgtgggagg gagtgttatt 1440
cttctttccg caaccctacc aatgaaacaa aaacagaaac ttctggatac ttatggtctg 1500
catacagatc cagtggaaaa taactccgca tatccactca ttaactggcg aggtgtgaat 1560
ggtgcgcaac gttttgatct gctagctcat ccagaacaac tcccgccccg cttttcgatt 1620
cagccagaac ctatttgttt agctgacatg ttacctgacc ttacgatgtt agagcgaatg 1680
atcgcagcgg caaacgcggg tgcacaggtc tgtcttattt gcaatttggt tgacgttgca 1740
caagtatgct accaacggct aaaggagcta aataacacgc aagtagatat agatttgttt 1800
catgcgcgct ttacgctgaa cgatcgtcgt gaaaaagaga atcgagttat tagcaatttc 1860
ggcaaaaatg ggaagcgaaa tgttggacgg atacttgtcg caacccaggt cgtggaacaa 1920
tcactcgacg ttgattttga ttggttaatt actcagcatt gtcctgcaga tttgcttttc 1980
caacgattgg gccgtttaca tcgccatcat cgcaaatatc gtcccgctgg ttttgagatt 2040
cctgttgcca ccattttgct gcctgatggc gagggttacg gacgacatga gcatatttat 2100
agcaacgtta gagtcatgtg gcggacgcag caacatattg aggagcttaa tggagcatcc 2160
ttatttttcc ctgatgctta ccggcaatgg ctggatagca tttacgatga tgcggaaatg 2220
gatgagccag aatgggtcgg caatggcatg gataaatttg aaagcgccga gtgtgaaaaa 2280
aggttcaagg ctcgcaaggt cctgcagtgg gctgaagaat atagcttgca ggataacgat 2340
gaaaccattc ttgcggtaac gagggatggg gaaatgagcc tgccattatt gccttatgta 2400
caaacgtctt caggtaaaca actgctcgat ggccaggtct acgaggacct aagtcatgaa 2460
cagcagtatg aggcgcttgc acttaatcgc gtcaatgtac ccttcacctg gaaacgtagt 2520
ttttctgaag tagtagatga agatgggtta ctttggctgg aagggaaaca gaatctggat 2580
ggatgggtct ggcagggtaa cagtattgtt attacctata caggggatga agggatgacc 2640
agagtcatcc ctgcaaatcc caaataa 2667
<210> 66
<211> 4107
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 66
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 67
<211> 502
<212> PRT
<213> 大肠杆菌
<400> 67
Met Asn Leu Leu Ile Asp Asn Trp Ile Pro Val Arg Pro Arg Asn Gly
1 5 10 15
Gly Lys Val Gln Ile Ile Asn Leu Gln Ser Leu Tyr Cys Ser Arg Asp
20 25 30
Gln Trp Arg Leu Ser Leu Pro Arg Asp Asp Met Glu Leu Ala Ala Leu
35 40 45
Ala Leu Leu Val Cys Ile Gly Gln Ile Ile Ala Pro Ala Lys Asp Asp
50 55 60
Val Glu Phe Arg His Arg Ile Met Asn Pro Leu Thr Glu Asp Glu Phe
65 70 75 80
Gln Gln Leu Ile Ala Pro Trp Ile Asp Met Phe Tyr Leu Asn His Ala
85 90 95
Glu His Pro Phe Met Gln Thr Lys Gly Val Lys Ala Asn Asp Val Thr
100 105 110
Pro Met Glu Lys Leu Leu Ala Gly Val Ser Gly Ala Thr Asn Cys Ala
115 120 125
Phe Val Asn Gln Pro Gly Gln Gly Glu Ala Leu Cys Gly Gly Cys Thr
130 135 140
Ala Ile Ala Leu Phe Asn Gln Ala Asn Gln Ala Pro Gly Phe Gly Gly
145 150 155 160
Gly Phe Lys Ser Gly Leu Arg Gly Gly Thr Pro Val Thr Thr Phe Val
165 170 175
Arg Gly Ile Asp Leu Arg Ser Thr Val Leu Leu Asn Val Leu Thr Leu
180 185 190
Pro Arg Leu Gln Lys Gln Phe Pro Asn Glu Ser His Thr Glu Asn Gln
195 200 205
Pro Thr Trp Ile Lys Pro Ile Lys Ser Asn Glu Ser Ile Pro Ala Ser
210 215 220
Ser Ile Gly Phe Val Arg Gly Leu Phe Trp Gln Pro Ala His Ile Glu
225 230 235 240
Leu Cys Asp Pro Ile Gly Ile Gly Lys Cys Ser Cys Cys Gly Gln Glu
245 250 255
Ser Asn Leu Arg Tyr Thr Gly Phe Leu Lys Glu Lys Phe Thr Phe Thr
260 265 270
Val Asn Gly Leu Trp Pro His Pro His Ser Pro Cys Leu Val Thr Val
275 280 285
Lys Lys Gly Glu Val Glu Glu Lys Phe Leu Ala Phe Thr Thr Ser Ala
290 295 300
Pro Ser Trp Thr Gln Ile Ser Arg Val Val Val Asp Lys Ile Ile Gln
305 310 315 320
Asn Glu Asn Gly Asn Arg Val Ala Ala Val Val Asn Gln Phe Arg Asn
325 330 335
Ile Ala Pro Gln Ser Pro Leu Glu Leu Ile Met Gly Gly Tyr Arg Asn
340 345 350
Asn Gln Ala Ser Ile Leu Glu Arg Arg His Asp Val Leu Met Phe Asn
355 360 365
Gln Gly Trp Gln Gln Tyr Gly Asn Val Ile Asn Glu Ile Val Thr Val
370 375 380
Gly Leu Gly Tyr Lys Thr Ala Leu Arg Lys Ala Leu Tyr Thr Phe Ala
385 390 395 400
Glu Gly Phe Lys Asn Lys Asp Phe Lys Gly Ala Gly Val Ser Val His
405 410 415
Glu Thr Ala Glu Arg His Phe Tyr Arg Gln Ser Glu Leu Leu Ile Pro
420 425 430
Asp Val Leu Ala Asn Val Asn Phe Ser Gln Ala Asp Glu Val Ile Ala
435 440 445
Asp Leu Arg Asp Lys Leu His Gln Leu Cys Glu Met Leu Phe Asn Gln
450 455 460
Ser Val Ala Pro Tyr Ala His His Pro Lys Leu Ile Ser Thr Leu Ala
465 470 475 480
Leu Ala Arg Ala Thr Leu Tyr Lys His Leu Arg Glu Leu Lys Pro Gln
485 490 495
Gly Gly Pro Ser Asn Gly
500
<210> 68
<211> 160
<212> PRT
<213> 大肠杆菌
<400> 68
Met Ala Asp Glu Ile Asp Ala Met Ala Leu Tyr Arg Ala Trp Gln Gln
1 5 10 15
Leu Asp Asn Gly Ser Cys Ala Gln Ile Arg Arg Val Ser Glu Pro Asp
20 25 30
Glu Leu Arg Asp Ile Pro Ala Phe Tyr Arg Leu Val Gln Pro Phe Gly
35 40 45
Trp Glu Asn Pro Arg His Gln Gln Ala Leu Leu Arg Met Val Phe Cys
50 55 60
Leu Ser Ala Gly Lys Asn Val Ile Arg His Gln Asp Lys Lys Ser Glu
65 70 75 80
Gln Thr Thr Gly Ile Ser Leu Gly Arg Ala Leu Ala Asn Ser Gly Arg
85 90 95
Ile Asn Glu Arg Arg Ile Phe Gln Leu Ile Arg Ala Asp Arg Thr Ala
100 105 110
Asp Met Val Gln Leu Arg Arg Leu Leu Thr His Ala Glu Pro Val Leu
115 120 125
Asp Trp Pro Leu Met Ala Arg Met Leu Thr Trp Trp Gly Lys Arg Glu
130 135 140
Arg Gln Gln Leu Leu Glu Asp Phe Val Leu Thr Thr Asn Lys Asn Ala
145 150 155 160
<210> 69
<211> 363
<212> PRT
<213> 大肠杆菌
<400> 69
Met Ser Asn Phe Ile Asn Ile His Val Leu Ile Ser His Ser Pro Ser
1 5 10 15
Cys Leu Asn Arg Asp Asp Met Asn Met Gln Lys Asp Ala Ile Phe Gly
20 25 30
Gly Lys Arg Arg Val Arg Ile Ser Ser Gln Ser Leu Lys Arg Ala Met
35 40 45
Arg Lys Ser Gly Tyr Tyr Ala Gln Asn Ile Gly Glu Ser Ser Leu Arg
50 55 60
Thr Ile His Leu Ala Gln Leu Arg Asp Val Leu Arg Gln Lys Leu Gly
65 70 75 80
Glu Arg Phe Asp Gln Lys Ile Ile Asp Lys Thr Leu Ala Leu Leu Ser
85 90 95
Gly Lys Ser Val Asp Glu Ala Glu Lys Ile Ser Ala Asp Ala Val Thr
100 105 110
Pro Trp Val Val Gly Glu Ile Ala Trp Phe Cys Glu Gln Val Ala Lys
115 120 125
Ala Glu Ala Asp Asn Leu Asp Asp Lys Lys Leu Leu Lys Val Leu Lys
130 135 140
Glu Asp Ile Ala Ala Ile Arg Val Asn Leu Gln Gln Gly Val Asp Ile
145 150 155 160
Ala Leu Ser Gly Arg Met Ala Thr Ser Gly Met Met Thr Glu Leu Gly
165 170 175
Lys Val Asp Gly Ala Met Ser Ile Ala His Ala Ile Thr Thr His Gln
180 185 190
Val Asp Ser Asp Ile Asp Trp Phe Thr Ala Val Asp Asp Leu Gln Glu
195 200 205
Gln Gly Ser Ala His Leu Gly Thr Gln Glu Phe Ser Ser Gly Val Phe
210 215 220
Tyr Arg Tyr Ala Asn Ile Asn Leu Ala Gln Leu Gln Glu Asn Leu Gly
225 230 235 240
Gly Ala Ser Arg Glu Gln Ala Leu Glu Ile Ala Thr His Val Val His
245 250 255
Met Leu Ala Thr Glu Val Pro Gly Ala Lys Gln Arg Thr Tyr Ala Ala
260 265 270
Phe Asn Pro Ala Asp Met Val Met Val Asn Phe Ser Asp Met Pro Leu
275 280 285
Ser Met Ala Asn Ala Phe Glu Lys Ala Val Lys Ala Lys Asp Gly Phe
290 295 300
Leu Gln Pro Ser Ile Gln Ala Phe Asn Gln Tyr Trp Asp Arg Val Ala
305 310 315 320
Asn Gly Tyr Gly Leu Asn Gly Ala Ala Ala Gln Phe Ser Leu Ser Asp
325 330 335
Val Asp Pro Ile Thr Ala Gln Val Lys Gln Met Pro Thr Leu Glu Gln
340 345 350
Leu Lys Ser Trp Val Arg Asn Asn Gly Glu Ala
355 360
<210> 70
<211> 224
<212> PRT
<213> 大肠杆菌
<400> 70
Met Arg Ser Tyr Leu Ile Leu Arg Leu Ala Gly Pro Met Gln Ala Trp
1 5 10 15
Gly Gln Pro Thr Phe Glu Gly Thr Arg Pro Thr Gly Arg Phe Pro Thr
20 25 30
Arg Ser Gly Leu Leu Gly Leu Leu Gly Ala Cys Leu Gly Ile Gln Arg
35 40 45
Asp Asp Thr Ser Ser Leu Gln Ala Leu Ser Glu Ser Val Gln Phe Ala
50 55 60
Val Arg Cys Asp Glu Leu Ile Leu Asp Asp Arg Arg Val Ser Val Thr
65 70 75 80
Gly Leu Arg Asp Tyr His Thr Val Leu Gly Ala Arg Glu Asp Tyr Arg
85 90 95
Gly Leu Lys Ser His Glu Thr Ile Gln Thr Trp Arg Glu Tyr Leu Cys
100 105 110
Asp Ala Ser Phe Thr Val Ala Leu Trp Leu Thr Pro His Ala Thr Met
115 120 125
Val Ile Ser Glu Leu Glu Lys Ala Val Leu Lys Pro Arg Tyr Thr Pro
130 135 140
Tyr Leu Gly Arg Arg Ser Cys Pro Leu Thr His Pro Leu Phe Leu Gly
145 150 155 160
Thr Cys Gln Ala Ser Asp Pro Gln Lys Ala Leu Leu Asn Tyr Glu Pro
165 170 175
Val Gly Gly Asp Ile Tyr Ser Glu Glu Ser Val Thr Gly His His Leu
180 185 190
Lys Phe Thr Ala Arg Asp Glu Pro Met Ile Thr Leu Pro Arg Gln Phe
195 200 205
Ala Ser Arg Glu Trp Tyr Val Ile Lys Gly Gly Met Asp Val Ser Gln
210 215 220
<210> 71
<211> 199
<212> PRT
<213> 大肠杆菌
<400> 71
Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu
1 5 10 15
Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp
20 25 30
Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu
35 40 45
Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala
50 55 60
Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val
65 70 75 80
Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile
85 90 95
Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys
100 105 110
Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg
115 120 125
Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro Ile Ser Glu
130 135 140
Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr
145 150 155 160
Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile
165 170 175
Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly
180 185 190
Leu Leu Ser Leu Ala Pro Leu
195
<210> 72
<211> 888
<212> PRT
<213> 大肠杆菌
<400> 72
Met Glu Pro Phe Lys Tyr Ile Cys His Tyr Trp Gly Lys Ser Ser Lys
1 5 10 15
Ser Leu Thr Lys Gly Asn Asp Ile His Leu Leu Ile Tyr His Cys Leu
20 25 30
Asp Val Ala Ala Val Ala Asp Cys Trp Trp Asp Gln Ser Val Val Leu
35 40 45
Gln Asn Thr Phe Cys Arg Asn Glu Met Leu Ser Lys Gln Arg Val Lys
50 55 60
Ala Trp Leu Leu Phe Phe Ile Ala Leu His Asp Ile Gly Lys Phe Asp
65 70 75 80
Ile Arg Phe Gln Tyr Lys Ser Ala Glu Ser Trp Leu Lys Leu Asn Pro
85 90 95
Ala Thr Pro Ser Leu Asn Gly Pro Ser Thr Gln Met Cys Arg Lys Phe
100 105 110
Asn His Gly Ala Ala Gly Leu Tyr Trp Phe Asn Gln Asp Ser Leu Ser
115 120 125
Glu Gln Ser Leu Gly Asp Phe Phe Ser Phe Phe Asp Ala Ala Pro His
130 135 140
Pro Tyr Glu Ser Trp Phe Pro Trp Val Glu Ala Val Thr Gly His His
145 150 155 160
Gly Phe Ile Leu His Ser Gln Asp Gln Asp Lys Ser Arg Trp Glu Met
165 170 175
Pro Ala Ser Leu Ala Ser Tyr Ala Ala Gln Asp Lys Gln Ala Arg Glu
180 185 190
Glu Trp Ile Ser Val Leu Glu Ala Leu Phe Leu Thr Pro Ala Gly Leu
195 200 205
Ser Ile Asn Asp Ile Pro Pro Asp Cys Ser Ser Leu Leu Ala Gly Phe
210 215 220
Cys Ser Leu Ala Asp Trp Leu Gly Ser Trp Thr Thr Thr Asn Thr Phe
225 230 235 240
Leu Phe Asn Glu Asp Ala Pro Ser Asp Ile Asn Ala Leu Arg Thr Tyr
245 250 255
Phe Gln Asp Arg Gln Gln Asp Ala Ser Arg Val Leu Glu Leu Ser Gly
260 265 270
Leu Val Ser Asn Lys Arg Cys Tyr Glu Gly Val His Ala Leu Leu Asp
275 280 285
Asn Gly Tyr Gln Pro Arg Gln Leu Gln Val Leu Val Asp Ala Leu Pro
290 295 300
Val Ala Pro Gly Leu Thr Val Ile Glu Ala Pro Thr Gly Ser Gly Lys
305 310 315 320
Thr Glu Thr Ala Leu Ala Tyr Ala Trp Lys Leu Ile Asp Gln Gln Ile
325 330 335
Ala Asp Ser Val Ile Phe Ala Leu Pro Thr Gln Ala Thr Ala Asn Ala
340 345 350
Met Leu Thr Arg Met Glu Ala Ser Ala Ser His Leu Phe Ser Ser Pro
355 360 365
Asn Leu Ile Leu Ala His Gly Asn Ser Arg Phe Asn His Leu Phe Gln
370 375 380
Ser Ile Lys Ser Arg Ala Ile Thr Glu Gln Gly Gln Glu Glu Ala Trp
385 390 395 400
Val Gln Cys Cys Gln Trp Leu Ser Gln Ser Asn Lys Lys Val Phe Leu
405 410 415
Gly Gln Ile Gly Val Cys Thr Ile Asp Gln Val Leu Ile Ser Val Leu
420 425 430
Pro Val Lys His Arg Phe Ile Arg Gly Leu Gly Ile Gly Arg Ser Val
435 440 445
Leu Ile Val Asp Glu Val His Ala Tyr Asp Thr Tyr Met Asn Gly Leu
450 455 460
Leu Glu Ala Val Leu Lys Ala Gln Ala Asp Val Gly Gly Ser Val Ile
465 470 475 480
Leu Leu Ser Ala Thr Leu Pro Met Lys Gln Lys Gln Lys Leu Leu Asp
485 490 495
Thr Tyr Gly Leu His Thr Asp Pro Val Glu Asn Asn Ser Ala Tyr Pro
500 505 510
Leu Ile Asn Trp Arg Gly Val Asn Gly Ala Gln Arg Phe Asp Leu Leu
515 520 525
Ala His Pro Glu Gln Leu Pro Pro Arg Phe Ser Ile Gln Pro Glu Pro
530 535 540
Ile Cys Leu Ala Asp Met Leu Pro Asp Leu Thr Met Leu Glu Arg Met
545 550 555 560
Ile Ala Ala Ala Asn Ala Gly Ala Gln Val Cys Leu Ile Cys Asn Leu
565 570 575
Val Asp Val Ala Gln Val Cys Tyr Gln Arg Leu Lys Glu Leu Asn Asn
580 585 590
Thr Gln Val Asp Ile Asp Leu Phe His Ala Arg Phe Thr Leu Asn Asp
595 600 605
Arg Arg Glu Lys Glu Asn Arg Val Ile Ser Asn Phe Gly Lys Asn Gly
610 615 620
Lys Arg Asn Val Gly Arg Ile Leu Val Ala Thr Gln Val Val Glu Gln
625 630 635 640
Ser Leu Asp Val Asp Phe Asp Trp Leu Ile Thr Gln His Cys Pro Ala
645 650 655
Asp Leu Leu Phe Gln Arg Leu Gly Arg Leu His Arg His His Arg Lys
660 665 670
Tyr Arg Pro Ala Gly Phe Glu Ile Pro Val Ala Thr Ile Leu Leu Pro
675 680 685
Asp Gly Glu Gly Tyr Gly Arg His Glu His Ile Tyr Ser Asn Val Arg
690 695 700
Val Met Trp Arg Thr Gln Gln His Ile Glu Glu Leu Asn Gly Ala Ser
705 710 715 720
Leu Phe Phe Pro Asp Ala Tyr Arg Gln Trp Leu Asp Ser Ile Tyr Asp
725 730 735
Asp Ala Glu Met Asp Glu Pro Glu Trp Val Gly Asn Gly Met Asp Lys
740 745 750
Phe Glu Ser Ala Glu Cys Glu Lys Arg Phe Lys Ala Arg Lys Val Leu
755 760 765
Gln Trp Ala Glu Glu Tyr Ser Leu Gln Asp Asn Asp Glu Thr Ile Leu
770 775 780
Ala Val Thr Arg Asp Gly Glu Met Ser Leu Pro Leu Leu Pro Tyr Val
785 790 795 800
Gln Thr Ser Ser Gly Lys Gln Leu Leu Asp Gly Gln Val Tyr Glu Asp
805 810 815
Leu Ser His Glu Gln Gln Tyr Glu Ala Leu Ala Leu Asn Arg Val Asn
820 825 830
Val Pro Phe Thr Trp Lys Arg Ser Phe Ser Glu Val Val Asp Glu Asp
835 840 845
Gly Leu Leu Trp Leu Glu Gly Lys Gln Asn Leu Asp Gly Trp Val Trp
850 855 860
Gln Gly Asn Ser Ile Val Ile Thr Tyr Thr Gly Asp Glu Gly Met Thr
865 870 875 880
Arg Val Ile Pro Ala Asn Pro Lys
885
<210> 73
<211> 1368
<212> PRT
<213> 酿脓链球菌
<400> 73
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 74
<211> 270
<212> PRT
<213> 克雷伯氏肺炎杆菌(Klebsiella pneumoniae)
<400> 74
Met Glu Leu Pro Asn Ile Met His Pro Val Ala Lys Leu Ser Thr Ala
1 5 10 15
Leu Ala Ala Ala Leu Met Leu Ser Gly Cys Met Pro Gly Glu Ile Arg
20 25 30
Pro Thr Ile Gly Gln Gln Met Glu Thr Gly Asp Gln Arg Phe Gly Asp
35 40 45
Leu Val Phe Arg Gln Leu Ala Pro Asn Val Trp Gln His Thr Ser Tyr
50 55 60
Leu Asp Met Pro Gly Phe Gly Ala Val Ala Ser Asn Gly Leu Ile Val
65 70 75 80
Arg Asp Gly Gly Arg Val Leu Val Val Asp Thr Ala Trp Thr Asp Asp
85 90 95
Gln Thr Ala Gln Ile Leu Asn Trp Ile Lys Gln Glu Ile Asn Leu Pro
100 105 110
Val Ala Leu Ala Val Val Thr His Ala His Gln Asp Lys Met Gly Gly
115 120 125
Met Asp Ala Leu His Ala Ala Gly Ile Ala Thr Tyr Ala Asn Ala Leu
130 135 140
Ser Asn Gln Leu Ala Pro Gln Glu Gly Met Val Ala Ala Gln His Ser
145 150 155 160
Leu Thr Phe Ala Ala Asn Gly Trp Val Glu Pro Ala Thr Ala Pro Asn
165 170 175
Phe Gly Pro Leu Lys Val Phe Tyr Pro Gly Pro Gly His Thr Ser Asp
180 185 190
Asn Ile Thr Val Gly Ile Asp Gly Thr Asp Ile Ala Phe Gly Gly Cys
195 200 205
Leu Ile Lys Asp Ser Lys Ala Lys Ser Leu Gly Asn Leu Gly Asp Ala
210 215 220
Asp Thr Glu His Tyr Ala Ala Ser Ala Arg Ala Phe Gly Ala Ala Phe
225 230 235 240
Pro Lys Ala Ser Met Ile Val Met Ser His Ser Ala Pro Asp Ser Arg
245 250 255
Ala Ala Ile Thr His Thr Ala Arg Met Ala Asp Lys Leu Arg
260 265 270
<210> 75
<211> 813
<212> DNA
<213> 克雷伯氏肺炎杆菌
<400> 75
atggaattgc ccaatattat gcacccggtc gcgaagctga gcaccgcatt agccgctgca 60
ttgatgctga gcgggtgcat gcccggtgaa atccgcccga cgattggcca gcaaatggaa 120
actggcgacc aacggtttgg cgatctggtt ttccgccagc tcgcaccgaa tgtctggcag 180
cacacttcct atctcgacat gccgggtttc ggggcagtcg cttccaacgg tttgatcgtc 240
agggatggcg gccgcgtgct ggtggtcgat accgcctgga ccgatgacca gaccgcccag 300
atcctcaact ggatcaagca ggagatcaac ctgccggtcg cgctggcggt ggtgactcac 360
gcgcatcagg acaagatggg cggtatggac gcgctgcatg cggcggggat tgcgacttat 420
gccaatgcgt tgtcgaacca gcttgccccg caagagggga tggttgcggc gcaacacagc 480
ctgactttcg ccgccaatgg ctgggtcgaa ccagcaaccg cgcccaactt tggcccgctc 540
aaggtatttt accccggccc cggccacacc agtgacaata tcaccgttgg gatcgacggc 600
accgacatcg cttttggtgg ctgcctgatc aaggacagca aggccaagtc gctcggcaat 660
ctcggtgatg ccgacactga gcactacgcc gcgtcagcgc gcgcgtttgg tgcggcgttc 720
cccaaggcca gcatgatcgt gatgagccat tccgcccccg atagccgcgc cgcaatcact 780
catacggccc gcatggccga caagctgcgc tga 813
<210> 76
<211> 291
<212> PRT
<213> 大肠杆菌
<400> 76
Met Val Lys Lys Ser Leu Arg Gln Phe Thr Leu Met Ala Thr Ala Thr
1 5 10 15
Val Thr Leu Leu Leu Gly Ser Val Pro Leu Tyr Ala Gln Thr Ala Asp
20 25 30
Val Gln Gln Lys Leu Ala Glu Leu Glu Arg Gln Ser Gly Gly Arg Leu
35 40 45
Gly Val Ala Leu Ile Asn Thr Ala Asp Asn Ser Gln Ile Leu Tyr Arg
50 55 60
Ala Asp Glu Arg Phe Ala Met Cys Ser Thr Ser Lys Val Met Ala Ala
65 70 75 80
Ala Ala Val Leu Lys Lys Ser Glu Ser Glu Pro Asn Leu Leu Asn Gln
85 90 95
Arg Val Glu Ile Lys Lys Ser Asp Leu Val Asn Tyr Asn Pro Ile Ala
100 105 110
Glu Lys His Val Asn Gly Thr Met Ser Leu Ala Glu Leu Ser Ala Ala
115 120 125
Ala Leu Gln Tyr Ser Asp Asn Val Ala Met Asn Lys Leu Ile Ala His
130 135 140
Val Gly Gly Pro Ala Ser Val Thr Ala Phe Ala Arg Gln Leu Gly Asp
145 150 155 160
Glu Thr Phe Arg Leu Asp Arg Thr Glu Pro Thr Leu Asn Thr Ala Ile
165 170 175
Pro Gly Asp Pro Arg Asp Thr Thr Ser Pro Arg Ala Met Ala Gln Thr
180 185 190
Leu Arg Asn Leu Thr Leu Gly Lys Ala Leu Gly Asp Ser Gln Arg Ala
195 200 205
Gln Leu Val Thr Trp Met Lys Gly Asn Thr Thr Gly Ala Ala Ser Ile
210 215 220
Gln Ala Gly Leu Pro Ala Ser Trp Val Val Gly Asp Lys Thr Gly Ser
225 230 235 240
Gly Gly Tyr Gly Thr Thr Asn Asp Ile Ala Val Ile Trp Pro Lys Asp
245 250 255
Arg Ala Pro Leu Ile Leu Val Thr Tyr Phe Thr Gln Pro Gln Pro Lys
260 265 270
Ala Glu Ser Arg Arg Asp Val Leu Ala Ser Ala Ala Lys Ile Val Thr
275 280 285
Asp Gly Leu
290
<210> 77
<211> 876
<212> DNA
<213> 大肠杆菌
<400> 77
atggttaaaa aatcactgcg ccagttcacg ctgatggcga cggcaaccgt cacgctgttg 60
ttaggaagtg tgccgctgta tgcgcaaacg gcggacgtac agcaaaaact tgccgaatta 120
gagcggcagt cgggaggcag actgggtgtg gcattgatta acacagcaga taattcgcaa 180
atactttatc gtgctgatga gcgctttgcg atgtgcagca ccagtaaagt gatggccgcg 240
gccgcggtgc tgaagaaaag tgaaagcgaa ccgaatctgt taaatcagcg agttgagatc 300
aaaaaatctg accttgttaa ctataatccg attgcggaaa agcacgtcaa tgggacgatg 360
tcactggctg agcttagcgc ggccgcgcta cagtacagcg ataacgtggc gatgaataag 420
ctgattgctc acgttggcgg cccggctagc gtcaccgcgt tcgcccgaca gctgggagac 480
gaaacgttcc gtctcgaccg taccgagccg acgttaaaca ccgccattcc gggcgatccg 540
cgtgatacca cttcacctcg ggcaatggcg caaactctgc ggaatctgac gctgggtaaa 600
gcattgggcg acagccaacg ggcgcagctg gtgacatgga tgaaaggcaa taccaccggt 660
gcagcgagca ttcaggctgg actgcctgct tcctgggttg tgggggataa aaccggcagc 720
ggtggctatg gcaccaccaa cgatatcgcg gtgatctggc caaaagatcg tgcgccgctg 780
attctggtca cttacttcac ccagcctcaa cctaaggcag aaagccgtcg cgatgtatta 840
gcgtcggcgg ctaaaatcgt caccgacggt ttgtaa 876

Claims (30)

1.一种试剂盒,所述试剂盒包括:
(i)至少一种选择组分,所述至少一种选择组分包含含有至少一个原始间隔区的核酸序列;和
(ii)至少一种敏化组分,所述至少一种敏化组分包含至少一个cas基因和至少一个成簇的、规则间隔的短回文重复(CRISPR)阵列,其中所述CRISPR的至少一个间隔区靶向包含于细菌的至少一种致病性基因内的原始间隔区,以特异性地灭活所述细菌中的所述致病性基因,并且其中所述CRISPR的至少一个间隔区靶向包含于(i)的所述选择组分内的原始间隔区,以特异性地灭活所述选择组分。
2.根据权利要求1所述的试剂盒,其中所述选择组分包括至少一种裂解性噬菌体。
3.根据权利要求2所述的试剂盒,其中所述裂解性噬菌体是至少一种经遗传修饰的噬菌体,所述经遗传修饰的噬菌体包含与包含于所述细菌致病性基因内的至少一种核酸序列具有至少70%的同一性的至少一个原始间隔区。
4.根据权利要求1所述的试剂盒,其中所述敏化组分包括至少一种重组载体,所述重组载体包含编码至少一个cas蛋白的核酸序列,所述载体还包含所述CRISPR阵列中的至少一个的核酸序列。
5.根据权利要求4所述的试剂盒,其中所述载体是至少一种经遗传修饰的噬菌体,所述经遗传修饰的噬菌体包含靶向包含于所述裂解性噬菌体内的至少一种核酸序列的至少一个CRISPR间隔区和靶向包含于所述至少一种致病性基因内的核酸序列的至少一个CRISPR间隔区,从而靶向并灭活所述裂解性噬菌体和所述致病性基因两者。
6.根据权利要求1所述的试剂盒,其中所述至少一种细菌致病性基因是至少一种细菌内源性基因。
7.根据权利要求1所述的试剂盒,其中所述至少一种细菌致病性基因是至少一种表染色体基因。
8.根据权利要求6和7中任一项所述的试剂盒,其中所述致病性基因中的至少一种是抗生素耐受性基因。
9.根据权利要求6和7中任一项所述的试剂盒,其中所述致病性基因中的所述至少一种是编码毒力因子和至少一种毒素中的至少一种的基因。
10.根据权利要求8所述的试剂盒,其中所述至少一种抗生素耐受性基因编码选自由CTX-M-15、新德里金属-β-内酰胺酶(NDM)-1、2、5、6、超广谱β内酰胺酶耐受性因子(ESBL因子)、β内酰胺酶和四环素A(tetA)组成的组的耐受性因子。
11.根据权利要求10所述的试剂盒,其中所述至少一个CRISPR间隔区包含靶向以下中的至少一种的核酸序列:CTX-M-15的至少一个原始间隔区;NDM-1、2、5、6的至少一个原始间隔区、ESBL因子的至少一个原始间隔区、β内酰胺酶的至少一个原始间隔区、tetA的至少一个原始间隔区和裂解性噬菌体的至少一个至少一个原始间隔区。
12.根据权利要求11所述的试剂盒,其中CTX-M-15的所述原始间隔区中的至少一个包含由SEQ ID NO.49、50和51中的任一个表示的核酸序列,并且NDM-1的所述原始间隔区中的至少一个包含由SEQ ID NO.46、47和48中的任一个表示的核酸序列。
13.根据权利要求3所述的试剂盒,其中所述经遗传修饰的裂解性噬菌体包含以下中的至少一种:(a)CTX-M-15的至少一个原始间隔区,其包含由SEQ ID NO.49、50和51中的任一个表示的核酸序列;和(b)NDM-1的至少一个原始间隔区,其包含由SEQ ID NO.46、47和48中的任一个表示的核酸序列。
14.根据权利要求5所述的试剂盒,其中所述至少一个CRISPR间隔区靶向包含于所述裂解性噬菌体的必需基因内的核酸序列。
15.根据权利要求6和14中任一项所述的试剂盒,其中所述裂解性噬菌体是T7样病毒和T4样病毒中的至少一种。
16.根据权利要求15所述的试剂盒,其中所述T7样病毒是至少一种肠杆菌噬菌体T7。
17.根据权利要求5所述的试剂盒,其中所述噬菌体是λ温和性噬菌体。
18.根据权利要求1所述的试剂盒,其中所述至少一个cas基因是I型、II型和III型CRISPR***中的至少一种的至少一个cas基因。
19.根据权利要求18所述的试剂盒,其中所述至少一个cas基因是I-E型CRISPR***的至少一个cas基因。
20.根据权利要求19所述的试剂盒,其中所述至少一种I-E型cas基因是cse1、cse2、cas7、cas5e、cas6和cas3基因中的至少一种。
21.根据权利要求18所述的试剂盒,其中所述至少一个cas基因是II型CRISPR***的至少一个cas基因。
22.根据权利要求21所述的试剂盒,其中II型CRISPR***的所述至少一个cas基因是cas9基因。
23.根据权利要求1所述的试剂盒,其中所述细菌是以下中的至少一种的任何菌株的至少一个细菌:大肠杆菌(E.coli)、铜绿假单胞菌(Pseudomonas aeruginosa)、金黄色葡萄球菌(Staphylococcus aureus)、酿脓链球菌(Streptococcus pyogenes)、艰难梭菌(Clostidium difficile)、屎肠球菌(Enterococcus faecium)、克雷伯氏肺炎杆菌(Klebsiella pneumonia)、鲍曼不动杆菌(Acinetobacter baumanni)和肠杆菌属物种(Enterobacter species)。
24.根据权利要求23所述的试剂盒,其中所述细菌是选自由以下组成的组的至少一个大肠杆菌菌株:O157:H7大肠杆菌、肠聚集性大肠杆菌(EAEC)、肠出血性大肠杆菌(EHEC)、肠侵袭性大肠杆菌(EIEC)、肠致病性大肠杆菌(EPEC)、肠产毒性大肠杆菌(ETEC)和弥漫性粘附大肠杆菌(DAEC)。
25.根据权利要求2和4中任一项所述的试剂盒,其中所述温和性噬菌体和所述裂解性噬菌体中的至少一种被配制为喷雾剂、贴剂、涂剂、凝胶、霜剂、洗涤剂、擦拭剂、泡沫、肥皂、液体、油、溶液、洗液、软膏或糊剂。
26.一种干扰遗传元件在细菌之间的水平转移的方法,所述遗传元件包括至少一种致病性基因,所述方法包括以下步骤:将含有携带所述致病性基因的细菌的表面、物质和物品中的至少一种与以下中的至少一种接触:
(i)至少一种选择组分,所述至少一种选择组分包含含有至少一个原始间隔区的核酸序列;
(ii)至少一种敏化组分,所述至少一种敏化组分包含至少一个cas基因和至少一个CRISPR阵列,其中所述CRISPR的至少一个间隔区靶向包含于细菌的至少一种致病性基因内的原始间隔区,以特异性地灭活所述细菌中的所述致病性基因,并且其中所述CRISPR的至少一个间隔区靶向包含于(i)的所述选择组分内的原始间隔区,以特异性地灭活所述选择组分,以及
(iii)至少一种试剂盒,所述试剂盒包括(i)和(ii),从而使所述致病性基因失活并干扰其水平转移。
27.根据权利要求26所述的方法,其中所述试剂盒如权利要求2-25的任一项中所定义的。
28.一种预防哺乳动物受试者中由含有致病性基因的细菌的细菌感染引起的病理状况的方法,所述方法包括使所述受试者附近的表面、物质和物品中的至少一种与以下中的至少一种接触:
(i)至少一种选择组分,所述至少一种选择组分包含含有至少一个原始间隔区的核酸序列;
(ii)至少一种敏化组分,所述至少一种敏化组分包含至少一个cas基因和至少一个成簇的、规则间隔的短回文重复(CRISPR)阵列,其中所述CRISPR的至少一个间隔区靶向包含于细菌的至少一种致病性基因内的原始间隔区,以特异性地灭活所述细菌中的所述致病性基因,并且其中所述CRISPR的至少一个间隔区靶向包含于(i)的所述选择组分内的原始间隔区,以特异性地灭活所述选择组分,以及
(iii)至少一种试剂盒,所述试剂盒包含(i)和(ii),从而靶向并灭活所述致病性基因并预防所述病理状况。
29.根据权利要求28所述的方法,其中所述试剂盒如权利要求2-25的任一项中所定义的。
30.根据权利要求29所述的方法,所述方法包括使所述表面、物质和物品中的至少一种与所述温和性噬菌体接触,并且然后使所述固体表面与所述裂解性噬菌体接触。
CN201580074405.2A 2014-11-26 2015-11-26 细菌基因的靶向消除 Active CN107208070B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462084703P 2014-11-26 2014-11-26
US62/084,703 2014-11-26
PCT/IL2015/051154 WO2016084088A1 (en) 2014-11-26 2015-11-26 Targeted elimination of bacterial genes

Publications (2)

Publication Number Publication Date
CN107208070A true CN107208070A (zh) 2017-09-26
CN107208070B CN107208070B (zh) 2021-09-07

Family

ID=56073734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580074405.2A Active CN107208070B (zh) 2014-11-26 2015-11-26 细菌基因的靶向消除

Country Status (5)

Country Link
US (2) US11060114B2 (zh)
EP (1) EP3224353B9 (zh)
JP (1) JP6860483B2 (zh)
CN (1) CN107208070B (zh)
WO (1) WO2016084088A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110423771A (zh) * 2019-07-17 2019-11-08 上海科技大学 双质粒***及其应用
CN110923230A (zh) * 2019-11-07 2020-03-27 浙江大学 一种靶向敲除blaNDM-1基因的sgRNA序列及其应用
CN111429969A (zh) * 2020-03-31 2020-07-17 中国人民解放军军事科学院军事医学研究院 一种细菌中功能性前噬菌体及其位置与序列的检测方法
CN112029699A (zh) * 2020-11-04 2020-12-04 中国农业科学院北京畜牧兽医研究所 一种基于内源CRISPR-Cas***的丁酸梭菌基因编辑***及其应用
CN112424363A (zh) * 2018-05-04 2021-02-26 洛可斯生物科学公司 杀灭靶细菌的方法和组合物
CN113874509A (zh) * 2019-03-15 2021-12-31 艾力格生物科技有限公司 使用dna结合阻遏物在原核细胞中的转录控制

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
WO2015066119A1 (en) 2013-10-30 2015-05-07 North Carolina State University Compositions and methods related to a type-ii crispr-cas system in lactobacillus buchneri
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
US10787654B2 (en) 2014-01-24 2020-09-29 North Carolina State University Methods and compositions for sequence guiding Cas9 targeting
CN106460003A (zh) 2014-04-08 2017-02-22 北卡罗来纳州立大学 用于使用crispr相关基因rna引导阻遏转录的方法和组合物
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
KR102138209B1 (ko) 2015-05-06 2020-07-28 스니프르 테크놀로지스 리미티드 미생물 개체군 변경 및 미생물군 변형
US11484015B2 (en) 2015-05-21 2022-11-01 Atlantic Sapphire Ip, Llc Systems and methods of intensive recirculating aquaculture
US11596132B2 (en) 2015-05-21 2023-03-07 Atlantic Sapphire Ip, Llc Transfer assembly and system for aquaculture
US11627729B2 (en) 2015-05-21 2023-04-18 Atlantic Sapphire Ip, Llc Transfer assembly and system for aquaculture
JP2018516563A (ja) 2015-05-29 2018-06-28 ノース カロライナ ステート ユニバーシティNorth Carolina State University Crispr核酸を用いて、細菌、古細菌、藻類、および、酵母をスクリーニングする方法
WO2016205276A1 (en) * 2015-06-15 2016-12-22 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
WO2017058751A1 (en) 2015-09-28 2017-04-06 North Carolina State University Methods and compositions for sequence specific antimicrobials
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US11311582B2 (en) 2015-11-19 2022-04-26 Locus Biosciences, Inc. Bacteriophage compositions and methods of use thereof
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
GB201609811D0 (en) 2016-06-05 2016-07-20 Snipr Technologies Ltd Methods, cells, systems, arrays, RNA and kits
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019067621A1 (en) * 2017-09-26 2019-04-04 Nextbiotics, Inc. COMPOSITIONS AND METHODS OF A CRISPR GENETIC SYSTEM FOR SENSITIZING AND / OR ELIMINATING TARGET BACTERIA
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
US10959411B2 (en) 2018-01-04 2021-03-30 Atlantic Sapphire IP, L.L.C. Bottom grading apparatuses for aquaculture systems
US10760075B2 (en) 2018-04-30 2020-09-01 Snipr Biome Aps Treating and preventing microbial infections
US10227576B1 (en) 2018-06-13 2019-03-12 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
US20220315920A1 (en) * 2018-06-21 2022-10-06 Cornell Universtiy Type i crispr system as a tool for genome editing
EP3861120A4 (en) 2018-10-01 2023-08-16 North Carolina State University RECOMBINANT TYPE I CRISPR-CAS SYSTEM
US20220380834A1 (en) * 2018-10-04 2022-12-01 T2 Biosystems, Inc. Methods and compositions for high sensitivity detection of drug resistance markers
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
KR20210009186A (ko) 2019-07-16 2021-01-26 주식회사 엘지화학 CRISPR/Cas9 시스템을 이용한 벡터 제거 방법
US20220330576A1 (en) 2019-08-16 2022-10-20 Dupont Nutrition Biosciences Aps Compositions for gut health
EP4055143A1 (en) * 2019-11-06 2022-09-14 Locus Biosciences, Inc. Crispr cas systems and lysogeny modules
JP2023500336A (ja) * 2019-11-06 2023-01-05 ローカス バイオサイエンシーズ,インク. Crispr-casシステムを含むファージ組成物およびその使用方法
WO2021150873A1 (en) * 2020-01-23 2021-07-29 Atlantic Sapphire Ip, Llc Method for detection and mitigation of compound producing microbiota in an aquaculture system
US11425895B2 (en) 2020-03-05 2022-08-30 Atlantic Sapphire Ip, Llc Method for optimization of filtration in an aquaculture system
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022140630A1 (en) * 2020-12-23 2022-06-30 Locus Biosciences, Inc. Altering the normal balance of microbial populations
WO2022169933A2 (en) 2021-02-03 2022-08-11 Dupont Nutrition Biosciences Aps Compositions for gut health
US11662291B1 (en) 2021-02-03 2023-05-30 Atlantic Sapphire Ip, Llc System and method for feed validation measurement
CN118234858A (zh) 2021-08-02 2024-06-21 特罗比克斯生物有限公司 用于调节细胞药物代谢的***、其方法和组合物
WO2023122805A1 (en) 2021-12-20 2023-06-29 Vestaron Corporation Sorbitol driven selection pressure method
WO2024023820A1 (en) 2022-07-25 2024-02-01 Trobix Bio Ltd Systems for modulating microbiome target cells, methods and compositions thereof
WO2024026406A2 (en) 2022-07-29 2024-02-01 Vestaron Corporation Next Generation ACTX Peptides
WO2024052907A1 (en) 2022-09-06 2024-03-14 Trobix Bio Ltd. Systems for production of transducing particles, methods, kits, compositions and uses thereof
WO2024086532A1 (en) * 2022-10-17 2024-04-25 Locus Biosciences, Inc. Staphylococcus phage compositions and cocktails thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130315869A1 (en) * 2012-05-22 2013-11-28 Ramot At Tel-Aviv University Ltd. Bacteriophages for reducing toxicity of bacteria
US20140068797A1 (en) * 2012-05-25 2014-03-06 University Of Vienna Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
WO2014124226A1 (en) * 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154600B (nl) 1971-02-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen.
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
NL154599B (nl) 1970-12-28 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen, alsmede testverpakking.
US3901654A (en) 1971-06-21 1975-08-26 Biological Developments Receptor assays of biologically active compounds employing biologically specific receptors
US3853987A (en) 1971-09-01 1974-12-10 W Dreyer Immunological reagent and radioimmuno assay
US3867517A (en) 1971-12-21 1975-02-18 Abbott Lab Direct radioimmunoassay for antigens and their antibodies
NL171930C (nl) 1972-05-11 1983-06-01 Akzo Nv Werkwijze voor het aantonen en bepalen van haptenen, alsmede testverpakkingen.
US3850578A (en) 1973-03-12 1974-11-26 H Mcconnell Process for assaying for biologically active molecules
US3935074A (en) 1973-12-17 1976-01-27 Syva Company Antibody steric hindrance immunoassay with two antibodies
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4034074A (en) 1974-09-19 1977-07-05 The Board Of Trustees Of Leland Stanford Junior University Universal reagent 2-site immunoradiometric assay using labelled anti (IgG)
US3984533A (en) 1975-11-13 1976-10-05 General Electric Company Electrophoretic method of detecting antigen-antibody reaction
US4098876A (en) 1976-10-26 1978-07-04 Corning Glass Works Reverse sandwich immunoassay
US4879219A (en) 1980-09-19 1989-11-07 General Hospital Corporation Immunoassay utilizing monoclonal high affinity IgM antibodies
US5011771A (en) 1984-04-12 1991-04-30 The General Hospital Corporation Multiepitopic immunometric assay
US4666828A (en) 1984-08-15 1987-05-19 The General Hospital Corporation Test for Huntington's disease
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4801531A (en) 1985-04-17 1989-01-31 Biotechnology Research Partners, Ltd. Apo AI/CIII genomic polymorphisms predictive of atherosclerosis
US5272057A (en) 1988-10-14 1993-12-21 Georgetown University Method of detecting a predisposition to cancer by the use of restriction fragment length polymorphism of the gene for human poly (ADP-ribose) polymerase
US5192659A (en) 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US5281521A (en) 1992-07-20 1994-01-25 The Trustees Of The University Of Pennsylvania Modified avidin-biotin technique
EP2325332B1 (en) 2005-08-26 2012-10-31 DuPont Nutrition Biosciences ApS Use of CRISPR associated genes (CAS)
DK2426220T3 (en) 2006-05-19 2016-09-26 Dupont Nutrition Biosci Aps Labeled microorganisms, and methods for labeling
DK2126130T3 (en) * 2007-03-02 2015-06-29 Dupont Nutrition Biosci Aps CULTURES WITH IMPROVED phage resistance
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
WO2015034872A2 (en) 2013-09-05 2015-03-12 Massachusetts Institute Of Technology Tuning microbial populations with programmable nucleases

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130315869A1 (en) * 2012-05-22 2013-11-28 Ramot At Tel-Aviv University Ltd. Bacteriophages for reducing toxicity of bacteria
US20140068797A1 (en) * 2012-05-25 2014-03-06 University Of Vienna Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
WO2014124226A1 (en) * 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OAVIO BIKARO 等: ""Exploiting CRISPR-Cas nucleases to produce sequence-specific anti microbials"", 《NATURE BIOTECHNOLOGY》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112424363A (zh) * 2018-05-04 2021-02-26 洛可斯生物科学公司 杀灭靶细菌的方法和组合物
CN113874509A (zh) * 2019-03-15 2021-12-31 艾力格生物科技有限公司 使用dna结合阻遏物在原核细胞中的转录控制
CN110423771A (zh) * 2019-07-17 2019-11-08 上海科技大学 双质粒***及其应用
CN110423771B (zh) * 2019-07-17 2022-09-30 上海科技大学 双质粒***及其应用
CN110923230A (zh) * 2019-11-07 2020-03-27 浙江大学 一种靶向敲除blaNDM-1基因的sgRNA序列及其应用
CN111429969A (zh) * 2020-03-31 2020-07-17 中国人民解放军军事科学院军事医学研究院 一种细菌中功能性前噬菌体及其位置与序列的检测方法
CN112029699A (zh) * 2020-11-04 2020-12-04 中国农业科学院北京畜牧兽医研究所 一种基于内源CRISPR-Cas***的丁酸梭菌基因编辑***及其应用
CN112029699B (zh) * 2020-11-04 2021-06-08 中国农业科学院北京畜牧兽医研究所 一种基于内源CRISPR-Cas***的丁酸梭菌基因编辑***及其应用

Also Published As

Publication number Publication date
US20170260546A1 (en) 2017-09-14
EP3224353A1 (en) 2017-10-04
JP6860483B2 (ja) 2021-04-14
CN107208070B (zh) 2021-09-07
WO2016084088A1 (en) 2016-06-02
EP3224353C0 (en) 2023-06-07
EP3224353B9 (en) 2023-08-09
JP2017536831A (ja) 2017-12-14
US11060114B2 (en) 2021-07-13
EP3224353B1 (en) 2023-06-07
US20210290704A1 (en) 2021-09-23
EP3224353A4 (en) 2018-06-06

Similar Documents

Publication Publication Date Title
CN107208070A (zh) 细菌基因的靶向消除
AU2022202944B2 (en) Altering microbial populations &amp; modifying microbiota
US20210071159A1 (en) Tuning microbial populations with programmable nucleases
US20230310525A1 (en) Bacteriophage variants having extended host-range, methods for preparation and uses thereof in transducing nucleic acids into hosts of interest
Lévesque et al. Involvement of sortase anchoring of cell wall proteins in biofilm formation by Streptococcus mutans
CN106536739A (zh) 治疗剂
Dziewit et al. Insights into the transposable mobilome of Paracoccus spp.(Alphaproteobacteria)
Villa et al. Horizontal gene transfer in bacteria, an overview of the mechanisms involved
Levine et al. Plastic cells and populations: DNA substrate characteristics in Helicobacter pylori transformation define a flexible but conservative system for genomic variation
CN114929873A (zh) 使用靶向核酸酶调节微生物群的组成
US4332897A (en) Novel bacteriophage and method for preparing same
Jouravleva et al. Characterization and possible functions of a new filamentous bacteriophage from Vibrio cholerae 0139
JP2010539965A (ja) 転写因子デコイ、組成物および方法
CN111094546A (zh) 粗糙型肠炎沙门氏菌的获取及其用于禽流感疫苗的基因改造
CA2453518C (en) Nucleic acid-free bacterial ghost preparation formed by co-expression of lytic and nuclease genes
AU2002328340A1 (en) Nucleic acid free ghost preparations
JP2023507163A (ja) バクテロイデスにおけるゲノム編集
WO2004092409A2 (en) Novel genes involved in the escherichia coli biofilm formation and uses thereof
WO2024096123A1 (ja) 遺伝子が改変された微生物およびその生産方法
Al-Jabri Analysis of Integrase and Transposase-Mediated Mechanisms for Transfer of Mobile Genetic Elements
Nordraak Antibiotics against bovine mastitis pathogens: resistance and novel targets
Munthali The biological cost of genetic elements.
Tang et al. Complete genome sequence of Lactobacillus helveticus
Stanford et al. Brahms
Bertini Plasmid-mediated antimicrobial resistance in Gram-negative bacteria

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant