CN112639108A - 治疗非综合征性感觉神经性听力损失的方法 - Google Patents

治疗非综合征性感觉神经性听力损失的方法 Download PDF

Info

Publication number
CN112639108A
CN112639108A CN201980057626.7A CN201980057626A CN112639108A CN 112639108 A CN112639108 A CN 112639108A CN 201980057626 A CN201980057626 A CN 201980057626A CN 112639108 A CN112639108 A CN 112639108A
Authority
CN
China
Prior art keywords
nucleotides
amino acids
amino acid
acid substitutions
amino
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980057626.7A
Other languages
English (en)
Inventor
E.J.西蒙斯
R.恩格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Akus Co ltd
Original Assignee
Akus Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Akus Co ltd filed Critical Akus Co ltd
Publication of CN112639108A publication Critical patent/CN112639108A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/16Otologicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/103Ovine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14144Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/007Vectors comprising a special translation-regulating system cell or tissue specific

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Environmental Sciences (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了包括至少两种不同核酸载体的组合物,其中所述至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列;以及这些组合物用以治疗受试者的非综合征性感觉神经性听力损失的用途。

Description

治疗非综合征性感觉神经性听力损失的方法
相关申请的交叉引用
本申请要求2018年7月13日提交的序列号为62/697,652的美国临时专利申请的优先权;所述美国临时专利申请的全部内容通过引用并入本文。
技术领域
本公开总体上涉及核酸用以治疗人受试者的听力损失的用途。
背景技术
与综合征性耳聋不同,非综合征性耳聋是不伴有其他征象和症状的听力损失。百分之七十至百分之八十的遗传性耳聋病例是非综合征性的。尽管非综合征性耳聋的原因是复杂的,但研究者已鉴定超过30种在改变时与非综合征性耳聋相关联的基因(例如硬纤毛蛋白(stereocilin,STRC))。当前治疗主要由针对轻度至重度听力损失的听力放大以及针对重度至深度听力损失的耳蜗植入物组成;然而,对于用于预防或逆转非综合征性耳聋的药剂和方法,仍存在长期的需要。
听力损失可为传导性的(由耳道或中耳引起),感觉神经性的(由内耳或听神经引起),或混合性的。大多数形式的非综合征性耳聋与由对内耳中的结构的损害引起的永久听力损失(感觉神经性耳聋)相关,但一些形式可涉及中耳中的变化(传导性听力损失)。绝大多数的人感觉神经性听力损失由耳蜗中的柯蒂氏器(organ of Corti)的毛细胞的异常(不良毛细胞功能)引起。毛细胞可在出生时是异常的,或可在个体的生存时间期间受到损害(例如由于噪声创伤或感染)。
发明内容
本发明基于以下发现:一种包括至少两种不同核酸载体的组合物,其中所述至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,可用于在哺乳动物细胞中产生编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的序列,并且由此治疗有需要的受试者的非综合征性感觉神经性听力损失。
本文提供了包括至少两种不同核酸载体的组合物,其中:所述至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列可任选地与所编码部分中的不同者的氨基酸序列部分重叠;所述至少两种不同载体中没有单一载体编码全长硬纤毛蛋白;所述编码序列中的至少一者包括跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列;并且当引入哺乳动物细胞中时,所述至少两种不同载体经受彼此同源性重组,由此形成编码全长硬纤毛蛋白的重组核酸。在本文所述的任何组合物的一些实施方案中,至少两种不同载体中的每一者是质粒、转座子、粘粒、人工染色体或病毒载体。在本文所述的任何组合物的一些实施方案中,至少两种不同载体中的每一者是人类人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)、或P1源性人工染色体(PAC)。在本文所述的任何组合物的一些实施方案中,至少两种不同载体中的每一者是选自腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体的病毒载体。在本文所述的任何组合物的一些实施方案中,病毒载体是AAV载体。
在本文所述的任何组合物的一些实施方案中,所编码部分中没有一者的氨基酸序列与所编码部分中的不同者的氨基酸序列重叠。在本文所述的任何组合物的一些实施方案中,所编码部分中的每一者的氨基酸序列与所编码部分中的不同者的氨基酸序列部分重叠。在本文所述的任何组合物的一些实施方案中,重叠氨基酸序列的长度在约30个氨基酸残基至约1000个氨基酸残基之间。
在本文所述的任何组合物的一些实施方案中,载体包括两种不同载体,其中每一者包括内含子的不同区段,其中所述内含子包括存在于硬纤毛蛋白基因组DNA中的内含子的核苷酸序列,并且其中两个不同区段在序列方面重叠至少100个核苷酸。在本文所述的任何组合物的一些实施方案中,两个不同区段在序列方面重叠约100个核苷酸至约800个核苷酸。在本文所述的任何组合物的一些实施方案中,至少两种不同载体中的每一者的核苷酸序列的长度在约500个核苷酸至约10,000个核苷酸之间(例如的长度在约500个核苷酸至约5,000个核苷酸之间)。
在本文所述的任何组合物的一些实施方案中,组合物中不同载体的种数是两种。在一些实施方案中,两种载体中的一者包括SEQ ID NO:13,并且两种载体中的第二者包括SEQ ID NO:17。
在本文所述的任何组合物的一些实施方案中,至少两种不同载体中的一者包括编码硬纤毛蛋白的序列。在一些实施方案中,编码硬纤毛蛋白的序列与SEQ ID NO:11具有至少90%(例如至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%)同一性。
在本文所述的任何组合物的一些实施方案中,两种不同载体中的第一载体包括编码硬纤毛蛋白的N末端部分的编码序列。在本文所述的任何组合物的一些实施方案中,硬纤毛蛋白的N末端部分的长度在30个氨基酸至1600个氨基酸之间(例如的长度在约200个氨基酸至约1500个氨基酸之间)。在本文所述的任何组合物的一些实施方案中,第一载体还包括启动子和Kozak序列中的一者或两者。在本文所述的任何组合物的一些实施方案中,第一载体包括是诱导型启动子、组成型启动子、或组织特异性启动子的启动子。
在本文所述的任何组合物的一些实施方案中,两种不同载体中的第二者包括编码硬纤毛蛋白的C末端部分的编码序列。在本文所述的任何组合物的一些实施方案中,硬纤毛蛋白的C末端部分的长度在30个氨基酸至1600个氨基酸之间(例如的长度在200个氨基酸至1500个氨基酸之间)。在本文所述的任何组合物的一些实施方案中,第二载体还包括多聚(dA)序列。本文所述的任何组合物的一些实施方案还包括药学上可接受的赋形剂。
本文还提供了包括本文所述的任何组合物的药盒。本文所述的任何药盒的一些实施方案还包括含有组合物的预装载注射器。
本文还提供了包括向哺乳动物的耳蜗中引入治疗有效量的本文所述的任何组合物的方法。在本文所述的任何方法的一些实施方案中,哺乳动物是人。在本文所述的任何方法的一些实施方案中,哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
本文还提供了使哺乳动物细胞中全长硬纤毛蛋白的表达增加的方法,所述方法包括将本文所述的任何组合物引入所述哺乳动物细胞中。在本文所述的任何方法的一些实施方案中,哺乳动物细胞是耳蜗外毛细胞。在本文所述的任何方法的一些实施方案中,哺乳动物细胞是人细胞。在本文所述的任何方法的一些实施方案中,哺乳动物细胞先前已被确定为具有缺陷性硬纤毛蛋白基因。
本文还提供了使哺乳动物的耳蜗中的外毛细胞中的全长硬纤毛蛋白的表达增加的方法,所述方法包括向所述哺乳动物的所述耳蜗中引入治疗有效量的本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。在本文所述的任何方法的一些实施方案中,哺乳动物是人。
本文还提供了治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者的非症状性感觉神经性听力损失的方法,所述方法包括向所述受试者的耳蜗中施用治疗有效量的本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,受试者是人。本文所述的任何方法的一些实施方案还包括在施用步骤之前确定受试者具有缺陷性硬纤毛蛋白基因。
本文还提供了包括两种不同核酸载体的组合物,其中:所述两种不同核酸载体中的第一核酸载体包括启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、以及位于所述第一编码序列的3’末端的剪接供体信号序列;并且所述两种不同核酸载体中的第二核酸载体包括剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及在所述第二编码序列的3’末端的多腺苷酸化序列;其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且当引入哺乳动物细胞中时,在所述剪接供体信号序列与所述剪接接受体信号序列之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。在本文所述的任何组合物的一些实施方案中,编码序列中的至少一者包括跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。
还提供了包括两种不同核酸载体的组合物,其中:所述两种不同核酸载体中的第一核酸载体包括启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的第一可检测标记基因;并且所述两种不同核酸载体中的第二核酸载体包括第二可检测标记基因、位于所述第二可检测标记基因的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及位于所述第二编码序列的3’末端的多腺苷酸化序列;其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且当引入哺乳动物细胞中时,在所述剪接供体信号与所述剪接接受体信号之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。在本文所述的任何组合物的一些实施方案中,编码序列中的至少一者包括跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。在本文所述的任何组合物的一些实施方案中,第一或第二可检测标记基因是碱性磷酸酶。在本文所述的任何组合物的一些实施方案中,第一可检测标记基因和第二可检测标记基因是相同的。
本文还提供了包括两种不同核酸载体的组合物,其中:所述两种不同核酸载体中的第一核酸载体包括启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的F1噬菌体致重组区域;并且所述两种不同核酸载体中的第二核酸载体包括F1噬菌体致重组区域、位于所述F1噬菌体致重组区域的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及位于所述第二编码序列的3’末端的多腺苷酸化序列;其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且当引入哺乳动物细胞中时,在所述剪接供体信号与所述剪接接受体信号之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。在本文所述的任何组合物的一些实施方案中,编码序列中的至少一者包括跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。
本文还提供了包括以下的组合物:Cas9核酸酶;引导RNA,所述引导RNA在其5’末端包括由互补于SEQ ID NO:5的位置13955-14151内的20个连续核苷酸的20个核苷酸组成的互补性区域,所述引导RNA能够在CRISPR/Cas9 RNA引导的基因组编辑中用于在SEQ ID NO:5的内源性硬纤毛蛋白假基因序列中的预定位点处移除无义突变;并且当引入哺乳动物细胞中时,编码全长硬纤毛蛋白的核酸在硬纤毛蛋白假基因的基因座处得以重构。
还提供了包括至少一种核酸载体的组合物,其中所述至少一种核酸载体包括腺相关病毒(AAV)载体,所述腺相关病毒载体包括至少80%互补于SEQ ID NO:5的在位置13955-14151处的连续核苷酸序列的反义寡核苷酸,其中所述反义寡核苷酸的长度在15-30个核苷酸之间;并且当引入哺乳动物细胞中时,在硬纤毛蛋白假基因的基因座处产生编码全长硬纤毛蛋白的核酸。
本文还提供了包括本文所述的任何组合物的药盒。本文所述的任何药盒的一些实施方案还包括含有组合物的预装载注射器。
还提供了包括向哺乳动物的耳蜗中引入治疗有效量的本文所述的任何组合物的方法。在本文所述的任何方法的一些实施方案中,哺乳动物是人。在本文所述的任何方法的一些实施方案中,哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
本文还提供了使哺乳动物细胞中全长硬纤毛蛋白的表达增加的方法,所述方法包括将本文所述的任何组合物引入所述哺乳动物细胞中。在本文所述的任何方法的一些实施方案中,哺乳动物细胞是耳蜗外毛细胞。在本文所述的任何方法的一些实施方案中,哺乳动物细胞是人细胞。在本文所述的任何方法的一些实施方案中,哺乳动物细胞先前已被确定为具有缺陷性硬纤毛蛋白基因。
本文还提供了使哺乳动物的耳蜗中的外毛细胞中的全长硬纤毛蛋白的表达增加的方法,所述方法包括向所述哺乳动物的所述耳蜗中引入治疗有效量的本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。在本文所述的任何方法的一些实施方案中,哺乳动物是人。
本文还提供了治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者的非症状性感觉神经性听力损失的方法,所述方法包括向所述受试者的耳蜗中施用治疗有效量的本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,受试者是人。本文所述的任何方法的一些实施方案还包括在施用步骤之前确定受试者具有缺陷性硬纤毛蛋白基因。
术语“一个(种)(a/an)”是指所述冠词的一个(种)或超过一个(种)(即至少一个(种))语法对象。举例来说,“一个(种)要素”涵盖一个(种)要素以及超过一个(种)要素。
术语“硬纤毛蛋白基因中的突变”是指野生型硬纤毛蛋白基因中的修饰,所述修饰导致产生相较于野生型硬纤毛蛋白,具有以下中的一者或多者的硬纤毛蛋白:一个或多个氨基酸的缺失、一个或多个氨基酸取代、以及一个或多个氨基酸***,和/或导致相较于不具有突变的哺乳动物细胞中所编码硬纤毛蛋白的表达水平,哺乳动物细胞中所编码硬纤毛蛋白的表达水平降低。在一些实施方案中,突变可导致产生具有一个或多个氨基酸(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15 16、17、18、19或20个氨基酸)的缺失的硬纤毛蛋白。在一些实施方案中,突变可导致硬纤毛蛋白基因中的移码。本领域中已知术语“移码”涵盖编码序列中的导致所述编码序列的阅读框的移动的任何突变。在一些实施方案中,移码可导致非功能性蛋白质。在一些实施方案中,点突变可为无义突变(即在基因的外显子中产生过早终止密码子)。无义突变可导致产生可或可不具有功能性的截短蛋白质(相较于相应野生型蛋白质)。在一些实施方案中,突变可导致硬纤毛蛋白mRNA、或硬纤毛蛋白、或mRNA与蛋白质两者的表达的丧失(或水平降低)。在一些实施方案中,突变可导致产生相较于野生型硬纤毛蛋白,一种或多种生物活性(功能)丧失或降低的经改***纤毛蛋白。
在一些实施方案中,突变是一个或多个核苷酸向硬纤毛蛋白基因中的***。在一些实施方案中,突变在硬纤毛蛋白基因的调控序列中,即基因的不是编码序列的部分。在一些实施方案中,调控序列中的突变可在启动子或增强子区域中,并且阻止或降低硬纤毛蛋白基因的适当转录。术语“保守性突变”是指不改变在突变位点处编码的氨基酸的突变(归因于密码子简并性)。
修饰可通过本领域中已知的标准技术诸如定点诱变和PCR介导的诱变来引入核苷酸序列中。保守性氨基酸取代是其中氨基酸残基被具有类似侧链的氨基酸残基替换的氨基酸取代。本领域中已定义具有类似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸和组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸和谷氨酸)、具有不带电荷极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸和色氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸和甲硫氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸和异亮氨酸)、以及具有芳族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸)。
除非另外规定,否则“编码氨基酸序列的核苷酸序列”包括是彼此的简并形式,因此编码相同氨基酸序列的所有核苷酸序列。
术语“内源性”是指任何物质来源于生物体、细胞或组织内。
术语“外源性”是指从生物体、细胞或组织的外部引入或来源于生物体、细胞或组织的外部的任何物质不由它被引入其中的前述生物体、细胞或组织产生或不来源于它被引入其中的前述生物体、细胞或组织。
术语“经分离”意指从天然状态改变或移除。举例来说,天然存在于活体动物中的核酸或肽不是“经分离的”,但部分地或完全地与它的天然状态的共存物质分离的前述核酸或肽是“经分离的”。经分离核酸或蛋白质可以大致上纯化形式存在,或可存在于非天然环境诸如像宿主细胞中。
术语“转染”、“转化”或“转导”是指外源性核酸被转移至或引入细胞中所采用的过程。“经转染”、“经转化”或“经转导”哺乳动物细胞是已用外源性核酸转染、转化或转导的哺乳动物细胞。
术语“表达”是指编码蛋白质的特定核苷酸序列的转录和/或翻译。
术语“短暂表达”是指非整合编码序列持续短暂时期(例如数小时或数天)的表达。在细胞(例如哺乳动物细胞)中短暂表达的编码序列在多轮细胞***后丢失。
术语“受试者”意图包括任何哺乳动物。在一些实施方案中,受试者是啮齿动物(例如大鼠或小鼠)、兔、非人灵长类动物或人。在一些实施方案中,受试者患有非综合征性耳聋,或处于显现非综合征性耳聋的风险下。在一些实施方案中,受试者先前已被鉴定为在硬纤毛蛋白基因中具有突变。在一些实施方案中,受试者已被鉴定为在硬纤毛蛋白基因中具有突变,并且已被诊断有非症状性感觉神经性听力损失。在一些实施方案中,受试者已被鉴定为患有非症状性感觉神经性听力损失。
当治疗导致受试者(例如人)的疾病状态(例如非症状性感觉神经性听力损失)的一种或多种症状的数目、严重性和频率中的一者或多者降低时,所述治疗是“治疗有效的”。在一些实施方案中,治疗有效量的组合物可导致活性硬纤毛蛋白(例如野生型全长硬纤毛蛋白或硬纤毛蛋白的具有所需活性的变体)的表达水平增加(例如相较于在用所述组合物治疗之前的表达水平)。在一些实施方案中,治疗有效量的组合物可导致靶标细胞(例如耳蜗外毛细胞)中活性硬纤毛蛋白(例如野生型全长硬纤毛蛋白或活性变体)的表达水平增加。在一些实施方案中,治疗有效量的组合物可导致靶标细胞中活性硬纤毛蛋白(例如野生型全长硬纤毛蛋白或活性变体)的表达水平增加,和/或硬纤毛蛋白的一种或多种活性的增加(例如相较于参考水平,诸如在治疗之前受试者中的一种或多种水平,在硬纤毛蛋白基因中具有突变的受试者中的一种或多种水平,或患有非症状性感觉神经性听力损失的受试者或受试者群体中的一种或多种水平)。
术语“核酸”或“多核苷酸”是指呈单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)或它们的组合。除非明确限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,所述核酸与参考核苷酸具有类似结合性质。除非另外指示,否则特定核酸序列还隐含地涵盖互补序列以及明确指示的序列。在本文所述的任何核酸的一些实施方案中,核酸是DNA。在本文所述的任何核酸的一些实施方案中,核酸是RNA。
术语“活性硬纤毛蛋白”意指由以下DNA编码的蛋白质,如果所述DNA替代在其他方面是野生型哺乳动物的哺乳动物的听觉毛细胞中编码全长硬纤毛蛋白的两个野生型等位基因,并且如果在那个哺乳动物的所述听觉毛细胞中表达,那么所述DNA导致那个哺乳动物具有接近完全是野生型的类似哺乳动物的正常听力水平的听力水平。活性硬纤毛蛋白的非限制性实例是全长硬纤毛蛋白(例如本文所述的任何全长硬纤毛蛋白)。
举例来说,活性硬纤毛蛋白可包括野生型全长硬纤毛蛋白(例如野生型人全长硬纤毛蛋白)的包括1个氨基酸取代至约160个氨基酸取代、1个氨基酸取代至约155个氨基酸取代、1个氨基酸取代至约150个氨基酸取代、1个氨基酸取代至约145个氨基酸取代、1个氨基酸取代至约140个氨基酸取代、1个氨基酸取代至约135个氨基酸取代、1个氨基酸取代至约130个氨基酸取代、1个氨基酸取代至约125个氨基酸取代、1个氨基酸取代至约120个氨基酸取代、1个氨基酸取代至约115个氨基酸取代、1个氨基酸取代至约110个氨基酸取代、1个氨基酸取代至约105个氨基酸取代、1个氨基酸取代至约100个氨基酸取代、1个氨基酸取代至约95个氨基酸取代、1个氨基酸取代至约90个氨基酸取代、1个氨基酸取代至约85个氨基酸取代、1个氨基酸取代至约80个氨基酸取代、1个氨基酸取代至约75个氨基酸取代、1个氨基酸取代至约70个氨基酸取代、1个氨基酸取代至约65个氨基酸取代、1个氨基酸取代至约60个氨基酸取代、1个氨基酸取代至约55个氨基酸取代、1个氨基酸取代至约50个氨基酸取代、1个氨基酸取代至约45个氨基酸取代、1个氨基酸取代至约40个氨基酸取代、1个氨基酸取代至约35个氨基酸取代、1个氨基酸取代至约30个氨基酸取代、1个氨基酸取代至约25个氨基酸取代、1个氨基酸取代至约20个氨基酸取代、1个氨基酸取代至约15个氨基酸取代、1个氨基酸取代至约10个氨基酸取代、1个氨基酸取代至约9个氨基酸取代、1个氨基酸取代至约8个氨基酸取代、1个氨基酸取代至约7个氨基酸取代、1个氨基酸取代至约6个氨基酸取代、1个氨基酸取代至约5个氨基酸取代、1个氨基酸取代至约4个氨基酸取代、1个氨基酸取代至约3个氨基酸取代、约2个氨基酸取代至约160个氨基酸取代、约2个氨基酸取代至约155个氨基酸取代、约2个氨基酸取代至约150个氨基酸取代、约2个氨基酸取代至约145个氨基酸取代、约2个氨基酸取代至约140个氨基酸取代、约2个氨基酸取代至约135个氨基酸取代、约2个氨基酸取代至约130个氨基酸取代、约2个氨基酸取代至约125个氨基酸取代、约2个氨基酸取代至约120个氨基酸取代、约2个氨基酸取代至约115个氨基酸取代、约2个氨基酸取代至约110个氨基酸取代、约2个氨基酸取代至约105个氨基酸取代、约2个氨基酸取代至约100个氨基酸取代、约2个氨基酸取代至约95个氨基酸取代、约2个氨基酸取代至约90个氨基酸取代、约2个氨基酸取代至约85个氨基酸取代、约2个氨基酸取代至约80个氨基酸取代、约2个氨基酸取代至约75个氨基酸取代、约2个氨基酸取代至约70个氨基酸取代、约2个氨基酸取代至约65个氨基酸取代、约2个氨基酸取代至约60个氨基酸取代、约2个氨基酸取代至约55个氨基酸取代、约2个氨基酸取代至约50个氨基酸取代、约2个氨基酸取代至约45个氨基酸取代、约2个氨基酸取代至约40个氨基酸取代、约2个氨基酸取代至约35个氨基酸取代、约2个氨基酸取代至约30个氨基酸取代、约2个氨基酸取代至约25个氨基酸取代、约2个氨基酸取代至约20个氨基酸取代、约2个氨基酸取代至约15个氨基酸取代、约2个氨基酸取代至约10个氨基酸取代、约2个氨基酸取代至约9个氨基酸取代、约2个氨基酸取代至约8个氨基酸取代、约2个氨基酸取代至约7个氨基酸取代、约2个氨基酸取代至约6个氨基酸取代、约2个氨基酸取代至约5个氨基酸取代、约2个氨基酸取代至约4个氨基酸取代、约3个氨基酸取代至约160个氨基酸取代、约3个氨基酸取代至约155个氨基酸取代、约3个氨基酸取代至约150个氨基酸取代、约3个氨基酸取代至约145个氨基酸取代、约3个氨基酸取代至约140个氨基酸取代、约3个氨基酸取代至约135个氨基酸取代、约3个氨基酸取代至约130个氨基酸取代、约3个氨基酸取代至约125个氨基酸取代、约3个氨基酸取代至约120个氨基酸取代、约3个氨基酸取代至约115个氨基酸取代、约3个氨基酸取代至约110个氨基酸取代、约3个氨基酸取代至约105个氨基酸取代、约3个氨基酸取代至约100个氨基酸取代、约3个氨基酸取代至约95个氨基酸取代、约3个氨基酸取代至约90个氨基酸取代、约3个氨基酸取代至约85个氨基酸取代、约3个氨基酸取代至约80个氨基酸取代、约3个氨基酸取代至约75个氨基酸取代、约3个氨基酸取代至约70个氨基酸取代、约3个氨基酸取代至约65个氨基酸取代、约3个氨基酸取代至约60个氨基酸取代、约3个氨基酸取代至约55个氨基酸取代、约3个氨基酸取代至约50个氨基酸取代、约3个氨基酸取代至约45个氨基酸取代、约3个氨基酸取代至约40个氨基酸取代、约3个氨基酸取代至约35个氨基酸取代、约3个氨基酸取代至约30个氨基酸取代、约3个氨基酸取代至约25个氨基酸取代、约3个氨基酸取代至约20个氨基酸取代、约3个氨基酸取代至约15个氨基酸取代、约3个氨基酸取代至约10个氨基酸取代、约3个氨基酸取代至约9个氨基酸取代、约3个氨基酸取代至约8个氨基酸取代、约3个氨基酸取代至约7个氨基酸取代、约3个氨基酸取代至约6个氨基酸取代、约3个氨基酸取代至约5个氨基酸取代、约4个氨基酸取代至约160个氨基酸取代、约4个氨基酸取代至约155个氨基酸取代、约4个氨基酸取代至约150个氨基酸取代、约4个氨基酸取代至约145个氨基酸取代、约4个氨基酸取代至约140个氨基酸取代、约4个氨基酸取代至约135个氨基酸取代、约4个氨基酸取代至约130个氨基酸取代、约4个氨基酸取代至约125个氨基酸取代、约4个氨基酸取代至约120个氨基酸取代、约4个氨基酸取代至约115个氨基酸取代、约4个氨基酸取代至约110个氨基酸取代、约4个氨基酸取代至约105个氨基酸取代、约4个氨基酸取代至约100个氨基酸取代、约4个氨基酸取代至约95个氨基酸取代、约4个氨基酸取代至约90个氨基酸取代、约4个氨基酸取代至约85个氨基酸取代、约4个氨基酸取代至约80个氨基酸取代、约4个氨基酸取代至约75个氨基酸取代、约4个氨基酸取代至约70个氨基酸取代、约4个氨基酸取代至约65个氨基酸取代、约4个氨基酸取代至约60个氨基酸取代、约4个氨基酸取代至约55个氨基酸取代、约4个氨基酸取代至约50个氨基酸取代、约4个氨基酸取代至约45个氨基酸取代、约4个氨基酸取代至约40个氨基酸取代、约4个氨基酸取代至约35个氨基酸取代、约4个氨基酸取代至约30个氨基酸取代、约4个氨基酸取代至约25个氨基酸取代、约4个氨基酸取代至约20个氨基酸取代、约4个氨基酸取代至约15个氨基酸取代、约4个氨基酸取代至约10个氨基酸取代、约4个氨基酸取代至约9个氨基酸取代、约4个氨基酸取代至约8个氨基酸取代、约4个氨基酸取代至约7个氨基酸取代、约4个氨基酸取代至约6个氨基酸取代、约5个氨基酸取代至约160个氨基酸取代、约5个氨基酸取代至约155个氨基酸取代、约5个氨基酸取代至约150个氨基酸取代、约5个氨基酸取代至约145个氨基酸取代、约5个氨基酸取代至约140个氨基酸取代、约5个氨基酸取代至约135个氨基酸取代、约5个氨基酸取代至约130个氨基酸取代、约5个氨基酸取代至约125个氨基酸取代、约5个氨基酸取代至约120个氨基酸取代、约5个氨基酸取代至约115个氨基酸取代、约5个氨基酸取代至约110个氨基酸取代、约5个氨基酸取代至约105个氨基酸取代、约5个氨基酸取代至约100个氨基酸取代、约5个氨基酸取代至约95个氨基酸取代、约5个氨基酸取代至约90个氨基酸取代、约5个氨基酸取代至约85个氨基酸取代、约5个氨基酸取代至约80个氨基酸取代、约5个氨基酸取代至约75个氨基酸取代、约5个氨基酸取代至约70个氨基酸取代、约5个氨基酸取代至约65个氨基酸取代、约5个氨基酸取代至约60个氨基酸取代、约5个氨基酸取代至约55个氨基酸取代、约5个氨基酸取代至约50个氨基酸取代、约5个氨基酸取代至约45个氨基酸取代、约5个氨基酸取代至约40个氨基酸取代、约5个氨基酸取代至约35个氨基酸取代、约5个氨基酸取代至约30个氨基酸取代、约5个氨基酸取代至约25个氨基酸取代、约5个氨基酸取代至约20个氨基酸取代、约5个氨基酸取代至约15个氨基酸取代、约5个氨基酸取代至约10个氨基酸取代、约5个氨基酸取代至约9个氨基酸取代、约5个氨基酸取代至约8个氨基酸取代、约5个氨基酸取代至约7个氨基酸取代、约6个氨基酸取代至约160个氨基酸取代、约6个氨基酸取代至约155个氨基酸取代、约6个氨基酸取代至约150个氨基酸取代、约6个氨基酸取代至约145个氨基酸取代、约6个氨基酸取代至约140个氨基酸取代、约6个氨基酸取代至约135个氨基酸取代、约6个氨基酸取代至约130个氨基酸取代、约6个氨基酸取代至约125个氨基酸取代、约6个氨基酸取代至约120个氨基酸取代、约6个氨基酸取代至约115个氨基酸取代、约6个氨基酸取代至约110个氨基酸取代、约6个氨基酸取代至约105个氨基酸取代、约6个氨基酸取代至约100个氨基酸取代、约6个氨基酸取代至约95个氨基酸取代、约6个氨基酸取代至约90个氨基酸取代、约6个氨基酸取代至约85个氨基酸取代、约6个氨基酸取代至约80个氨基酸取代、约6个氨基酸取代至约75个氨基酸取代、约6个氨基酸取代至约70个氨基酸取代、约6个氨基酸取代至约65个氨基酸取代、约6个氨基酸取代至约60个氨基酸取代、约6个氨基酸取代至约55个氨基酸取代、约6个氨基酸取代至约50个氨基酸取代、约6个氨基酸取代至约45个氨基酸取代、约6个氨基酸取代至约40个氨基酸取代、约6个氨基酸取代至约35个氨基酸取代、约6个氨基酸取代至约30个氨基酸取代、约6个氨基酸取代至约25个氨基酸取代、约6个氨基酸取代至约20个氨基酸取代、约6个氨基酸取代至约15个氨基酸取代、约6个氨基酸取代至约10个氨基酸取代、约6个氨基酸取代至约9个氨基酸取代、约6个氨基酸取代至约8个氨基酸取代、约7个氨基酸取代至约160个氨基酸取代、约7个氨基酸取代至约155个氨基酸取代、约7个氨基酸取代至约150个氨基酸取代、约7个氨基酸取代至约145个氨基酸取代、约7个氨基酸取代至约140个氨基酸取代、约7个氨基酸取代至约135个氨基酸取代、约7个氨基酸取代至约130个氨基酸取代、约7个氨基酸取代至约125个氨基酸取代、约7个氨基酸取代至约120个氨基酸取代、约7个氨基酸取代至约115个氨基酸取代、约7个氨基酸取代至约110个氨基酸取代、约7个氨基酸取代至约105个氨基酸取代、约7个氨基酸取代至约100个氨基酸取代、约7个氨基酸取代至约95个氨基酸取代、约7个氨基酸取代至约90个氨基酸取代、约7个氨基酸取代至约85个氨基酸取代、约7个氨基酸取代至约80个氨基酸取代、约7个氨基酸取代至约75个氨基酸取代、约7个氨基酸取代至约70个氨基酸取代、约7个氨基酸取代至约65个氨基酸取代、约7个氨基酸取代至约60个氨基酸取代、约7个氨基酸取代至约55个氨基酸取代、约7个氨基酸取代至约50个氨基酸取代、约7个氨基酸取代至约45个氨基酸取代、约7个氨基酸取代至约40个氨基酸取代、约7个氨基酸取代至约35个氨基酸取代、约7个氨基酸取代至约30个氨基酸取代、约7个氨基酸取代至约25个氨基酸取代、约7个氨基酸取代至约20个氨基酸取代、约7个氨基酸取代至约15个氨基酸取代、约7个氨基酸取代至约10个氨基酸取代、约7个氨基酸取代至约9个氨基酸取代、约8个氨基酸取代至约160个氨基酸取代、约8个氨基酸取代至约155个氨基酸取代、约8个氨基酸取代至约150个氨基酸取代、约8个氨基酸取代至约145个氨基酸取代、约8个氨基酸取代至约140个氨基酸取代、约8个氨基酸取代至约135个氨基酸取代、约8个氨基酸取代至约130个氨基酸取代、约8个氨基酸取代至约125个氨基酸取代、约8个氨基酸取代至约120个氨基酸取代、约8个氨基酸取代至约115个氨基酸取代、约8个氨基酸取代至约110个氨基酸取代、约8个氨基酸取代至约105个氨基酸取代、约8个氨基酸取代至约100个氨基酸取代、约8个氨基酸取代至约95个氨基酸取代、约8个氨基酸取代至约90个氨基酸取代、约8个氨基酸取代至约85个氨基酸取代、约8个氨基酸取代至约80个氨基酸取代、约8个氨基酸取代至约75个氨基酸取代、约8个氨基酸取代至约70个氨基酸取代、约8个氨基酸取代至约65个氨基酸取代、约8个氨基酸取代至约60个氨基酸取代、约8个氨基酸取代至约55个氨基酸取代、约8个氨基酸取代至约50个氨基酸取代、约8个氨基酸取代至约45个氨基酸取代、约8个氨基酸取代至约40个氨基酸取代、约8个氨基酸取代至约35个氨基酸取代、约8个氨基酸取代至约30个氨基酸取代、约8个氨基酸取代至约25个氨基酸取代、约8个氨基酸取代至约20个氨基酸取代、约8个氨基酸取代至约15个氨基酸取代、约8个氨基酸取代至约10个氨基酸取代、约10个氨基酸取代至约160个氨基酸取代、约10个氨基酸取代至约155个氨基酸取代、约10个氨基酸取代至约150个氨基酸取代、约10个氨基酸取代至约145个氨基酸取代、约10个氨基酸取代至约140个氨基酸取代、约10个氨基酸取代至约135个氨基酸取代、约10个氨基酸取代至约130个氨基酸取代、约10个氨基酸取代至约125个氨基酸取代、约10个氨基酸取代至约120个氨基酸取代、约10个氨基酸取代至约115个氨基酸取代、约10个氨基酸取代至约110个氨基酸取代、约10个氨基酸取代至约105个氨基酸取代、约10个氨基酸取代至约100个氨基酸取代、约10个氨基酸取代至约95个氨基酸取代、约10个氨基酸取代至约90个氨基酸取代、约10个氨基酸取代至约85个氨基酸取代、约10个氨基酸取代至约80个氨基酸取代、约10个氨基酸取代至约75个氨基酸取代、约10个氨基酸取代至约70个氨基酸取代、约10个氨基酸取代至约65个氨基酸取代、约10个氨基酸取代至约60个氨基酸取代、约10个氨基酸取代至约55个氨基酸取代、约10个氨基酸取代至约50个氨基酸取代、约10个氨基酸取代至约45个氨基酸取代、约10个氨基酸取代至约40个氨基酸取代、约10个氨基酸取代至约35个氨基酸取代、约10个氨基酸取代至约30个氨基酸取代、约10个氨基酸取代至约25个氨基酸取代、约10个氨基酸取代至约20个氨基酸取代、约10个氨基酸取代至约15个氨基酸取代、约15个氨基酸取代至约160个氨基酸取代、约15个氨基酸取代至约155个氨基酸取代、约15个氨基酸取代至约150个氨基酸取代、约15个氨基酸取代至约145个氨基酸取代、约15个氨基酸取代至约140个氨基酸取代、约15个氨基酸取代至约135个氨基酸取代、约15个氨基酸取代至约130个氨基酸取代、约15个氨基酸取代至约125个氨基酸取代、约15个氨基酸取代至约120个氨基酸取代、约15个氨基酸取代至约115个氨基酸取代、约15个氨基酸取代至约110个氨基酸取代、约15个氨基酸取代至约105个氨基酸取代、约15个氨基酸取代至约100个氨基酸取代、约15个氨基酸取代至约95个氨基酸取代、约15个氨基酸取代至约90个氨基酸取代、约15个氨基酸取代至约85个氨基酸取代、约15个氨基酸取代至约80个氨基酸取代、约15个氨基酸取代至约75个氨基酸取代、约15个氨基酸取代至约70个氨基酸取代、约15个氨基酸取代至约65个氨基酸取代、约15个氨基酸取代至约60个氨基酸取代、约15个氨基酸取代至约55个氨基酸取代、约15个氨基酸取代至约50个氨基酸取代、约15个氨基酸取代至约45个氨基酸取代、约15个氨基酸取代至约40个氨基酸取代、约15个氨基酸取代至约35个氨基酸取代、约15个氨基酸取代至约30个氨基酸取代、约15个氨基酸取代至约25个氨基酸取代、约15个氨基酸取代至约20个氨基酸取代、约20个氨基酸取代至约160个氨基酸取代、约20个氨基酸取代至约155个氨基酸取代、约20个氨基酸取代至约150个氨基酸取代、约20个氨基酸取代至约145个氨基酸取代、约20个氨基酸取代至约140个氨基酸取代、约20个氨基酸取代至约135个氨基酸取代、约20个氨基酸取代至约130个氨基酸取代、约20个氨基酸取代至约125个氨基酸取代、约20个氨基酸取代至约120个氨基酸取代、约20个氨基酸取代至约115个氨基酸取代、约20个氨基酸取代至约110个氨基酸取代、约20个氨基酸取代至约105个氨基酸取代、约20个氨基酸取代至约100个氨基酸取代、约20个氨基酸取代至约95个氨基酸取代、约20个氨基酸取代至约90个氨基酸取代、约20个氨基酸取代至约85个氨基酸取代、约20个氨基酸取代至约80个氨基酸取代、约20个氨基酸取代至约75个氨基酸取代、约20个氨基酸取代至约70个氨基酸取代、约20个氨基酸取代至约65个氨基酸取代、约20个氨基酸取代至约60个氨基酸取代、约20个氨基酸取代至约55个氨基酸取代、约20个氨基酸取代至约50个氨基酸取代、约20个氨基酸取代至约45个氨基酸取代、约20个氨基酸取代至约40个氨基酸取代、约20个氨基酸取代至约35个氨基酸取代、约20个氨基酸取代至约30个氨基酸取代、约20个氨基酸取代至约25个氨基酸取代、约25个氨基酸取代至约160个氨基酸取代、约25个氨基酸取代至约155个氨基酸取代、约25个氨基酸取代至约150个氨基酸取代、约25个氨基酸取代至约145个氨基酸取代、约25个氨基酸取代至约140个氨基酸取代、约25个氨基酸取代至约135个氨基酸取代、约25个氨基酸取代至约130个氨基酸取代、约25个氨基酸取代至约125个氨基酸取代、约25个氨基酸取代至约120个氨基酸取代、约25个氨基酸取代至约115个氨基酸取代、约25个氨基酸取代至约110个氨基酸取代、约25个氨基酸取代至约105个氨基酸取代、约25个氨基酸取代至约100个氨基酸取代、约25个氨基酸取代至约95个氨基酸取代、约25个氨基酸取代至约90个氨基酸取代、约25个氨基酸取代至约85个氨基酸取代、约25个氨基酸取代至约80个氨基酸取代、约25个氨基酸取代至约75个氨基酸取代、约25个氨基酸取代至约70个氨基酸取代、约25个氨基酸取代至约65个氨基酸取代、约25个氨基酸取代至约60个氨基酸取代、约25个氨基酸取代至约55个氨基酸取代、约25个氨基酸取代至约50个氨基酸取代、约25个氨基酸取代至约45个氨基酸取代、约25个氨基酸取代至约40个氨基酸取代、约25个氨基酸取代至约35个氨基酸取代、约25个氨基酸取代至约30个氨基酸取代、约30个氨基酸取代至约160个氨基酸取代、约30个氨基酸取代至约155个氨基酸取代、约30个氨基酸取代至约150个氨基酸取代、约30个氨基酸取代至约145个氨基酸取代、约30个氨基酸取代至约140个氨基酸取代、约30个氨基酸取代至约135个氨基酸取代、约30个氨基酸取代至约130个氨基酸取代、约30个氨基酸取代至约125个氨基酸取代、约30个氨基酸取代至约120个氨基酸取代、约30个氨基酸取代至约115个氨基酸取代、约30个氨基酸取代至约110个氨基酸取代、约30个氨基酸取代至约105个氨基酸取代、约30个氨基酸取代至约100个氨基酸取代、约30个氨基酸取代至约95个氨基酸取代、约30个氨基酸取代至约90个氨基酸取代、约30个氨基酸取代至约85个氨基酸取代、约30个氨基酸取代至约80个氨基酸取代、约30个氨基酸取代至约75个氨基酸取代、约30个氨基酸取代至约70个氨基酸取代、约30个氨基酸取代至约65个氨基酸取代、约30个氨基酸取代至约60个氨基酸取代、约30个氨基酸取代至约55个氨基酸取代、约30个氨基酸取代至约50个氨基酸取代、约30个氨基酸取代至约45个氨基酸取代、约30个氨基酸取代至约40个氨基酸取代、约30个氨基酸取代至约35个氨基酸取代、约35个氨基酸取代至约160个氨基酸取代、约35个氨基酸取代至约155个氨基酸取代、约35个氨基酸取代至约150个氨基酸取代、约35个氨基酸取代至约145个氨基酸取代、约35个氨基酸取代至约140个氨基酸取代、约35个氨基酸取代至约135个氨基酸取代、约35个氨基酸取代至约130个氨基酸取代、约35个氨基酸取代至约125个氨基酸取代、约35个氨基酸取代至约120个氨基酸取代、约35个氨基酸取代至约115个氨基酸取代、约35个氨基酸取代至约110个氨基酸取代、约35个氨基酸取代至约105个氨基酸取代、约35个氨基酸取代至约100个氨基酸取代、约35个氨基酸取代至约95个氨基酸取代、约35个氨基酸取代至约90个氨基酸取代、约35个氨基酸取代至约85个氨基酸取代、约35个氨基酸取代至约80个氨基酸取代、约35个氨基酸取代至约75个氨基酸取代、约35个氨基酸取代至约70个氨基酸取代、约35个氨基酸取代至约65个氨基酸取代、约35个氨基酸取代至约60个氨基酸取代、约35个氨基酸取代至约55个氨基酸取代、约35个氨基酸取代至约50个氨基酸取代、约35个氨基酸取代至约45个氨基酸取代、约35个氨基酸取代至约40个氨基酸取代、约40个氨基酸取代至约160个氨基酸取代、约40个氨基酸取代至约155个氨基酸取代、约40个氨基酸取代至约150个氨基酸取代、约40个氨基酸取代至约145个氨基酸取代、约40个氨基酸取代至约140个氨基酸取代、约40个氨基酸取代至约135个氨基酸取代、约40个氨基酸取代至约130个氨基酸取代、约40个氨基酸取代至约125个氨基酸取代、约40个氨基酸取代至约120个氨基酸取代、约40个氨基酸取代至约115个氨基酸取代、约40个氨基酸取代至约110个氨基酸取代、约40个氨基酸取代至约105个氨基酸取代、约40个氨基酸取代至约100个氨基酸取代、约40个氨基酸取代至约95个氨基酸取代、约40个氨基酸取代至约90个氨基酸取代、约40个氨基酸取代至约85个氨基酸取代、约40个氨基酸取代至约80个氨基酸取代、约40个氨基酸取代至约75个氨基酸取代、约40个氨基酸取代至约70个氨基酸取代、约40个氨基酸取代至约65个氨基酸取代、约40个氨基酸取代至约60个氨基酸取代、约40个氨基酸取代至约55个氨基酸取代、约40个氨基酸取代至约50个氨基酸取代、约40个氨基酸取代至约45个氨基酸取代、约45个氨基酸取代至约160个氨基酸取代、约45个氨基酸取代至约155个氨基酸取代、约45个氨基酸取代至约150个氨基酸取代、约45个氨基酸取代至约145个氨基酸取代、约45个氨基酸取代至约140个氨基酸取代、约45个氨基酸取代至约135个氨基酸取代、约45个氨基酸取代至约130个氨基酸取代、约45个氨基酸取代至约125个氨基酸取代、约45个氨基酸取代至约120个氨基酸取代、约45个氨基酸取代至约115个氨基酸取代、约45个氨基酸取代至约110个氨基酸取代、约45个氨基酸取代至约105个氨基酸取代、约45个氨基酸取代至约100个氨基酸取代、约45个氨基酸取代至约95个氨基酸取代、约45个氨基酸取代至约90个氨基酸取代、约45个氨基酸取代至约85个氨基酸取代、约45个氨基酸取代至约80个氨基酸取代、约45个氨基酸取代至约75个氨基酸取代、约45个氨基酸取代至约70个氨基酸取代、约45个氨基酸取代至约65个氨基酸取代、约45个氨基酸取代至约60个氨基酸取代、约45个氨基酸取代至约55个氨基酸取代、约45个氨基酸取代至约50个氨基酸取代、约50个氨基酸取代至约160个氨基酸取代、约50个氨基酸取代至约155个氨基酸取代、约50个氨基酸取代至约150个氨基酸取代、约50个氨基酸取代至约145个氨基酸取代、约50个氨基酸取代至约140个氨基酸取代、约50个氨基酸取代至约135个氨基酸取代、约50个氨基酸取代至约130个氨基酸取代、约50个氨基酸取代至约125个氨基酸取代、约50个氨基酸取代至约120个氨基酸取代、约50个氨基酸取代至约115个氨基酸取代、约50个氨基酸取代至约110个氨基酸取代、约50个氨基酸取代至约105个氨基酸取代、约50个氨基酸取代至约100个氨基酸取代、约50个氨基酸取代至约95个氨基酸取代、约50个氨基酸取代至约90个氨基酸取代、约50个氨基酸取代至约85个氨基酸取代、约50个氨基酸取代至约80个氨基酸取代、约50个氨基酸取代至约75个氨基酸取代、约50个氨基酸取代至约70个氨基酸取代、约50个氨基酸取代至约65个氨基酸取代、约50个氨基酸取代至约60个氨基酸取代、约50个氨基酸取代至约55个氨基酸取代、约60个氨基酸取代至约160个氨基酸取代、约60个氨基酸取代至约155个氨基酸取代、约60个氨基酸取代至约150个氨基酸取代、约60个氨基酸取代至约145个氨基酸取代、约60个氨基酸取代至约140个氨基酸取代、约60个氨基酸取代至约135个氨基酸取代、约60个氨基酸取代至约130个氨基酸取代、约60个氨基酸取代至约125个氨基酸取代、约60个氨基酸取代至约120个氨基酸取代、约60个氨基酸取代至约115个氨基酸取代、约60个氨基酸取代至约110个氨基酸取代、约60个氨基酸取代至约105个氨基酸取代、约60个氨基酸取代至约100个氨基酸取代、约60个氨基酸取代至约95个氨基酸取代、约60个氨基酸取代至约90个氨基酸取代、约60个氨基酸取代至约85个氨基酸取代、约60个氨基酸取代至约80个氨基酸取代、约60个氨基酸取代至约75个氨基酸取代、约60个氨基酸取代至约70个氨基酸取代、约60个氨基酸取代至约65个氨基酸取代、约70个氨基酸取代至约160个氨基酸取代、约70个氨基酸取代至约155个氨基酸取代、约70个氨基酸取代至约150个氨基酸取代、约70个氨基酸取代至约145个氨基酸取代、约70个氨基酸取代至约140个氨基酸取代、约70个氨基酸取代至约135个氨基酸取代、约70个氨基酸取代至约130个氨基酸取代、约70个氨基酸取代至约125个氨基酸取代、约70个氨基酸取代至约120个氨基酸取代、约70个氨基酸取代至约115个氨基酸取代、约70个氨基酸取代至约110个氨基酸取代、约70个氨基酸取代至约105个氨基酸取代、约70个氨基酸取代至约100个氨基酸取代、约70个氨基酸取代至约95个氨基酸取代、约70个氨基酸取代至约90个氨基酸取代、约70个氨基酸取代至约85个氨基酸取代、约70个氨基酸取代至约80个氨基酸取代、约70个氨基酸取代至约75个氨基酸取代、约80个氨基酸取代至约160个氨基酸取代、约80个氨基酸取代至约155个氨基酸取代、约80个氨基酸取代至约150个氨基酸取代、约80个氨基酸取代至约145个氨基酸取代、约80个氨基酸取代至约140个氨基酸取代、约80个氨基酸取代至约135个氨基酸取代、约80个氨基酸取代至约130个氨基酸取代、约80个氨基酸取代至约125个氨基酸取代、约80个氨基酸取代至约120个氨基酸取代、约80个氨基酸取代至约115个氨基酸取代、约80个氨基酸取代至约110个氨基酸取代、约80个氨基酸取代至约105个氨基酸取代、约80个氨基酸取代至约100个氨基酸取代、约80个氨基酸取代至约95个氨基酸取代、约80个氨基酸取代至约90个氨基酸取代、约80个氨基酸取代至约85个氨基酸取代、约90个氨基酸取代至约160个氨基酸取代、约90个氨基酸取代至约155个氨基酸取代、约90个氨基酸取代至约150个氨基酸取代、约90个氨基酸取代至约145个氨基酸取代、约90个氨基酸取代至约140个氨基酸取代、约90个氨基酸取代至约135个氨基酸取代、约90个氨基酸取代至约130个氨基酸取代、约90个氨基酸取代至约125个氨基酸取代、约90个氨基酸取代至约120个氨基酸取代、约90个氨基酸取代至约115个氨基酸取代、约90个氨基酸取代至约110个氨基酸取代、约90个氨基酸取代至约105个氨基酸取代、约90个氨基酸取代至约100个氨基酸取代、约90个氨基酸取代至约95个氨基酸取代、约100个氨基酸取代至约160个氨基酸取代、约100个氨基酸取代至约155个氨基酸取代、约100个氨基酸取代至约150个氨基酸取代、约100个氨基酸取代至约145个氨基酸取代、约100个氨基酸取代至约140个氨基酸取代、约100个氨基酸取代至约135个氨基酸取代、约100个氨基酸取代至约130个氨基酸取代、约100个氨基酸取代至约125个氨基酸取代、约100个氨基酸取代至约120个氨基酸取代、约100个氨基酸取代至约115个氨基酸取代、约100个氨基酸取代至约110个氨基酸取代、约100个氨基酸取代至约105个氨基酸取代、约110个氨基酸取代至约160个氨基酸取代、约110个氨基酸取代至约155个氨基酸取代、约110个氨基酸取代至约150个氨基酸取代、约110个氨基酸取代至约145个氨基酸取代、约110个氨基酸取代至约140个氨基酸取代、约110个氨基酸取代至约135个氨基酸取代、约110个氨基酸取代至约130个氨基酸取代、约110个氨基酸取代至约125个氨基酸取代、约110个氨基酸取代至约120个氨基酸取代、约110个氨基酸取代至约115个氨基酸取代、约120个氨基酸取代至约160个氨基酸取代、约120个氨基酸取代至约155个氨基酸取代、约120个氨基酸取代至约150个氨基酸取代、约120个氨基酸取代至约145个氨基酸取代、约120个氨基酸取代至约140个氨基酸取代、约120个氨基酸取代至约135个氨基酸取代、约120个氨基酸取代至约130个氨基酸取代、约120个氨基酸取代至约125个氨基酸取代、约130个氨基酸取代至约160个氨基酸取代、约130个氨基酸取代至约155个氨基酸取代、约130个氨基酸取代至约150个氨基酸取代、约130个氨基酸取代至约145个氨基酸取代、约130个氨基酸取代至约140个氨基酸取代、约130个氨基酸取代至约135个氨基酸取代、约140个氨基酸取代至约160个氨基酸取代、约140个氨基酸取代至约155个氨基酸取代、约140个氨基酸取代至约150个氨基酸取代、约140个氨基酸取代至约145个氨基酸取代、约150个氨基酸取代至约160个氨基酸取代、或约150个氨基酸取代至约155个氨基酸取代的序列。本领域技术人员将了解可使在来自不同物种的野生型硬纤毛蛋白之间保守的氨基酸突变而不丧失活性,而不应使在来自不同物种的野生型硬纤毛蛋白之间不保守的那些氨基酸突变,因为它们(相比于在不同物种之间不保守的氨基酸)更可能涉及于活性中。
活性硬纤毛蛋白可包括例如野生型全长硬纤毛蛋白(例如野生型人全长硬纤毛蛋白)的缺失1个氨基酸至约50个氨基酸、1个氨基酸至约45个氨基酸、1个氨基酸至约40个氨基酸、1个氨基酸至约35个氨基酸、1个氨基酸至约30个氨基酸、1个氨基酸至约25个氨基酸、1个氨基酸至约20个氨基酸、1个氨基酸至约15个氨基酸、1个氨基酸至约10个氨基酸、1个氨基酸至约9个氨基酸、1个氨基酸至约8个氨基酸、1个氨基酸至约7个氨基酸、1个氨基酸至约6个氨基酸、1个氨基酸至约5个氨基酸、1个氨基酸至约4个氨基酸、1个氨基酸至约3个氨基酸、约2个氨基酸至约50个氨基酸、约2个氨基酸至约45个氨基酸、约2个氨基酸至约40个氨基酸、约2个氨基酸至约35个氨基酸、约2个氨基酸至约30个氨基酸、约2个氨基酸至约25个氨基酸、约2个氨基酸至约20个氨基酸、约2个氨基酸至约15个氨基酸、约2个氨基酸至约10个氨基酸、约2个氨基酸至约9个氨基酸、约2个氨基酸至约8个氨基酸、约2个氨基酸至约7个氨基酸、约2个氨基酸至约6个氨基酸、约2个氨基酸至约5个氨基酸、约2个氨基酸至约4个氨基酸、约3个氨基酸至约50个氨基酸、约3个氨基酸至约45个氨基酸、约3个氨基酸至约40个氨基酸、约3个氨基酸至约35个氨基酸、约3个氨基酸至约30个氨基酸、约3个氨基酸至约25个氨基酸、约3个氨基酸至约20个氨基酸、约3个氨基酸至约15个氨基酸、约3个氨基酸至约10个氨基酸、约3个氨基酸至约9个氨基酸、约3个氨基酸至约8个氨基酸、约3个氨基酸至约7个氨基酸、约3个氨基酸至约6个氨基酸、约3个氨基酸至约5个氨基酸、约4个氨基酸至约50个氨基酸、约4个氨基酸至约45个氨基酸、约4个氨基酸至约40个氨基酸、约4个氨基酸至约35个氨基酸、约4个氨基酸至约30个氨基酸、约4个氨基酸至约25个氨基酸、约4个氨基酸至约20个氨基酸、约4个氨基酸至约15个氨基酸、约4个氨基酸至约10个氨基酸、约4个氨基酸至约9个氨基酸、约4个氨基酸至约8个氨基酸、约4个氨基酸至约7个氨基酸、约4个氨基酸至约6个氨基酸、约5个氨基酸至约50个氨基酸、约5个氨基酸至约45个氨基酸、约5个氨基酸至约40个氨基酸、约5个氨基酸至约35个氨基酸、约5个氨基酸至约30个氨基酸、约5个氨基酸至约25个氨基酸、约5个氨基酸至约20个氨基酸、约5个氨基酸至约15个氨基酸、约5个氨基酸至约10个氨基酸、约5个氨基酸至约9个氨基酸、约5个氨基酸至约8个氨基酸、约5个氨基酸至约7个氨基酸、约6个氨基酸至约50个氨基酸、约6个氨基酸至约45个氨基酸、约6个氨基酸至约40个氨基酸、约6个氨基酸至约35个氨基酸、约6个氨基酸至约30个氨基酸、约6个氨基酸至约25个氨基酸、约6个氨基酸至约20个氨基酸、约6个氨基酸至约15个氨基酸、约6个氨基酸至约10个氨基酸、约6个氨基酸至约9个氨基酸、约6个氨基酸至约8个氨基酸、约7个氨基酸至约50个氨基酸、约7个氨基酸至约45个氨基酸、约7个氨基酸至约40个氨基酸、约7个氨基酸至约35个氨基酸、约7个氨基酸至约30个氨基酸、约7个氨基酸至约25个氨基酸、约7个氨基酸至约20个氨基酸、约7个氨基酸至约15个氨基酸、约7个氨基酸至约10个氨基酸、约7个氨基酸至约9个氨基酸、约8个氨基酸至约50个氨基酸、约8个氨基酸至约45个氨基酸、约8个氨基酸至约40个氨基酸、约8个氨基酸至约35个氨基酸、约8个氨基酸至约30个氨基酸、约8个氨基酸至约25个氨基酸、约8个氨基酸至约20个氨基酸、约8个氨基酸至约15个氨基酸、约8个氨基酸至约10个氨基酸、约10个氨基酸至约50个氨基酸、约10个氨基酸至约45个氨基酸、约10个氨基酸至约40个氨基酸、约10个氨基酸至约35个氨基酸、约10个氨基酸至约30个氨基酸、约10个氨基酸至约25个氨基酸、约10个氨基酸至约20个氨基酸、约10个氨基酸至约15个氨基酸、约15个氨基酸至约50个氨基酸、约15个氨基酸至约45个氨基酸、约15个氨基酸至约40个氨基酸、约15个氨基酸至约35个氨基酸、约15个氨基酸至约30个氨基酸、约15个氨基酸至约25个氨基酸、约15个氨基酸至约20个氨基酸、约20个氨基酸至约50个氨基酸、约20个氨基酸至约45个氨基酸、约20个氨基酸至约40个氨基酸、约20个氨基酸至约35个氨基酸、约20个氨基酸至约30个氨基酸、约20个氨基酸至约25个氨基酸、约25个氨基酸至约50个氨基酸、约25个氨基酸至约45个氨基酸、约25个氨基酸至约40个氨基酸、约25个氨基酸至约35个氨基酸、约25个氨基酸至约30个氨基酸、约30个氨基酸至约50个氨基酸、约30个氨基酸至约45个氨基酸、约30个氨基酸至约40个氨基酸、约30个氨基酸至约35个氨基酸、约35个氨基酸至约50个氨基酸、约35个氨基酸至约45个氨基酸、约35个氨基酸至约40个氨基酸、约40个氨基酸至约50个氨基酸、约40个氨基酸至约45个氨基酸、约45个氨基酸至约50个氨基酸的序列。在其中两个或更多个氨基酸从野生型全长硬纤毛蛋白的序列缺失的一些实施方案中,所述两个或更多个缺失氨基酸在野生型全长蛋白的序列中可为连续的。在其中两个或更多个氨基酸从野生型全长硬纤毛蛋白的序列缺失的其他实例中,所述两个或更多个缺失氨基酸在野生型全长蛋白的序列中不是连续的。本领域技术人员将了解可使在来自不同物种的野生型全长硬纤毛蛋白之间不保守的氨基酸缺失而不丧失活性,而不应使在来自不同物种的野生型全长硬纤毛蛋白之间保守的那些氨基酸缺失,因为它们(相比于在不同物种之间不保守的氨基酸)更可能涉及于活性中。
在一些实例中,活性硬纤毛蛋白可例如包括野生型全长硬纤毛蛋白的从它的N末端移除1个氨基酸至约100个氨基酸、1个氨基酸至约95个氨基酸、1个氨基酸至约90个氨基酸、1个氨基酸至约85个氨基酸、1个氨基酸至约80个氨基酸、1个氨基酸至约75个氨基酸、1个氨基酸至约70个氨基酸、1个氨基酸至约65个氨基酸、1个氨基酸至约60个氨基酸、1个氨基酸至约55个氨基酸、1个氨基酸至约50个氨基酸、1个氨基酸至约45个氨基酸、1个氨基酸至约40个氨基酸、1个氨基酸至约35个氨基酸、1个氨基酸至约30个氨基酸、1个氨基酸至约25个氨基酸、1个氨基酸至约20个氨基酸、1个氨基酸至约15个氨基酸、1个氨基酸至约10个氨基酸、1个氨基酸至约9个氨基酸、1个氨基酸至约8个氨基酸、1个氨基酸至约7个氨基酸、1个氨基酸至约6个氨基酸、1个氨基酸至约5个氨基酸、1个氨基酸至约4个氨基酸、1个氨基酸至约3个氨基酸、约2个氨基酸至约100个氨基酸、约2个氨基酸至约95个氨基酸、约2个氨基酸至约90个氨基酸、约2个氨基酸至约85个氨基酸、约2个氨基酸至约80个氨基酸、约2个氨基酸至约75个氨基酸、约2个氨基酸至约70个氨基酸、约2个氨基酸至约65个氨基酸、约2个氨基酸至约60个氨基酸、约2个氨基酸至约55个氨基酸、约2个氨基酸至约50个氨基酸、约2个氨基酸至约45个氨基酸、约2个氨基酸至约40个氨基酸、约2个氨基酸至约35个氨基酸、约2个氨基酸至约30个氨基酸、约2个氨基酸至约25个氨基酸、约2个氨基酸至约20个氨基酸、约2个氨基酸至约15个氨基酸、约2个氨基酸至约10个氨基酸、约2个氨基酸至约9个氨基酸、约2个氨基酸至约8个氨基酸、约2个氨基酸至约7个氨基酸、约2个氨基酸至约6个氨基酸、约2个氨基酸至约5个氨基酸、约2个氨基酸至约4个氨基酸、约3个氨基酸至约100个氨基酸、约3个氨基酸至约95个氨基酸、约3个氨基酸至约90个氨基酸、约3个氨基酸至约85个氨基酸、约3个氨基酸至约80个氨基酸、约3个氨基酸至约75个氨基酸、约3个氨基酸至约70个氨基酸、约3个氨基酸至约65个氨基酸、约3个氨基酸至约60个氨基酸、约3个氨基酸至约55个氨基酸、约3个氨基酸至约50个氨基酸、约3个氨基酸至约45个氨基酸、约3个氨基酸至约40个氨基酸、约3个氨基酸至约35个氨基酸、约3个氨基酸至约30个氨基酸、约3个氨基酸至约25个氨基酸、约3个氨基酸至约20个氨基酸、约3个氨基酸至约15个氨基酸、约3个氨基酸至约10个氨基酸、约3个氨基酸至约9个氨基酸、约3个氨基酸至约8个氨基酸、约3个氨基酸至约7个氨基酸、约3个氨基酸至约6个氨基酸、约3个氨基酸至约5个氨基酸、约4个氨基酸至约100个氨基酸、约4个氨基酸至约95个氨基酸、约4个氨基酸至约90个氨基酸、约4个氨基酸至约85个氨基酸、约4个氨基酸至约80个氨基酸、约4个氨基酸至约75个氨基酸、约4个氨基酸至约70个氨基酸、约4个氨基酸至约65个氨基酸、约4个氨基酸至约60个氨基酸、约4个氨基酸至约55个氨基酸、约4个氨基酸至约50个氨基酸、约4个氨基酸至约45个氨基酸、约4个氨基酸至约40个氨基酸、约4个氨基酸至约35个氨基酸、约4个氨基酸至约30个氨基酸、约4个氨基酸至约25个氨基酸、约4个氨基酸至约20个氨基酸、约4个氨基酸至约15个氨基酸、约4个氨基酸至约10个氨基酸、约4个氨基酸至约9个氨基酸、约4个氨基酸至约8个氨基酸、约4个氨基酸至约7个氨基酸、约4个氨基酸至约6个氨基酸、约5个氨基酸至约100个氨基酸、约5个氨基酸至约95个氨基酸、约5个氨基酸至约90个氨基酸、约5个氨基酸至约85个氨基酸、约5个氨基酸至约80个氨基酸、约5个氨基酸至约75个氨基酸、约5个氨基酸至约70个氨基酸、约5个氨基酸至约65个氨基酸、约5个氨基酸至约60个氨基酸、约5个氨基酸至约55个氨基酸、约5个氨基酸至约50个氨基酸、约5个氨基酸至约45个氨基酸、约5个氨基酸至约40个氨基酸、约5个氨基酸至约35个氨基酸、约5个氨基酸至约30个氨基酸、约5个氨基酸至约25个氨基酸、约5个氨基酸至约20个氨基酸、约5个氨基酸至约15个氨基酸、约5个氨基酸至约10个氨基酸、约5个氨基酸至约9个氨基酸、约5个氨基酸至约8个氨基酸、约5个氨基酸至约7个氨基酸、约6个氨基酸至约100个氨基酸、约6个氨基酸至约95个氨基酸、约6个氨基酸至约90个氨基酸、约6个氨基酸至约85个氨基酸、约6个氨基酸至约80个氨基酸、约6个氨基酸至约75个氨基酸、约6个氨基酸至约70个氨基酸、约6个氨基酸至约65个氨基酸、约6个氨基酸至约60个氨基酸、约6个氨基酸至约55个氨基酸、约6个氨基酸至约50个氨基酸、约6个氨基酸至约45个氨基酸、约6个氨基酸至约40个氨基酸、约6个氨基酸至约35个氨基酸、约6个氨基酸至约30个氨基酸、约6个氨基酸至约25个氨基酸、约6个氨基酸至约20个氨基酸、约6个氨基酸至约15个氨基酸、约6个氨基酸至约10个氨基酸、约6个氨基酸至约9个氨基酸、约6个氨基酸至约8个氨基酸、约7个氨基酸至约100个氨基酸、约7个氨基酸至约95个氨基酸、约7个氨基酸至约90个氨基酸、约7个氨基酸至约85个氨基酸、约7个氨基酸至约80个氨基酸、约7个氨基酸至约75个氨基酸、约7个氨基酸至约70个氨基酸、约7个氨基酸至约65个氨基酸、约7个氨基酸至约60个氨基酸、约7个氨基酸至约55个氨基酸、约7个氨基酸至约50个氨基酸、约7个氨基酸至约45个氨基酸、约7个氨基酸至约40个氨基酸、约7个氨基酸至约35个氨基酸、约7个氨基酸至约30个氨基酸、约7个氨基酸至约25个氨基酸、约7个氨基酸至约20个氨基酸、约7个氨基酸至约15个氨基酸、约7个氨基酸至约10个氨基酸、约7个氨基酸至约9个氨基酸、约8个氨基酸至约100个氨基酸、约8个氨基酸至约95个氨基酸、约8个氨基酸至约90个氨基酸、约8个氨基酸至约85个氨基酸、约8个氨基酸至约80个氨基酸、约8个氨基酸至约75个氨基酸、约8个氨基酸至约70个氨基酸、约8个氨基酸至约65个氨基酸、约8个氨基酸至约60个氨基酸、约8个氨基酸至约55个氨基酸、约8个氨基酸至约50个氨基酸、约8个氨基酸至约45个氨基酸、约8个氨基酸至约40个氨基酸、约8个氨基酸至约35个氨基酸、约8个氨基酸至约30个氨基酸、约8个氨基酸至约25个氨基酸、约8个氨基酸至约20个氨基酸、约8个氨基酸至约15个氨基酸、约8个氨基酸至约10个氨基酸、约10个氨基酸至约100个氨基酸、约10个氨基酸至约95个氨基酸、约10个氨基酸至约90个氨基酸、约10个氨基酸至约85个氨基酸、约10个氨基酸至约80个氨基酸、约10个氨基酸至约75个氨基酸、约10个氨基酸至约70个氨基酸、约10个氨基酸至约65个氨基酸、约10个氨基酸至约60个氨基酸、约10个氨基酸至约55个氨基酸、约10个氨基酸至约50个氨基酸、约10个氨基酸至约45个氨基酸、约10个氨基酸至约40个氨基酸、约10个氨基酸至约35个氨基酸、约10个氨基酸至约30个氨基酸、约10个氨基酸至约25个氨基酸、约10个氨基酸至约20个氨基酸、约10个氨基酸至约15个氨基酸、约20个氨基酸至约100个氨基酸、约20个氨基酸至约95个氨基酸、约20个氨基酸至约90个氨基酸、约20个氨基酸至约85个氨基酸、约20个氨基酸至约80个氨基酸、约20个氨基酸至约75个氨基酸、约20个氨基酸至约70个氨基酸、约20个氨基酸至约65个氨基酸、约20个氨基酸至约60个氨基酸、约20个氨基酸至约55个氨基酸、约20个氨基酸至约50个氨基酸、约20个氨基酸至约45个氨基酸、约20个氨基酸至约40个氨基酸、约20个氨基酸至约35个氨基酸、约20个氨基酸至约30个氨基酸、约20个氨基酸至约25个氨基酸、约30个氨基酸至约100个氨基酸、约30个氨基酸至约95个氨基酸、约30个氨基酸至约90个氨基酸、约30个氨基酸至约85个氨基酸、约30个氨基酸至约80个氨基酸、约30个氨基酸至约75个氨基酸、约30个氨基酸至约70个氨基酸、约30个氨基酸至约65个氨基酸、约30个氨基酸至约60个氨基酸、约30个氨基酸至约55个氨基酸、约30个氨基酸至约50个氨基酸、约30个氨基酸至约45个氨基酸、约30个氨基酸至约40个氨基酸、约30个氨基酸至约35个氨基酸、约40个氨基酸至约100个氨基酸、约40个氨基酸至约95个氨基酸、约40个氨基酸至约90个氨基酸、约40个氨基酸至约85个氨基酸、约40个氨基酸至约80个氨基酸、约40个氨基酸至约75个氨基酸、约40个氨基酸至约70个氨基酸、约40个氨基酸至约65个氨基酸、约40个氨基酸至约60个氨基酸、约40个氨基酸至约55个氨基酸、约40个氨基酸至约50个氨基酸、约40个氨基酸至约45个氨基酸、约50个氨基酸至约100个氨基酸、约50个氨基酸至约95个氨基酸、约50个氨基酸至约90个氨基酸、约50个氨基酸至约85个氨基酸、约50个氨基酸至约80个氨基酸、约50个氨基酸至约75个氨基酸、约50个氨基酸至约70个氨基酸、约50个氨基酸至约65个氨基酸、约50个氨基酸至约60个氨基酸、约50个氨基酸至约55个氨基酸、约60个氨基酸至约100个氨基酸、约60个氨基酸至约95个氨基酸、约60个氨基酸至约90个氨基酸、约60个氨基酸至约85个氨基酸、约60个氨基酸至约80个氨基酸、约60个氨基酸至约75个氨基酸、约60个氨基酸至约70个氨基酸、约60个氨基酸至约65个氨基酸、约70个氨基酸至约100个氨基酸、约70个氨基酸至约95个氨基酸、约70个氨基酸至约90个氨基酸、约70个氨基酸至约85个氨基酸、约70个氨基酸至约80个氨基酸、约70个氨基酸至约75个氨基酸、约80个氨基酸至约100个氨基酸、约80个氨基酸至约95个氨基酸、约80个氨基酸至约90个氨基酸、约80个氨基酸至约85个氨基酸、约90个氨基酸至约100个氨基酸、约90个氨基酸至约95个氨基酸、或约95个氨基酸至约100个氨基酸,和/或从它的C末端移除1个氨基酸至100个氨基酸(或本文所述的这个范围的任何子范围)的序列。
在一些实施方案中,活性硬纤毛蛋白可例如包括野生型全长硬纤毛蛋白的其中***1个氨基酸至50个氨基酸、1个氨基酸至45个氨基酸、1个氨基酸至40个氨基酸、1个氨基酸至35个氨基酸、1个氨基酸至30个氨基酸、1个氨基酸至25个氨基酸、1个氨基酸至20个氨基酸、1个氨基酸至15个氨基酸、1个氨基酸至10个氨基酸、1个氨基酸至9个氨基酸、1个氨基酸至8个氨基酸、1个氨基酸至7个氨基酸、1个氨基酸至6个氨基酸、1个氨基酸至5个氨基酸、1个氨基酸至4个氨基酸、1个氨基酸至3个氨基酸、约2个氨基酸至50个氨基酸、约2个氨基酸至45个氨基酸、约2个氨基酸至40个氨基酸、约2个氨基酸至35个氨基酸、约2个氨基酸至30个氨基酸、约2个氨基酸至25个氨基酸、约2个氨基酸至20个氨基酸、约2个氨基酸至15个氨基酸、约2个氨基酸至10个氨基酸、约2个氨基酸至9个氨基酸、约2个氨基酸至8个氨基酸、约2个氨基酸至7个氨基酸、约2个氨基酸至6个氨基酸、约2个氨基酸至5个氨基酸、约2个氨基酸至4个氨基酸、约3个氨基酸至50个氨基酸、约3个氨基酸至45个氨基酸、约3个氨基酸至40个氨基酸、约3个氨基酸至35个氨基酸、约3个氨基酸至30个氨基酸、约3个氨基酸至25个氨基酸、约3个氨基酸至20个氨基酸、约3个氨基酸至15个氨基酸、约3个氨基酸至10个氨基酸、约3个氨基酸至9个氨基酸、约3个氨基酸至8个氨基酸、约3个氨基酸至7个氨基酸、约3个氨基酸至6个氨基酸、约3个氨基酸至5个氨基酸、约4个氨基酸至50个氨基酸、约4个氨基酸至45个氨基酸、约4个氨基酸至40个氨基酸、约4个氨基酸至35个氨基酸、约4个氨基酸至30个氨基酸、约4个氨基酸至25个氨基酸、约4个氨基酸至20个氨基酸、约4个氨基酸至15个氨基酸、约4个氨基酸至10个氨基酸、约4个氨基酸至9个氨基酸、约4个氨基酸至8个氨基酸、约4个氨基酸至7个氨基酸、约4个氨基酸至6个氨基酸、约5个氨基酸至50个氨基酸、约5个氨基酸至45个氨基酸、约5个氨基酸至40个氨基酸、约5个氨基酸至35个氨基酸、约5个氨基酸至30个氨基酸、约5个氨基酸至25个氨基酸、约5个氨基酸至20个氨基酸、约5个氨基酸至15个氨基酸、约5个氨基酸至10个氨基酸、约5个氨基酸至9个氨基酸、约5个氨基酸至8个氨基酸、约5个氨基酸至7个氨基酸、约6个氨基酸至50个氨基酸、约6个氨基酸至45个氨基酸、约6个氨基酸至40个氨基酸、约6个氨基酸至35个氨基酸、约6个氨基酸至30个氨基酸、约6个氨基酸至25个氨基酸、约6个氨基酸至20个氨基酸、约6个氨基酸至15个氨基酸、约6个氨基酸至10个氨基酸、约6个氨基酸至9个氨基酸、约6个氨基酸至8个氨基酸、约7个氨基酸至50个氨基酸、约7个氨基酸至45个氨基酸、约7个氨基酸至40个氨基酸、约7个氨基酸至35个氨基酸、约7个氨基酸至30个氨基酸、约7个氨基酸至25个氨基酸、约7个氨基酸至20个氨基酸、约7个氨基酸至15个氨基酸、约7个氨基酸至10个氨基酸、约7个氨基酸至9个氨基酸、约8个氨基酸至50个氨基酸、约8个氨基酸至45个氨基酸、约8个氨基酸至40个氨基酸、约8个氨基酸至35个氨基酸、约8个氨基酸至30个氨基酸、约8个氨基酸至25个氨基酸、约8个氨基酸至20个氨基酸、约8个氨基酸至15个氨基酸、约8个氨基酸至10个氨基酸、约10个氨基酸至50个氨基酸、约10个氨基酸至45个氨基酸、约10个氨基酸至40个氨基酸、约10个氨基酸至35个氨基酸、约10个氨基酸至30个氨基酸、约10个氨基酸至25个氨基酸、约10个氨基酸至20个氨基酸、约10个氨基酸至15个氨基酸、约15个氨基酸至50个氨基酸、约15个氨基酸至45个氨基酸、约15个氨基酸至40个氨基酸、约15个氨基酸至35个氨基酸、约15个氨基酸至30个氨基酸、约15个氨基酸至25个氨基酸、约15个氨基酸至20个氨基酸、约20个氨基酸至50个氨基酸、约20个氨基酸至45个氨基酸、约20个氨基酸至40个氨基酸、约20个氨基酸至35个氨基酸、约20个氨基酸至30个氨基酸、约20个氨基酸至25个氨基酸、约25个氨基酸至50个氨基酸、约25个氨基酸至45个氨基酸、约25个氨基酸至40个氨基酸、约25个氨基酸至35个氨基酸、约25个氨基酸至30个氨基酸、约30个氨基酸至50个氨基酸、约30个氨基酸至45个氨基酸、约30个氨基酸至40个氨基酸、约30个氨基酸至35个氨基酸、约35个氨基酸至50个氨基酸、约35个氨基酸至45个氨基酸、约35个氨基酸至40个氨基酸、约40个氨基酸至50个氨基酸、约40个氨基酸至45个氨基酸、或约45个氨基酸至约50个氨基酸的序列。在一些实例中,1个氨基酸至50个氨基酸(或其任何子范围)可以连续序列形式***野生型全长蛋白的序列中。在一些实例中,1个氨基酸至50个氨基酸(或其任何子范围)不以连续序列形式***野生型全长蛋白的序列中。如本领域中可了解,1个氨基酸至50个氨基酸可***野生型全长蛋白的序列的在物种之间不是充分保守的部分中。
除非另外定义,否则本文所用的所有技术和科学术语都具有与由本发明所属领域的普通技术人员通常所理解相同的含义。本文描述了用于本发明中的方法和材料;还可使用本领域中已知的其他适合方法和材料。材料、方法和实例仅具有说明性而非意图具有限制性。本文提及的所有出版物、专利申请、专利、序列、数据库条目以及其他参考文献都通过引用以它们的整体并入本文。在有冲突的情况下,将以包括定义的本说明书为准。
附图说明
图1是可用于本文所述的任何本发明方法中的STRC载体(pITR-201;SEQ ID NO:12;4324个碱基对(bp))的遗传图谱的示例性图示。所述载体包括反向末端重复序列(ITR)序列(SEQ ID NO:18)、5’FVIII填充序列(SEQ ID NO:19)、CMV增强子(SEQ ID NO:20)、CMV启动子(SEQ ID NO:21)、5’非翻译区(UTR)序列(SEQ ID NO:24)、5’STRC编码序列(SEQ IDNO:25)、剪接供体信号序列(SD)(SEQ ID NO:6)、来自F1噬菌体的高度致重组序列(AK;SEQID NO:26)和ITR序列(SEQ ID NO:36)。
图2是可用于本文所述的任何本发明方法中的STRC载体(pITR-202;SEQ ID NO:13;4434bp)的遗传图谱的示例性图示。所述载体包括ITR序列(SEQ ID NO:18)、AK序列(SEQID NO:26)、SD序列(SEQ ID NO:6)、3’STRC编码序列(SEQ ID NO:28)、3’UTR序列(SEQ IDNO:33)、牛生长激素多腺苷酸化信号(bGHpA)(SEQ ID NO:34)、3’FVIII填充序列(SEQ IDNO:35)和ITR序列(SEQ ID NO:36)。
图3是可用于本文所述的任何本发明方法中的STRC载体(pITR-202GFP;SEQ IDNO:14;4693bp)的遗传图谱的示例性图示。所述载体包括ITR序列(SEQ ID NO:18)、AK序列(SEQ ID NO:26)、SD序列(SEQ ID NO:6)、3’STRC编码序列(SEQ ID NO:28)、T2A序列(SEQID NO:29)、tGFP序列(SEQ ID NO:31)、3’UTR序列(SEQ ID NO:33)、bGHpA序列(SEQ ID NO:34)和ITR序列(SEQ ID NO:36)。
图4是可用于本文所述的任何本发明方法中的STRC载体(pITR-203;SEQ ID NO:15;4619bp)的遗传图谱的示例性图示。所述载体包括ITR序列(SEQ ID NO:18)、5’FVIII填充序列_500序列(SEQ ID NO:37)、CMV增强子(SEQ ID NO:20)、CMV启动子序列(SEQ ID NO:21)、5’UTR序列(SEQ ID NO:24)、5’STRC编码序列(SEQ ID NO:25)、SD序列(SEQ ID NO:6)、AP序列(AP)(SEQ ID NO:27)和ITR序列(SEQ ID NO:36)。
图5是可用于本文所述的任何本发明方法中的STRC载体(pITR-204;SEQ ID NO:16;4729bp)的遗传图谱的示例性图示。所述载体包括ITR序列(SEQ ID NO:18)、AP序列(SEQID NO:27)、剪接接受体信号(SA)序列(SEQ ID NO:7)、3’STRC编码序列(SEQ ID NO:28)、3’UTR序列(SEQ ID NO:33)、bGHpA序列(SEQ ID NO:34)和ITR序列(SEQ ID NO:36)。
图6是可用于本文所述的任何本发明方法中的STRC载体(pITR-205;SEQ ID NO:17;4460bp)的遗传图谱的示例性图示。所述载体包括ITR序列(SEQ ID NO:18)、CMV增强子(SEQ ID NO:20)、鸡β-肌动蛋白(CBA)启动子(SEQ ID NO:22)、嵌合内含子序列(SEQ IDNO:23)、5’UTR序列(SEQ ID NO:24)、5’STRC编码序列(SEQ ID NO:25)、SD序列(SEQ ID NO:6)、AK序列(SEQ ID NO:26)和ITR序列(SEQ ID NO:36)。
图7是使用多克隆STRC抗体获得的来自用单一或双重STRC载体转染的HEK293FT细胞的在转染后72小时的STRC蛋白水平的免疫印迹的图像。β-肌动蛋白(ACTB)用作上样对照。泳道1–预染Page尺;泳道2–400ng pITR-201加400ng pITR-202;泳道3–400ng pITR-201加400ng pITR-202GFP;泳道4–400ng pITR-203加400ng pITR-204;泳道5–400ng pITR-205加400ng pITR-202;泳道6–400ng pITR-205加400ng pITR-202GFP;泳道7–800ng pITR-202GFP;以及泳道8–未转染对照细胞溶解产物。
图8是使用多克隆STRC抗体获得的来自用双重STRC载体(AAV2.STRC和Anc80.STRC)在不同MOI(2.6E5、8.6E4、2.6E5和8.6E4)下转导的HEK293FT细胞的在转染后72小时的STRC蛋白水平的免疫印迹的图像。β-肌动蛋白(ACTB)用作上样对照。
图9是显示在分别用AAV2.STRC(在MOI 8.6E4和MOI 2.6E5下)和Anc80.STRC(在MOI 8.6E4和2.6E5下)转导的HEK293FT细胞中,STRC(5’STRC、3’STRC和全长STRC)相对于GAPDH的相对RNA表达的条形图。
图10是显示在来自野生型小鼠的分别用AAV2.STRC(在MOI1.3E10下)和Anc80.STRC(在MOI 3.9E10下)感染16小时的P1-3耳蜗外植体中,STRC(5’STRC、3’STRC和全长STRC)相对于GAPDH的相对RNA表达的条形图。
图11A是来自模拟感染野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽(phalloidin)染色的示例性荧光图像。
图11B是来自模拟感染野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。20倍放大。
图11C是来自经AAV.Anc80.STRC感染(在MOI 7.8E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。
图11D是来自经AAVanc80.dSTRC感染(在MOI 2.6E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。20倍放大。
图11E是来自经AAV.Anc80.STRC感染(在MOI 7.8E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。20倍放大。
图12A是来自经AAV2.STRC感染(在MOI 7.8E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。
图12B是来自经AAV2.STRC感染(在MOI 2.6E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。20倍放大。
图12C是来自经AAV2.STRC感染(在MOI 7.8E8 VG/耳蜗下)野生型小鼠的P1-3耳蜗外植体的显示Myo7a和鬼笔环肽染色的示例性荧光图像。20倍放大。
具体实施方式
本文提供了包括至少两种不同核酸载体的组合物,其中:所述至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列可任选地与所编码部分中的不同者的氨基酸序列部分重叠;所述至少两种不同载体中没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白);所述编码序列中的至少一者包含跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列;并且,当引入包含染色体DNA的哺乳动物细胞中时,所述至少两种不同载体经受彼此以及与所述细胞的所述染色体DNA的同源性重组,由此形成***所述染色体DNA中的重组核酸,其中所述重组核酸编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。还提供了包括本文所述的任何组合物的药盒。本文还提供了包括向哺乳动物的耳蜗中引入治疗有效量的本文所述的任何组合物的方法。
本文还提供了使哺乳动物细胞中活性硬纤毛蛋白(例如全长硬纤毛蛋白)的表达增加的方法,所述方法包括将本文所述的任何组合物引入所述哺乳动物细胞中。本文还提供了使哺乳动物的耳蜗中的外毛细胞中的活性硬纤毛蛋白(例如全长硬纤毛蛋白)的表达增加的方法,所述方法包括向所述哺乳动物的所述耳蜗中引入治疗有效量的本文所述的任何组合物。本文还提供了治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者的非症状性感觉神经性听力损失的方法,所述方法包括:向所述受试者的耳蜗中施用治疗有效量的本文所述的任何组合物。
组合物、药盒和方法的额外非限制性方面在本文中加以描述,并且可不加限制地以任何组合加以使用。
硬纤毛蛋白
STRC基因编码硬纤毛蛋白,即一种通常在内耳中表达,并且与内耳中的特化毛细胞的硬纤毛相关联的蛋白质(参见例如Verpy等人,Nature 456:255-258,2008;以及Zhang等人,J.Med.Genet.44:233-240,2007)。硬纤毛的长度是约10-50μm,对于听力和平衡是重要的。硬纤毛在听力中起机械传感作用。通过响应于声音进行弯曲,它们形成用于机械感受声音刺激的结构。
人STRC基因位于染色体15q15上。它含有涵盖约19千碱基(kb)的29个外显子(Verpy等人,Nature Genetics 29(3):345-349,2001;NCBI登录号NG011636.1)。所述基因以端粒至着丝粒定向在染色体15q15上串联重复,其中串联拷贝在染色体上以相隔小于100kb定位。第二拷贝的编码序列间插有外显子20中的终止密码子,这意味着它是编码非功能性截短蛋白的“假基因”。(在下文中,提及“STRC基因”意指不具有外显子20中的那个终止密码子的基因,而提及“假基因”或“STRC假基因”表示具有外显子20中的那个终止密码子的基因。)在一些实例中,全长STRC蛋白是全长野生型STRC蛋白。从人STRC基因表达的全长野生型STRC蛋白的长度是1775个残基,并且含有信号肽和若干疏水性区段。当信号肽在对野生型蛋白质的加工期间被裂解去除时,所得成熟野生型硬纤毛蛋白的长度是1719个残基。在一些实施方案中,全长STRC蛋白可包括位于成熟野生型硬纤毛蛋白的氨基酸序列的N末端的异源性信号肽。
STRC基因中的各种突变已与听力损失(例如非症状性感觉神经性听力损失)相关联。举例来说,在一个患有常染色体隐性非综合征性感觉神经性耳聋-16(DFNB16)的血缘巴基斯坦家庭中,在外显子13中鉴定到纯合性1bp***(Verpy等人(2001)。见于患有DFNB16的家庭中的另一实例包括外显子5中的4-bp缺失与涵盖外显子17-29的较大缺失两者。两种缺失分别遗传自父亲和母亲。预测4-bp缺失导致5个框外氨基酸的翻译以及外显子5中的过早终止密码子。
硬纤毛蛋白基因中的在患有非症状性感觉神经性听力损失的受试者中检测到的额外示例性突变以及对编码硬纤毛蛋白的核酸进行测序的方法描述于例如Verpy等人,Nature 456:255-259,2008;Verpy等人,Res.Systems Neurosci.519:194-210,2011;Hofrichter等人,Clinical Genetics 87:49-55,2015;以及Mandelker等人,J.Mol.Diagnostics 16:639-647,2014中。检测基因中的突变的方法在本领域中是熟知的。这类技术的非限制性实例包括:实时聚合酶链式反应(RT-PCR)、PCR、测序、Southern印迹和Northern印迹。
一示例性人野生型硬纤毛蛋白是或包括SEQ ID NO:1的序列。编码野生型硬纤毛蛋白的核酸的非限制性实例是或包括SEQ ID NO:2和SEQ ID NO:3。如本领域中可了解,可对SEQ ID NO:2中的密码子中的至少一些或全部进行密码子优化以允许在非人哺乳动物中或在人中达成最优表达。
在本文所述的任何组合物的一些实施方案中,硬纤毛蛋白包含与SEQ ID NO:1或SEQ ID NO:11具有至少75%(例如至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%)同一性的序列。在一些实施方案中,硬纤毛蛋白可包括与SEQ ID NO:1具有同一性的序列,例外之处是它包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸取代和/或缺失。
人全长野生型硬纤毛蛋白(SEQ ID NO:1)(信号序列以粗体显示)
Figure BDA0002959533770000401
人硬纤毛蛋白信号序列(SEQ ID NO:10)
Figure BDA0002959533770000402
人全长野生型硬纤毛蛋白(信号序列用粗体表示)(SEQ ID NO:11)
Figure BDA0002959533770000411
人野生型硬纤毛蛋白cDNA(SEQ ID NO:2)
Figure BDA0002959533770000412
Figure BDA0002959533770000421
Figure BDA0002959533770000431
人野生型硬纤毛蛋白cDNA–密码子优化(SEQ ID NO:3)
Figure BDA0002959533770000432
Figure BDA0002959533770000441
Figure BDA0002959533770000451
人野生型硬纤毛蛋白基因组DNA序列的一非限制性实例是SEQ ID NO:4。SEQ IDNO:4中的外显子是:核苷酸位置1-142(外显子1)、核苷酸位置445-1230(外显子2)、核苷酸位置1319-1343(外显子3)、核苷酸位置2111-3368(外显子4)、核苷酸位置4325-4387(外显子5)、核苷酸位置4489-4605(外显子6)、核苷酸位置4748-4914(外显子7)、核苷酸位置5570-5756(外显子8)、核苷酸位置5895-6010(外显子9)、核苷酸位置6292-6424(外显子10)、核苷酸位置6777-6959(外显子11)、核苷酸位置7264-7302(外显子12)、核苷酸位置7486-7653(外显子13)、核苷酸位置7817-7882(外显子14)、核苷酸位置8364-8489(外显子15)、核苷酸位置9467-9525(外显子16)、核苷酸位置10598-10721(外显子17)、核苷酸位置10826-10938(外显子18)、核苷酸位置13402-13537(外显子19)、核苷酸位置13955-14151(外显子20)、核苷酸位置14350-14440(外显子21)、核苷酸位置14649-14805(外显子22)、核苷酸位置15390-15559(外显子23)、核苷酸位置17250-17405(外显子24)、核苷酸位置17787-17929(外显子25)、核苷酸位置18119-18267(外显子26)、核苷酸位置18509-18605(外显子27)、核苷酸位置18694-18841(外显子28)以及核苷酸位置19041-19238(外显子29)。内含子位于SEQ ID NO:4中这些外显子中的每一者之间,即在核苷酸位置143-444(内含子1)、核苷酸位置1231-1318(内含子2)、核苷酸位置1344-2110(内含子3)、核苷酸位置3369-4324(内含子4)、核苷酸位置4388-4488(内含子5)、核苷酸位置4606-4747(内含子6)、核苷酸位置4915-5569(内含子7)、核苷酸位置5757-5894(内含子8)、核苷酸位置6011-6291(内含子9)、核苷酸位置6425-6776(内含子10)、核苷酸位置6960-7263(内含子11)、核苷酸位置7303-7485(内含子12)、核苷酸位置7654-7816(内含子13)、核苷酸位置7883-8363(内含子14)、核苷酸位置8490-9466(内含子15)、核苷酸位置9526-10597(内含子16)、核苷酸位置10722-10825(内含子17)、核苷酸位置10939-13401(内含子18)、核苷酸位置13538-13954(内含子19)、核苷酸位置14152-14349(内含子20)、核苷酸位置14441-14648(内含子21)、核苷酸位置14806-15389(内含子22)、核苷酸位置15560-17249(内含子23)、核苷酸位置17406-17786(内含子24)、核苷酸位置17930-18118(内含子25)、核苷酸位置18268-18508(内含子26)、核苷酸位置18606-18693(内含子27)以及核苷酸位置18842-19040(内含子28)处。
人野生型硬纤毛蛋白基因(SEQ ID NO:4)
Figure BDA0002959533770000461
Figure BDA0002959533770000471
Figure BDA0002959533770000481
Figure BDA0002959533770000491
Figure BDA0002959533770000501
Figure BDA0002959533770000511
Figure BDA0002959533770000521
Figure BDA0002959533770000531
人STRC假基因的核苷酸序列以SEQ ID NO:5显示。
人硬纤毛蛋白假基因1(STRCP1)(SEQ ID NO:5)
Figure BDA0002959533770000542
Figure BDA0002959533770000551
Figure BDA0002959533770000561
Figure BDA0002959533770000571
Figure BDA0002959533770000581
Figure BDA0002959533770000591
Figure BDA0002959533770000601
Figure BDA0002959533770000611
在一些实施方案中,硬纤毛蛋白可由与SEQ ID NO:8或SEQ ID NO:9具有至少70%、至少72%、至少74%、至少75%、至少76%、至少78%、至少80%、至少82%、至少84%、至少85%、至少86%、至少88%、至少90%、至少92%、至少94%、至少95%、至少96%、至少98%、至少99%或100%同一性的序列编码。
本领域技术人员将了解,在来自不同物种的相同蛋白质之间不保守的氨基酸的突变对蛋白质的功能具有影响的可能性较小,因此,这些氨基酸应被选择用于突变。不应使在来自不同物种的相同蛋白质之间保守的氨基酸突变,因为这些突变更可能导致蛋白质的功能变化。以下显示来自其他哺乳动物物种的硬纤毛蛋白的非限制性实例。
小鼠硬纤毛蛋白(SEQ ID NO:8)
Figure BDA0002959533770000612
Figure BDA0002959533770000621
犬硬纤毛蛋白(SEQ ID NO:9)
Figure BDA0002959533770000622
Figure BDA0002959533770000631
载体
本文提供的组合物包括至少两种(例如两种、三种、四种、五种或六种)核酸载体,其中:所述至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者的长度是至少30个氨基酸(例如在约30个氨基酸至约1600个氨基酸、约30个氨基酸至约1550个氨基酸、约30个氨基酸至约1500个氨基酸、约30个氨基酸至约1450个氨基酸、约30个氨基酸至约1400个氨基酸、约30个氨基酸至约1350个氨基酸、约30个氨基酸至约1300个氨基酸、约30个氨基酸至约1250个氨基酸、约30个氨基酸至约1200个氨基酸、约30个氨基酸至约1150个氨基酸、约30个氨基酸至约1100个氨基酸、约30个氨基酸至约1050个氨基酸、约30个氨基酸至约1000个氨基酸、约30个氨基酸至约950个氨基酸、约30个氨基酸至约900个氨基酸、约30个氨基酸至约850个氨基酸、约30个氨基酸至约800个氨基酸、约30个氨基酸至约750个氨基酸、约30个氨基酸至约700个氨基酸、约30个氨基酸至约650个氨基酸、约30个氨基酸至约600个氨基酸、约30个氨基酸至约550个氨基酸、约30个氨基酸至约500个氨基酸、约30个氨基酸至约450个氨基酸、约30个氨基酸至约400个氨基酸、约30个氨基酸至约350个氨基酸、约30个氨基酸至约300个氨基酸、约30个氨基酸至约250个氨基酸、约30个氨基酸至约200个氨基酸、约30个氨基酸至约150个氨基酸、约30个氨基酸至约100个氨基酸、约30个氨基酸至约50个氨基酸、约50个氨基酸至约1600个氨基酸、约50个氨基酸至约1550个氨基酸、约50个氨基酸至约1500个氨基酸、约50个氨基酸至约1450个氨基酸、约50个氨基酸至约1400个氨基酸、约50个氨基酸至约1350个氨基酸、约50个氨基酸至约1300个氨基酸、约50个氨基酸至约1250个氨基酸、约50个氨基酸至约1200个氨基酸、约50个氨基酸至约1150个氨基酸、约50个氨基酸至约1100个氨基酸、约50个氨基酸至约1050个氨基酸、约50个氨基酸至约1000个氨基酸、约50个氨基酸至约950个氨基酸、约50个氨基酸至约900个氨基酸、约50个氨基酸至约850个氨基酸、约50个氨基酸至约800个氨基酸、约50个氨基酸至约750个氨基酸、约50个氨基酸至约700个氨基酸、约50个氨基酸至约650个氨基酸、约50个氨基酸至约600个氨基酸、约50个氨基酸至约550个氨基酸、约50个氨基酸至约500个氨基酸、约50个氨基酸至约450个氨基酸、约50个氨基酸至约400个氨基酸、约50个氨基酸至约350个氨基酸、约50个氨基酸至约300个氨基酸、约50个氨基酸至约250个氨基酸、约50个氨基酸至约200个氨基酸、约50个氨基酸至约150个氨基酸、约50个氨基酸至约100个氨基酸、约100个氨基酸至约1600个氨基酸、约100个氨基酸至约1550个氨基酸、约100个氨基酸至约1500个氨基酸、约100个氨基酸至约1450个氨基酸、约100个氨基酸至约1400个氨基酸、约100个氨基酸至约1350个氨基酸、约100个氨基酸至约1300个氨基酸、约100个氨基酸至约1250个氨基酸、约100个氨基酸至约1200个氨基酸、约100个氨基酸至约1150个氨基酸、约100个氨基酸至约1100个氨基酸、约100个氨基酸至约1050个氨基酸、约100个氨基酸至约1000个氨基酸、约100个氨基酸至约950个氨基酸、约100个氨基酸至约900个氨基酸、约100个氨基酸至约850个氨基酸、约100个氨基酸至约800个氨基酸、约100个氨基酸至约750个氨基酸、约100个氨基酸至约700个氨基酸、约100个氨基酸至约650个氨基酸、约100个氨基酸至约600个氨基酸、约100个氨基酸至约550个氨基酸、约100个氨基酸至约500个氨基酸、约100个氨基酸至约450个氨基酸、约100个氨基酸至约400个氨基酸、约100个氨基酸至约350个氨基酸、约100个氨基酸至约300个氨基酸、约100个氨基酸至约250个氨基酸、约100个氨基酸至约200个氨基酸、约100个氨基酸至约150个氨基酸、约150个氨基酸至约1600个氨基酸、约150个氨基酸至约1550个氨基酸、约150个氨基酸至约1500个氨基酸、约150个氨基酸至约1450个氨基酸、约150个氨基酸至约1400个氨基酸、约150个氨基酸至约1350个氨基酸、约150个氨基酸至约1300个氨基酸、约150个氨基酸至约1250个氨基酸、约150个氨基酸至约1200个氨基酸、约150个氨基酸至约1150个氨基酸、约150个氨基酸至约1100个氨基酸、约150个氨基酸至约1050个氨基酸、约150个氨基酸至约1000个氨基酸、约150个氨基酸至约950个氨基酸、约150个氨基酸至约900个氨基酸、约150个氨基酸至约850个氨基酸、约150个氨基酸至约800个氨基酸、约150个氨基酸至约750个氨基酸、约150个氨基酸至约700个氨基酸、约150个氨基酸至约650个氨基酸、约150个氨基酸至约600个氨基酸、约150个氨基酸至约550个氨基酸、约150个氨基酸至约500个氨基酸、约150个氨基酸至约450个氨基酸、约150个氨基酸至约400个氨基酸、约150个氨基酸至约350个氨基酸、约150个氨基酸至约300个氨基酸、约150个氨基酸至约250个氨基酸、约150个氨基酸至约200个氨基酸、约200个氨基酸至约1600个氨基酸、约200个氨基酸至约1550个氨基酸、约200个氨基酸至约1500个氨基酸、约200个氨基酸至约1450个氨基酸、约200个氨基酸至约1400个氨基酸、约200个氨基酸至约1350个氨基酸、约200个氨基酸至约1300个氨基酸、约200个氨基酸至约1250个氨基酸、约200个氨基酸至约1200个氨基酸、约200个氨基酸至约1150个氨基酸、约200个氨基酸至约1100个氨基酸、约200个氨基酸至约1050个氨基酸、约200个氨基酸至约1000个氨基酸、约200个氨基酸至约950个氨基酸、约200个氨基酸至约900个氨基酸、约200个氨基酸至约850个氨基酸、约200个氨基酸至约800个氨基酸、约200个氨基酸至约750个氨基酸、约200个氨基酸至约700个氨基酸、约200个氨基酸至约650个氨基酸、约200个氨基酸至约600个氨基酸、约200个氨基酸至约550个氨基酸、约200个氨基酸至约500个氨基酸、约200个氨基酸至约450个氨基酸、约200个氨基酸至约400个氨基酸、约200个氨基酸至约350个氨基酸、约200个氨基酸至约300个氨基酸、约200个氨基酸至约250个氨基酸、约250个氨基酸至约1600个氨基酸、约250个氨基酸至约1550个氨基酸、约250个氨基酸至约1500个氨基酸、约250个氨基酸至约1450个氨基酸、约250个氨基酸至约1400个氨基酸、约250个氨基酸至约1350个氨基酸、约250个氨基酸至约1300个氨基酸、约250个氨基酸至约1250个氨基酸、约250个氨基酸至约1200个氨基酸、约250个氨基酸至约1150个氨基酸、约250个氨基酸至约1100个氨基酸、约250个氨基酸至约1050个氨基酸、约250个氨基酸至约1000个氨基酸、约250个氨基酸至约950个氨基酸、约250个氨基酸至约900个氨基酸、约250个氨基酸至约850个氨基酸、约250个氨基酸至约800个氨基酸、约250个氨基酸至约750个氨基酸、约250个氨基酸至约700个氨基酸、约250个氨基酸至约650个氨基酸、约250个氨基酸至约600个氨基酸、约250个氨基酸至约550个氨基酸、约250个氨基酸至约500个氨基酸、约250个氨基酸至约450个氨基酸、约250个氨基酸至约400个氨基酸、约250个氨基酸至约350个氨基酸、约250个氨基酸至约300个氨基酸、约300个氨基酸至约1600个氨基酸、约300个氨基酸至约1550个氨基酸、约300个氨基酸至约1500个氨基酸、约300个氨基酸至约1450个氨基酸、约300个氨基酸至约1400个氨基酸、约300个氨基酸至约1350个氨基酸、约300个氨基酸至约1300个氨基酸、约300个氨基酸至约1250个氨基酸、约300个氨基酸至约1200个氨基酸、约300个氨基酸至约1150个氨基酸、约300个氨基酸至约1100个氨基酸、约300个氨基酸至约1050个氨基酸、约300个氨基酸至约1000个氨基酸、约300个氨基酸至约950个氨基酸、约300个氨基酸至约900个氨基酸、约300个氨基酸至约850个氨基酸、约300个氨基酸至约800个氨基酸、约300个氨基酸至约750个氨基酸、约300个氨基酸至约700个氨基酸、约300个氨基酸至约650个氨基酸、约300个氨基酸至约600个氨基酸、约300个氨基酸至约550个氨基酸、约300个氨基酸至约500个氨基酸、约300个氨基酸至约450个氨基酸、约300个氨基酸至约400个氨基酸、约300个氨基酸至约350个氨基酸、约350个氨基酸至约1600个氨基酸、约350个氨基酸至约1550个氨基酸、约350个氨基酸至约1500个氨基酸、约350个氨基酸至约1450个氨基酸、约350个氨基酸至约1400个氨基酸、约350个氨基酸至约1350个氨基酸、约350个氨基酸至约1300个氨基酸、约350个氨基酸至约1250个氨基酸、约350个氨基酸至约1200个氨基酸、约350个氨基酸至约1150个氨基酸、约350个氨基酸至约1100个氨基酸、约350个氨基酸至约1050个氨基酸、约350个氨基酸至约1000个氨基酸、约350个氨基酸至约950个氨基酸、约350个氨基酸至约900个氨基酸、约350个氨基酸至约850个氨基酸、约350个氨基酸至约800个氨基酸、约350个氨基酸至约750个氨基酸、约350个氨基酸至约700个氨基酸、约350个氨基酸至约650个氨基酸、约350个氨基酸至约600个氨基酸、约350个氨基酸至约550个氨基酸、约350个氨基酸至约500个氨基酸、约350个氨基酸至约450个氨基酸、约350个氨基酸至约400个氨基酸、约400个氨基酸至约1600个氨基酸、约400个氨基酸至约1550个氨基酸、约400个氨基酸至约1500个氨基酸、约400个氨基酸至约1450个氨基酸、约400个氨基酸至约1400个氨基酸、约400个氨基酸至约1350个氨基酸、约400个氨基酸至约1300个氨基酸、约400个氨基酸至约1250个氨基酸、约400个氨基酸至约1200个氨基酸、约400个氨基酸至约1150个氨基酸、约400个氨基酸至约1100个氨基酸、约400个氨基酸至约1050个氨基酸、约400个氨基酸至约1000个氨基酸、约400个氨基酸至约950个氨基酸、约400个氨基酸至约900个氨基酸、约400个氨基酸至约850个氨基酸、约400个氨基酸至约800个氨基酸、约400个氨基酸至约750个氨基酸、约400个氨基酸至约700个氨基酸、约400个氨基酸至约650个氨基酸、约400个氨基酸至约600个氨基酸、约400个氨基酸至约550个氨基酸、约400个氨基酸至约500个氨基酸、约400个氨基酸至约450个氨基酸、约450个氨基酸至约1600个氨基酸、约450个氨基酸至约1550个氨基酸、约450个氨基酸至约1500个氨基酸、约450个氨基酸至约1450个氨基酸、约450个氨基酸至约1400个氨基酸、约450个氨基酸至约1350个氨基酸、约450个氨基酸至约1300个氨基酸、约450个氨基酸至约1250个氨基酸、约450个氨基酸至约1200个氨基酸、约450个氨基酸至约1150个氨基酸、约450个氨基酸至约1100个氨基酸、约450个氨基酸至约1050个氨基酸、约450个氨基酸至约1000个氨基酸、约450个氨基酸至约950个氨基酸、约450个氨基酸至约900个氨基酸、约450个氨基酸至约850个氨基酸、约450个氨基酸至约800个氨基酸、约450个氨基酸至约750个氨基酸、约450个氨基酸至约700个氨基酸、约450个氨基酸至约650个氨基酸、约450个氨基酸至约600个氨基酸、约450个氨基酸至约550个氨基酸、约450个氨基酸至约500个氨基酸、约500个氨基酸至约1600个氨基酸、约500个氨基酸至约1550个氨基酸、约500个氨基酸至约1500个氨基酸、约500个氨基酸至约1450个氨基酸、约500个氨基酸至约1400个氨基酸、约500个氨基酸至约1350个氨基酸、约500个氨基酸至约1300个氨基酸、约500个氨基酸至约1250个氨基酸、约500个氨基酸至约1200个氨基酸、约500个氨基酸至约1150个氨基酸、约500个氨基酸至约1100个氨基酸、约500个氨基酸至约1050个氨基酸、约500个氨基酸至约1000个氨基酸、约500个氨基酸至约950个氨基酸、约500个氨基酸至约900个氨基酸、约500个氨基酸至约850个氨基酸、约500个氨基酸至约800个氨基酸、约500个氨基酸至约750个氨基酸、约500个氨基酸至约700个氨基酸、约500个氨基酸至约650个氨基酸、约500个氨基酸至约600个氨基酸、约500个氨基酸至约550个氨基酸、约550个氨基酸至约1600个氨基酸、约550个氨基酸至约1550个氨基酸、约550个氨基酸至约1500个氨基酸、约550个氨基酸至约1450个氨基酸、约550个氨基酸至约1400个氨基酸、约550个氨基酸至约1350个氨基酸、约550个氨基酸至约1300个氨基酸、约550个氨基酸至约1250个氨基酸、约550个氨基酸至约1200个氨基酸、约550个氨基酸至约1150个氨基酸、约550个氨基酸至约1100个氨基酸、约550个氨基酸至约1050个氨基酸、约550个氨基酸至约1000个氨基酸、约550个氨基酸至约950个氨基酸、约550个氨基酸至约900个氨基酸、约550个氨基酸至约850个氨基酸、约550个氨基酸至约800个氨基酸、约550个氨基酸至约750个氨基酸、约550个氨基酸至约700个氨基酸、约550个氨基酸至约650个氨基酸、约550个氨基酸至约600个氨基酸、约600个氨基酸至约1600个氨基酸、约600个氨基酸至约1550个氨基酸、约600个氨基酸至约1500个氨基酸、约600个氨基酸至约1450个氨基酸、约600个氨基酸至约1400个氨基酸、约600个氨基酸至约1350个氨基酸、约600个氨基酸至约1300个氨基酸、约600个氨基酸至约1250个氨基酸、约600个氨基酸至约1200个氨基酸、约600个氨基酸至约1150个氨基酸、约600个氨基酸至约1100个氨基酸、约600个氨基酸至约1050个氨基酸、约600个氨基酸至约1000个氨基酸、约600个氨基酸至约950个氨基酸、约600个氨基酸至约900个氨基酸、约600个氨基酸至约850个氨基酸、约600个氨基酸至约800个氨基酸、约600个氨基酸至约750个氨基酸、约600个氨基酸至约700个氨基酸、约600个氨基酸至约650个氨基酸、约650个氨基酸至约1600个氨基酸、约650个氨基酸至约1550个氨基酸、约650个氨基酸至约1500个氨基酸、约650个氨基酸至约1450个氨基酸、约650个氨基酸至约1400个氨基酸、约650个氨基酸至约1350个氨基酸、约650个氨基酸至约1300个氨基酸、约650个氨基酸至约1250个氨基酸、约650个氨基酸至约1200个氨基酸、约650个氨基酸至约1150个氨基酸、约650个氨基酸至约1100个氨基酸、约650个氨基酸至约1050个氨基酸、约650个氨基酸至约1000个氨基酸、约650个氨基酸至约950个氨基酸、约650个氨基酸至约900个氨基酸、约650个氨基酸至约850个氨基酸、约650个氨基酸至约800个氨基酸、约650个氨基酸至约750个氨基酸、约650个氨基酸至约700个氨基酸、约700个氨基酸至约1600个氨基酸、约700个氨基酸至约1550个氨基酸、约700个氨基酸至约1500个氨基酸、约700个氨基酸至约1450个氨基酸、约700个氨基酸至约1400个氨基酸、约700个氨基酸至约1350个氨基酸、约700个氨基酸至约1300个氨基酸、约700个氨基酸至约1250个氨基酸、约700个氨基酸至约1200个氨基酸、约700个氨基酸至约1150个氨基酸、约700个氨基酸至约1100个氨基酸、约700个氨基酸至约1050个氨基酸、约700个氨基酸至约1000个氨基酸、约700个氨基酸至约950个氨基酸、约700个氨基酸至约900个氨基酸、约700个氨基酸至约850个氨基酸、约700个氨基酸至约800个氨基酸、约700个氨基酸至约750个氨基酸、约750个氨基酸至约1600个氨基酸、约750个氨基酸至约1550个氨基酸、约750个氨基酸至约1500个氨基酸、约750个氨基酸至约1450个氨基酸、约750个氨基酸至约1400个氨基酸、约750个氨基酸至约1350个氨基酸、约750个氨基酸至约1250个氨基酸、约750个氨基酸至约1200个氨基酸、约750个氨基酸至约1150个氨基酸、约750个氨基酸至约1100个氨基酸、约750个氨基酸至约1050个氨基酸、约750个氨基酸至约1000个氨基酸、约750个氨基酸至约950个氨基酸、约750个氨基酸至约900个氨基酸、约750个氨基酸至约850个氨基酸、约750个氨基酸至约800个氨基酸、约800个氨基酸至约1600个氨基酸、约800个氨基酸至约1550个氨基酸、约800个氨基酸至约1500个氨基酸、约800个氨基酸至约1450个氨基酸、约800个氨基酸至约1400个氨基酸、约800个氨基酸至约1350个氨基酸、约800个氨基酸至约1300个氨基酸、约800个氨基酸至约1250个氨基酸、约800个氨基酸至约1200个氨基酸、约800个氨基酸至约1150个氨基酸、约800个氨基酸至约1100个氨基酸、约800个氨基酸至约1050个氨基酸、约800个氨基酸至约1000个氨基酸、约800个氨基酸至约950个氨基酸、约800个氨基酸至约900个氨基酸、约800个氨基酸至约850个氨基酸、约850个氨基酸至约1600个氨基酸、约850个氨基酸至约1550个氨基酸、约850个氨基酸至约1500个氨基酸、约850个氨基酸至约1450个氨基酸、约850个氨基酸至约1400个氨基酸、约850个氨基酸至约1350个氨基酸、约850个氨基酸至约1300个氨基酸、约850个氨基酸至约1250个氨基酸、约850个氨基酸至约1200个氨基酸、约850个氨基酸至约1150个氨基酸、约850个氨基酸至约1100个氨基酸、约850个氨基酸至约1050个氨基酸、约850个氨基酸至约1000个氨基酸、约850个氨基酸至约950个氨基酸、约850个氨基酸至约900个氨基酸、约900个氨基酸至约1600个氨基酸、约900个氨基酸至约1550个氨基酸、约900个氨基酸至约1500个氨基酸、约900个氨基酸至约1450个氨基酸、约900个氨基酸至约1400个氨基酸、约900个氨基酸至约1350个氨基酸、约900个氨基酸至约1300个氨基酸、约900个氨基酸至约1250个氨基酸、约900个氨基酸至约1200个氨基酸、约900个氨基酸至约1150个氨基酸、约900个氨基酸至约1100个氨基酸、约900个氨基酸至约1050个氨基酸、约900个氨基酸至约1000个氨基酸、约900个氨基酸至约950个氨基酸、约950个氨基酸至约1600个氨基酸、约950个氨基酸至约1550个氨基酸、约950个氨基酸至约1500个氨基酸、约950个氨基酸至约1450个氨基酸、约950个氨基酸至约1400个氨基酸、约950个氨基酸至约1350个氨基酸、约950个氨基酸至约1300个氨基酸、约950个氨基酸至约1250个氨基酸、约950个氨基酸至约1200个氨基酸、约950个氨基酸至约1150个氨基酸、约950个氨基酸至约1100个氨基酸、约950个氨基酸至约1050个氨基酸、约950个氨基酸至约1000个氨基酸、约1000个氨基酸至约1600个氨基酸、约1000个氨基酸至约1550个氨基酸、约1000个氨基酸至约1500个氨基酸、约1000个氨基酸至约1450个氨基酸、约1000个氨基酸至约1400个氨基酸、约1000个氨基酸至约1350个氨基酸、约1000个氨基酸至约1300个氨基酸、约1000个氨基酸至约1250个氨基酸、约1000个氨基酸至约1200个氨基酸、约1000个氨基酸至约1150个氨基酸、约1000个氨基酸至约1100个氨基酸、约1000个氨基酸至约1050个氨基酸、约1050个氨基酸至约1600个氨基酸、约1050个氨基酸至约1550个氨基酸、约1050个氨基酸至约1500个氨基酸、约1050个氨基酸至约1450个氨基酸、约1050个氨基酸至约1400个氨基酸、约1050个氨基酸至约1350个氨基酸、约1050个氨基酸至约1300个氨基酸、约1050个氨基酸至约1250个氨基酸、约1050个氨基酸至约1200个氨基酸、约1050个氨基酸至约1150个氨基酸、约1050个氨基酸至约1100个氨基酸、约1100个氨基酸至约1600个氨基酸、约1100个氨基酸至约1550个氨基酸、约1100个氨基酸至约1500个氨基酸、约1100个氨基酸至约1450个氨基酸、约1100个氨基酸至约1400个氨基酸、约1100个氨基酸至约1350个氨基酸、约1100个氨基酸至约1300个氨基酸、约1100个氨基酸至约1250个氨基酸、约1100个氨基酸至约1200个氨基酸、约1100个氨基酸至约1150个氨基酸、约1150个氨基酸至约1600个氨基酸、约1150个氨基酸至约1550个氨基酸、约1150个氨基酸至约1500个氨基酸、约1150个氨基酸至约1450个氨基酸、约1150个氨基酸至约1400个氨基酸、约1150个氨基酸至约1350个氨基酸、约1150个氨基酸至约1300个氨基酸、约1150个氨基酸至约1250个氨基酸、约1150个氨基酸至约1200个氨基酸、约1200个氨基酸至约1600个氨基酸、约1200个氨基酸至约1550个氨基酸、约1200个氨基酸至约1500个氨基酸、约1200个氨基酸至约1450个氨基酸、约1200个氨基酸至约1400个氨基酸、约1200个氨基酸至约1350个氨基酸、约1200个氨基酸至约1300个氨基酸、约1200个氨基酸至约1250个氨基酸、约1250个氨基酸至约1600个氨基酸、约1250个氨基酸至约1550个氨基酸、约1250个氨基酸至约1500个氨基酸、约1250个氨基酸至约1450个氨基酸、约1250个氨基酸至约1400个氨基酸、约1250个氨基酸至约1350个氨基酸、约1250个氨基酸至约1300个氨基酸、约1300个氨基酸至约1600个氨基酸、约1300个氨基酸至约1550个氨基酸、约1300个氨基酸至约1500个氨基酸、约1300个氨基酸至约1450个氨基酸、约1300个氨基酸至约1400个氨基酸、约1300个氨基酸至约1350个氨基酸、约1350个氨基酸至约1600个氨基酸、约1350个氨基酸至约1550个氨基酸、约1350个氨基酸至约1500个氨基酸、约1350个氨基酸至约1450个氨基酸、约1350个氨基酸至约1400个氨基酸、约1400个氨基酸至约1600个氨基酸、约1400个氨基酸至约1550个氨基酸、约1400个氨基酸至约1500个氨基酸、约1400个氨基酸至约1450个氨基酸、约1450个氨基酸至约1600个氨基酸、约1450个氨基酸至约1550个氨基酸、约1450个氨基酸至约1500个氨基酸、约1500个氨基酸至约1600个氨基酸、约1500个氨基酸至约1550个氨基酸、或约1550个氨基酸至约1600个氨基酸之间),其中所编码部分中的每一者的氨基酸序列可任选地与所编码部分中的不同者的氨基酸序列部分重叠;所述至少两种不同载体中没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白(例如全长野生型硬纤毛蛋白));并且,当引入含有染色体DNA的哺乳动物细胞中时,所述至少两种不同载体经受彼此以及与所述细胞的所述染色体DNA的同源性重组,由此形成***所述染色体DNA中的重组核酸,其中所述重组核酸编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。在一些实施方案中,核酸载体中的一者可包括编码硬纤毛蛋白的一部分的编码序列,其中所编码部分的长度是例如约900个氨基酸至约1600个氨基酸、约900个氨基酸至约1550个氨基酸、约900个氨基酸至约1500个氨基酸、约900个氨基酸至约1450个氨基酸、约900个氨基酸至约1400个氨基酸、约900个氨基酸至约1350个氨基酸、约900个氨基酸至约1300个氨基酸、约900个氨基酸至约1250个氨基酸、约900个氨基酸至约1200个氨基酸、约900个氨基酸至约1150个氨基酸、约900个氨基酸至约1100个氨基酸、约900个氨基酸至约1050个氨基酸、约900个氨基酸至约1000个氨基酸、约900个氨基酸至约950个氨基酸、约950个氨基酸至约1600个氨基酸、约950个氨基酸至约1550个氨基酸、约950个氨基酸至约1500个氨基酸、约950个氨基酸至约1450个氨基酸、约950个氨基酸至约1400个氨基酸、约950个氨基酸至约1350个氨基酸、约950个氨基酸至约1300个氨基酸、约950个氨基酸至约1250个氨基酸、约950个氨基酸至约1200个氨基酸、约950个氨基酸至约1150个氨基酸、约950个氨基酸至约1100个氨基酸、约950个氨基酸至约1050个氨基酸、约950个氨基酸至约1000个氨基酸、约1000个氨基酸至约1600个氨基酸、约1000个氨基酸至约1550个氨基酸、约1000个氨基酸至约1500个氨基酸、约1000个氨基酸至约1450个氨基酸、约1000个氨基酸至约1400个氨基酸、约1000个氨基酸至约1350个氨基酸、约1000个氨基酸至约1300个氨基酸、约1000个氨基酸至约1250个氨基酸、约1000个氨基酸至约1200个氨基酸、约1000个氨基酸至约1150个氨基酸、约1000个氨基酸至约1100个氨基酸、约1000个氨基酸至约1050个氨基酸、约1050个氨基酸至约1600个氨基酸、约1050个氨基酸至约1550个氨基酸、约1050个氨基酸至约1500个氨基酸、约1050个氨基酸至约1450个氨基酸、约1050个氨基酸至约1400个氨基酸、约1050个氨基酸至约1350个氨基酸、约1050个氨基酸至约1300个氨基酸、约1050个氨基酸至约1250个氨基酸、约1050个氨基酸至约1200个氨基酸、约1050个氨基酸至约1150个氨基酸、约1050个氨基酸至约1100个氨基酸、约1100个氨基酸至约1600个氨基酸、约1100个氨基酸至约1550个氨基酸、约1100个氨基酸至约1500个氨基酸、约1100个氨基酸至约1450个氨基酸、约1100个氨基酸至约1400个氨基酸、约1100个氨基酸至约1350个氨基酸、约1100个氨基酸至约1300个氨基酸、约1100个氨基酸至约1250个氨基酸、约1100个氨基酸至约1200个氨基酸、约1100个氨基酸至约1150个氨基酸、约1150个氨基酸至约1600个氨基酸、约1150个氨基酸至约1550个氨基酸、约1150个氨基酸至约1500个氨基酸、约1150个氨基酸至约1450个氨基酸、约1150个氨基酸至约1400个氨基酸、约1150个氨基酸至约1350个氨基酸、约1150个氨基酸至约1300个氨基酸、约1150个氨基酸至约1250个氨基酸、约1150个氨基酸至约1200个氨基酸、约1200个氨基酸至约1600个氨基酸、约1200个氨基酸至约1550个氨基酸、约1200个氨基酸至约1500个氨基酸、约1200个氨基酸至约1450个氨基酸、约1200个氨基酸至约1400个氨基酸、约1200个氨基酸至约1350个氨基酸、约1200个氨基酸至约1300个氨基酸、约1200个氨基酸至约1250个氨基酸、约1250个氨基酸至约1600个氨基酸、约1250个氨基酸至约1550个氨基酸、约1250个氨基酸至约1500个氨基酸、约1250个氨基酸至约1450个氨基酸、约1250个氨基酸至约1400个氨基酸、约1250个氨基酸至约1350个氨基酸、约1250个氨基酸至约1300个氨基酸、约1300个氨基酸至约1600个氨基酸、约1300个氨基酸至约1550个氨基酸、约1300个氨基酸至约1500个氨基酸、约1300个氨基酸至约1450个氨基酸、约1300个氨基酸至约1400个氨基酸、约1300个氨基酸至约1350个氨基酸、约1350个氨基酸至约1600个氨基酸、约1350个氨基酸至约1550个氨基酸、约1350个氨基酸至约1500个氨基酸、约1350个氨基酸至约1450个氨基酸、约1350个氨基酸至约1400个氨基酸、约1400个氨基酸至约1600个氨基酸、约1400个氨基酸至约1550个氨基酸、约1400个氨基酸至约1500个氨基酸、约1400个氨基酸至约1450个氨基酸、约1450个氨基酸至约1600个氨基酸、约1450个氨基酸至约1550个氨基酸、约1450个氨基酸至约1500个氨基酸、约1500个氨基酸至约1600个氨基酸、约1500个氨基酸至约1550个氨基酸、或约1550个氨基酸至约1600个氨基酸。
在这些组合物的一些实施方案中,编码序列中的至少一者包括跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏天然存在于所述两个连续外显子之间的内含子序列。
在一些实施方案中,所编码部分中没有一者的氨基酸序列与所编码部分中的不同者的氨基酸序列即使部分地重叠。在一些实施方案中,所编码部分中的一者或多者的氨基酸序列与所编码部分中的不同者的氨基酸序列部分重叠。在一些实施方案中,所编码部分中的每一者的氨基酸序列与所编码部分中的不同者的氨基酸序列部分重叠。
在一些实施方案中,重叠氨基酸序列的长度在约30个氨基酸残基至约1000个氨基酸之间(例如或本文所述的这个范围的任何子范围)。
在一些实例中,载体包括两种不同载体,其中每一者包含内含子的不同区段,其中所述内含子包括存在于硬纤毛蛋白基因组DNA中的内含子(例如本文所述的SEQ ID NO:4中的任何示例性内含子)的核苷酸序列,并且其中两个不同区段在序列方面就长度而言重叠至少100个核苷酸(例如约100个核苷酸至约5,000个核苷酸、约100个核苷酸至约4,500个核苷酸、约100个核苷酸至约4,000个核苷酸、约100个核苷酸至约3,500个核苷酸、约100个核苷酸至约3,000个核苷酸、约100个核苷酸至约2,500个核苷酸、约100个核苷酸至约2,000个核苷酸、约100个核苷酸至约1,500个核苷酸、约100个核苷酸至约1,000个核苷酸、约100个核苷酸至约800个核苷酸、约100个核苷酸至约600个核苷酸、约100个核苷酸至约400个核苷酸、约100个核苷酸至约200个核苷酸、约200个核苷酸至约5,000个核苷酸、约200个核苷酸至约4,500个核苷酸、约200个核苷酸至约4,000个核苷酸、约200个核苷酸至约3,500个核苷酸、约200个核苷酸至约3,000个核苷酸、约200个核苷酸至约2,500个核苷酸、约200个核苷酸至约2,000个核苷酸、约200个核苷酸至约1,500个核苷酸、约200个核苷酸至约1,000个核苷酸、约200个核苷酸至约800个核苷酸、约200个核苷酸至约600个核苷酸、约200个核苷酸至约400个核苷酸、约400个核苷酸至约5,000个核苷酸、约400个核苷酸至约4,500个核苷酸、约400个核苷酸至约4,000个核苷酸、约400个核苷酸至约3,500个核苷酸、约400个核苷酸至约3,000个核苷酸、约400个核苷酸至约2,500个核苷酸、约400个核苷酸至约2,000个核苷酸、约400个核苷酸至约1,500个核苷酸、约400个核苷酸至约1,000个核苷酸、约400个核苷酸至约800个核苷酸、约400个核苷酸至约600个核苷酸、约600个核苷酸至约5,000个核苷酸、约600个核苷酸至约4,500个核苷酸、约600个核苷酸至约4,000个核苷酸、约600个核苷酸至约3,500个核苷酸、约600个核苷酸至约3,000个核苷酸、约600个核苷酸至约2,500个核苷酸、约600个核苷酸至约2,000个核苷酸、约600个核苷酸至约1,500个核苷酸、约600个核苷酸至约1,000个核苷酸、约600个核苷酸至约800个核苷酸、约800个核苷酸至约5,000个核苷酸、约800个核苷酸至约4,500个核苷酸、约800个核苷酸至约4,000个核苷酸、约800个核苷酸至约3,500个核苷酸、约800个核苷酸至约3,000个核苷酸、约800个核苷酸至约2,500个核苷酸、约800个核苷酸至约2,000个核苷酸、约800个核苷酸至约1,500个核苷酸、约800个核苷酸至约1,000个核苷酸、约1,000个核苷酸至约5,000个核苷酸、约1,000个核苷酸至约4,500个核苷酸、约1,000个核苷酸至约4,000个核苷酸、约1,000个核苷酸至约3,500个核苷酸、约1,000个核苷酸至约3,000个核苷酸、约1,000个核苷酸至约2,500个核苷酸、约1,000个核苷酸至约2,000个核苷酸、约1,000个核苷酸至约1,500个核苷酸、约1,500个核苷酸至约5,000个核苷酸、约1,500个核苷酸至约4,500个核苷酸、约1,500个核苷酸至约4,000个核苷酸、约1,500个核苷酸至约3,500个核苷酸、约1,500个核苷酸至约3,000个核苷酸、约1,500个核苷酸至约2,500个核苷酸、约1,500个核苷酸至约2,000个核苷酸、约2,000个核苷酸至约5,000个核苷酸、约2,000个核苷酸至约4,500个核苷酸、约2,000个核苷酸至约4,000个核苷酸、约2,000个核苷酸至约3,500个核苷酸、约2,000个核苷酸至约3,000个核苷酸、约2,000个核苷酸至约2,500个核苷酸、约2,500个核苷酸至约5,000个核苷酸、约2,500个核苷酸至约4,500个核苷酸、约2,500个核苷酸至约4,000个核苷酸、约2,500个核苷酸至约3,500个核苷酸、约2,500个核苷酸至约3,000个核苷酸、约3,000个核苷酸至约5,000个核苷酸、约3,000个核苷酸至约4,500个核苷酸、约3,000个核苷酸至约4,000个核苷酸、约3,000个核苷酸至约3,500个核苷酸、约3,500个核苷酸至约5,000个核苷酸、约3,500个核苷酸至约4,500个核苷酸、约3,500个核苷酸至约4,000个核苷酸、约4,000个核苷酸至约5,000个核苷酸、约4,000个核苷酸至约4,500个核苷酸、约4,500个核苷酸至约5,000个核苷酸)。
不同载体中的任何两者中的重叠核苷酸序列可包括硬纤毛蛋白基因的一个或多个外显子(例如本文所述的SEQ ID NO:4中的示例性外显子中的任何一者或多者)的一部分或全部。
在一些实施方案中,组合物中不同载体的种数是两种、三种、四种或五种。在其中组合物中不同载体的种数是两种的组合物中,两种不同载体中的第一载体可包括编码硬纤毛蛋白的N末端部分的编码序列。在一些实例中,硬纤毛蛋白基因的N末端部分的长度在约30个氨基酸至约1780个氨基酸之间(或以上所述的这个范围的任何子范围)。在一些实例中,第一载体还包括启动子(例如本文所述或本领域中已知的任何启动子)和Kozak序列(例如本文所述或本领域中已知的任何示例性Kozak序列)中的一者或两者。在一些实例中,第一载体包括是诱导型启动子、组成型启动子、或组织特异性启动子的启动子。在一些实例中,两种不同载体中的第二者包括编码硬纤毛蛋白的C末端部分的编码序列。在一些实例中,硬纤毛蛋白的C末端部分的长度在30个氨基酸至约1780个氨基酸之间(或以上所述的这个范围的任何子范围)。在一些实例中,第二载体还包括多聚(A)序列。
在其中组合物中不同载体的种数是两种的一些实例中,由两种载体中的一者编码的N末端部分可包括包含野生型硬纤毛蛋白(例如SEQ ID NO:1)的氨基酸位置1至约氨基酸位置1,500、约氨基酸位置1,490、约氨基酸位置1,480、约氨基酸位置1,470、约氨基酸位置1,460、约氨基酸位置1,450、约氨基酸位置1,440、约氨基酸位置1,430、约氨基酸位置1,420、约氨基酸位置1,410、约氨基酸位置1,400、约氨基酸位置1,390、约氨基酸位置1,380、约氨基酸位置1,370、约氨基酸位置1,360、约氨基酸位置1,350、约氨基酸位置1,340、约氨基酸位置1,330、约氨基酸位置1,320、约氨基酸位置1,310、约氨基酸位置1,300、约氨基酸位置1,290、约氨基酸位置1,280、约氨基酸位置1,270、约氨基酸位置1,260、约氨基酸位置1,250、约氨基酸位置1,240、约氨基酸位置1,230、约氨基酸位置1,220、约氨基酸位置1,210、约氨基酸位置1,200、约氨基酸位置1,190、约氨基酸位置1,180、约氨基酸位置1,170、约氨基酸位置1,160、约氨基酸位置1,150、约氨基酸位置1,140、约氨基酸位置1,130、约氨基酸位置1,120、约氨基酸位置1,110、约氨基酸位置1,100、约氨基酸位置1,090、约氨基酸位置1,080、约氨基酸位置1,070、约氨基酸位置1,060、约氨基酸位置1,050、约氨基酸位置1,040、约氨基酸位置1,030、约氨基酸位置1,020、约氨基酸位置1,010、约氨基酸位置1,000、约氨基酸位置990、约氨基酸位置980、约氨基酸位置970、约氨基酸位置960、约氨基酸位置950、约氨基酸位置940、约氨基酸位置930、约氨基酸位置920、约氨基酸位置910、约氨基酸位置900、约氨基酸位置890、约氨基酸位置880、约氨基酸位置870、约氨基酸位置860、约氨基酸位置850、约氨基酸位置840、约氨基酸位置830、约氨基酸位置820、约氨基酸位置810、约氨基酸位置800、约氨基酸位置790、约氨基酸位置780、约氨基酸位置770、约氨基酸位置760、约氨基酸位置750、约氨基酸位置740、约氨基酸位置730、约氨基酸位置720、约氨基酸位置710、约氨基酸位置700、约氨基酸位置690、约氨基酸位置680、约氨基酸位置670、约氨基酸位置660、约氨基酸位置650、约氨基酸位置640、约氨基酸位置630、约氨基酸位置620、约氨基酸位置610、约氨基酸位置600、约氨基酸位置590、约氨基酸位置580、约氨基酸位置570、约氨基酸位置560、约氨基酸位置550、约氨基酸位置540、约氨基酸位置530、约氨基酸位置520、约氨基酸位置510、约氨基酸位置500、约氨基酸位置490、约氨基酸位置480、约氨基酸位置470、约氨基酸位置460、约氨基酸位置450、约氨基酸位置440、约氨基酸位置430、约氨基酸位置420、约氨基酸位置410、约氨基酸位置400、约氨基酸位置390、约氨基酸位置380、约氨基酸位置370、约氨基酸位置360、约氨基酸位置350、约氨基酸位置340、约氨基酸位置330、约氨基酸位置320、约氨基酸位置310、约氨基酸位置300、约氨基酸位置290、约氨基酸位置280、约氨基酸位置270、约氨基酸位置260、约氨基酸位置250、约氨基酸位置240、约氨基酸位置230、约氨基酸位置220、约氨基酸位置210、约氨基酸位置200、约氨基酸位置190、约氨基酸位置180、约氨基酸位置170、约氨基酸位置160、约氨基酸位置150、约氨基酸位置140、约氨基酸位置130、约氨基酸位置120、约氨基酸位置110、约氨基酸位置100、约氨基酸位置90、约氨基酸位置80、约氨基酸位置70、约氨基酸位置60、约氨基酸位置50、或约氨基酸位置40的部分。
在其中组合物中不同载体的种数是两种的一些实例中,前体硬纤毛蛋白的N末端部分可包括包含野生型硬纤毛蛋白(例如SEQ ID NO:1)的氨基酸位置1至氨基酸位置310、氨基酸位置1至约氨基酸位置320、氨基酸位置1至约氨基酸位置330、氨基酸位置1至约氨基酸位置340、氨基酸位置1至约氨基酸位置350、氨基酸位置1至约氨基酸位置360、氨基酸位置1至约氨基酸位置370、氨基酸位置1至约氨基酸位置380、氨基酸位置1至约氨基酸位置390、氨基酸位置1至约氨基酸位置400、氨基酸位置1至约氨基酸位置410、氨基酸位置1至约氨基酸位置420、氨基酸位置1至约氨基酸位置430、氨基酸位置1至约氨基酸位置440、氨基酸位置1至约氨基酸位置450、氨基酸位置1至约氨基酸位置460、氨基酸位置1至约氨基酸位置470、氨基酸位置1至约氨基酸位置480、氨基酸位置1至约氨基酸位置490、氨基酸位置1至约氨基酸位置500、氨基酸位置1至约氨基酸位置510、氨基酸位置1至约氨基酸位置520、氨基酸位置1至约氨基酸位置530、氨基酸位置1至约氨基酸位置540、氨基酸位置1至约氨基酸位置550、氨基酸位置1至约氨基酸位置560、氨基酸位置1至约氨基酸位置570、氨基酸位置1至约氨基酸位置580、氨基酸位置1至约氨基酸位置590、氨基酸位置1至约氨基酸位置600、氨基酸位置1至约氨基酸位置610、氨基酸位置1至约氨基酸位置620、氨基酸位置1至约氨基酸位置630、氨基酸位置1至约氨基酸位置640、氨基酸位置1至约氨基酸位置650、氨基酸位置1至约氨基酸位置660、氨基酸位置1至约氨基酸位置670、氨基酸位置1至约氨基酸位置680、氨基酸位置1至约氨基酸位置690、氨基酸位置1至约氨基酸位置700、氨基酸位置1至约氨基酸位置710、氨基酸位置1至约氨基酸位置720、氨基酸位置1至约氨基酸位置730、氨基酸位置1至约氨基酸位置740、氨基酸位置1至约氨基酸位置750、氨基酸位置1至约氨基酸位置760、氨基酸位置1至约氨基酸位置770、氨基酸位置1至约氨基酸位置780、氨基酸位置1至约氨基酸位置790、氨基酸位置1至约氨基酸位置800、氨基酸位置1至约氨基酸位置810、氨基酸位置1至约氨基酸位置820、氨基酸位置1至约氨基酸位置830、氨基酸位置1至约氨基酸位置840、氨基酸位置1至约氨基酸位置850、氨基酸位置1至约氨基酸位置860、氨基酸位置1至约氨基酸位置870、氨基酸位置1至约氨基酸位置880、氨基酸位置1至约氨基酸位置890、氨基酸位置1至约氨基酸位置900、氨基酸位置1至约氨基酸位置910、氨基酸位置1至约氨基酸位置920、氨基酸位置1至约氨基酸位置930、氨基酸位置1至约氨基酸位置940、氨基酸位置1至约氨基酸位置950、氨基酸位置1至约氨基酸位置960、氨基酸位置1至约氨基酸位置970、氨基酸位置1至约氨基酸位置980、氨基酸位置1至约氨基酸位置990、氨基酸位置1至约氨基酸位置1,000、氨基酸位置1至约氨基酸位置1,010、氨基酸位置1至约氨基酸位置1,020、氨基酸位置1至约氨基酸位置1,030、氨基酸位置1至约氨基酸位置1,040、氨基酸位置1至约氨基酸位置1,050、氨基酸位置1至约氨基酸位置1,060、氨基酸位置1至约氨基酸位置1,070、氨基酸位置1至约氨基酸位置1,080、氨基酸位置1至约氨基酸位置1,090、氨基酸位置1至约氨基酸位置1,100、氨基酸位置1至约氨基酸位置1,110、氨基酸位置1至约氨基酸位置1,120、氨基酸位置1至约氨基酸位置1,130、氨基酸位置1至约氨基酸位置1,140、氨基酸位置1至约氨基酸位置1,150、氨基酸位置1至约氨基酸位置1,160、氨基酸位置1至约氨基酸位置1,170、氨基酸位置1至约氨基酸位置1,180、氨基酸位置1至约氨基酸位置1,190、氨基酸位置1至约氨基酸位置1,200、氨基酸位置1至约氨基酸位置1,210、氨基酸位置1至约氨基酸位置1,220、氨基酸位置1至约氨基酸位置1,230、氨基酸位置1至约氨基酸位置1,240、氨基酸位置1至约氨基酸位置1,250、氨基酸位置1至约氨基酸位置1,260、氨基酸位置1至约氨基酸位置1,270、氨基酸位置1至约氨基酸位置1,280、氨基酸位置1至约氨基酸位置1,290、氨基酸位置1至约氨基酸位置1,300、氨基酸位置1至约氨基酸位置1,310、氨基酸位置1至约氨基酸位置1,320、氨基酸位置1至约氨基酸位置1,330、氨基酸位置1至约氨基酸位置1,340、氨基酸位置1至约氨基酸位置1,350、氨基酸位置1至约氨基酸位置1,360、氨基酸位置1至约氨基酸位置1,370、氨基酸位置1至约氨基酸位置1,380、氨基酸位置1至约氨基酸位置1,390、氨基酸位置1至约氨基酸位置1,400、氨基酸位置1至约氨基酸位置1,410、氨基酸位置1至约氨基酸位置1,420、氨基酸位置1至约氨基酸位置1,430、氨基酸位置1至约氨基酸位置1,440、氨基酸位置1至约氨基酸位置1,450、氨基酸位置1至约氨基酸位置1,460、氨基酸位置1至约氨基酸位置1,470、氨基酸位置1至约氨基酸位置1,480、氨基酸位置1至约氨基酸位置1,490、氨基酸位置1至约氨基酸位置1,500、氨基酸位置1至约氨基酸位置1,510、氨基酸位置1至约氨基酸位置1,520、氨基酸位置1至约氨基酸位置1,530、氨基酸位置1至约氨基酸位置1,540、氨基酸位置1至约氨基酸位置1,550、氨基酸位置1至约氨基酸位置1,560、氨基酸位置1至约氨基酸位置1,570、氨基酸位置1至约氨基酸位置1,580、氨基酸位置1至约氨基酸位置1,590、或氨基酸位置1至约氨基酸位置1,600的部分。
如本文所用,术语“载体”意指包括能够携带至少一种外源性核酸片段的多核苷酸的组合物,例如质粒载体、转座子、粘粒、人工染色体(例如人类人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1源性人工染色体(PAC))或病毒载体(例如如本文所述的任何腺病毒载体(例如pSV或pCMV载体)、任何逆转录病毒载体)、以及任何
Figure BDA0002959533770000811
载体。载体可例如包括足以达成表达的顺式作用性元件;用于表达的其他元件可由宿主哺乳动物细胞或在体外表达***中提供。术语“载体”包括当与适当控制元件相关联时能够复制的任何遗传元件(例如质粒、转座子、粘粒、人工染色体或病毒载体等)。因此,所述术语包括克隆载体和表达载体以及病毒载体(例如腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体)。
载体包括本领域中已知的所有那些,包括并有重组多核苷酸的粘粒、质粒(例如裸质粒或含于脂质体中的质粒)和病毒(例如慢病毒、逆转录病毒、腺病毒和腺相关病毒)。熟练从业者将能够选择适于制备本文所述的任何核酸的载体和哺乳动物细胞。在一些实施方案中,载体是质粒(即可在细胞内部自主复制的环状DNA分子)。在一些实施方案中,载体可为粘粒(例如pWE和sCos系列(Wahl等人(1987),Evans等人(1989))。
在一些实施方案中,一种或多种载体是人工染色体。人工染色体是可作为载体用于携带大型DNA***物的经遗传工程改造染色体。在一些实施方案中,人工染色体是人类人工染色体(HAC)(参见例如Kouprina等人,Expert Opin.Drug Deliv 11(4):517-535,2014;Basu等人,Pediatr.Clin.North Am.53:843-853,2006;Ren等人,Stem.Cell Rev.2(1):43-50,2006;Kazuki等人,Mol.Ther.19(9):1591-1601,2011;Kazuki等人,Gen.Ther.18:384-393,2011;以及Katoh等人,Biochem.Biophys.Res.Commun.321:280-290,2004)。
在一些实施方案中,一种或多种载体是酵母人工染色体(YAC)(参见例如Murray等人,Nature 305:189-193,1983;Ikeno等人(1998)Nat.Biotech.16:431-439,1998)。在一些实施方案中,一种或多种载体是细菌人工染色体(BAC)(例如pBeloBAC11、pECBAC1和pBAC108L)。在一些实施方案中,一种或多种载体是P1源性人工染色体(PAC)。人工染色体的实例在本领域中是已知的。
在一些实施方案中,一种或多种载体是病毒载体(例如腺相关病毒、腺病毒、慢病毒和逆转录病毒)。病毒载体的非限制性实例在本文中加以描述。在一些实施方案中,一种或多种载体是腺相关病毒载体(AAV)(参见例如Asokan等人,Mol.Ther.20:699-7080,2012)。重组AAV载体或“rAAV”通常由至少转基因或其一部分和调控序列,以及任选的5'和3'AAV反向末端重复序列(ITR)组成。这种重组AAV载体被包装至衣壳中,并且递送至所选靶标细胞(例如外毛细胞)。
载体的AAV序列通常包含顺式作用性5'和3'ITR序列(参见例如B.J.Carter,"Handbook of Parvoviruses",P.Tijsser编,CRC Press,第155168页,1990)。典型AAV ITR序列的长度是约145个核苷酸。在一些实施方案中,典型ITR序列的至少75%(例如至少80%、至少85%、至少90%或至少95%)并入AAV载体中。修改这些ITR序列的能力属于本领域的技能。(参见例如教科书诸如Sambrook等人,"Molecular Cloning.A LaboratoryManual",第2版,Cold Spring Harbor Laboratory,New York,1989;以及K.Fisher等人,JVirol.70:520 532,1996)。在一些实施方案中,本文所述的任何编码序列在AAV载体中都由5'和3'AAV ITR序列侧接。AAV ITR序列可从包括当前鉴定的AAV类型的任何已知AAV获得。
5’AAV ITR序列的一非限制性实例是SEQ ID NO:18。3’AAV ITR序列的一非限制性实例是SEQ ID NO:36。
如本文所述的AAV载体可包括本文所述的任何调控元件(例如启动子、多聚(A)序列和IRES中的一者或多者)。
在一些实施方案中,AAV载体选自由以下组成的组:AAV1载体、AAV2载体、AAV3载体、AAV4载体、AAV5载体、AAV6载体、AAV7载体、AAV8载体、AAV9载体、AAV2.7m8载体、AAV8BP2载体和AAV293载体。可在本文中使用的额外示例性AAV载体在本领域中是已知的。参见例如Kanaan等人,Mol.Ther.Nucleic Acids 8:184-197,2017;Li等人,Mol.Ther.16(7):1252-1260;Adachi等人,Nat.Commun.5:3075,2014;Isgrig等人,Nat.Commun.10(1):427,2019;以及Gao等人,J.Virol.78(12):6381-6388。
在一些实施方案中,本文提供的AAV载体包括以下或由以下组成:与SEQ ID NO:12-17至少80%同一(例如至少82%、至少84%、至少85%、至少86%、至少88%、至少90%、至少92%、至少94%、至少95%、至少96%、至少98%、至少99%或100%同一)的序列。
pITR-201(SEQ ID NO:12)
Figure BDA0002959533770000841
Figure BDA0002959533770000851
pITR-202(SEQ ID NO:13)
Figure BDA0002959533770000852
Figure BDA0002959533770000861
Figure BDA0002959533770000871
pITR-202GFP(SEQ ID NO:14)
Figure BDA0002959533770000872
Figure BDA0002959533770000881
Figure BDA0002959533770000891
pITR-203(SEQ ID NO:15)
Figure BDA0002959533770000892
Figure BDA0002959533770000901
pITR-204(SEQ ID NO:16)
Figure BDA0002959533770000911
Figure BDA0002959533770000921
pITR-205(SEQ ID NO:17)
Figure BDA0002959533770000922
Figure BDA0002959533770000931
Figure BDA0002959533770000941
在一些实施方案中,一种或多种载体是腺病毒(参见例如Dmitriev等人(1998)J.Virol.72:9706-9713;以及Poulin等人,J.Virol 8:10074-10086,2010)。在一些实施方案中,一种或多种载体是逆转录病毒(参见例如Maier等人(2010)Future Microbiol 5:1507-23)。
在一些实施方案中,一种或多种载体是慢病毒(参见例如Matrai等人(2010)MolTher.18:477-490;Banasik等人(2010)Gene Ther.17:150-7;以及Wanisch等人(2009)Mol.Ther.17:1316-32)。慢病毒载体是指源于慢病毒基因组的至少一部分的载体,尤其包括如Milone等人,Mol.Ther.17(8):1453-1464(2009)中提供的自失活性慢病毒载体。可在临床中使用的非限制性慢病毒载体包括来自Oxford BioMedica的
Figure BDA0002959533770000942
基因递送技术、来自Lentigen的LENTIMAXTM载体***等。其他类型的慢病毒载体也是可用的,并且将为本领域技术人员所知。
本文提供的载体可具有不同大小。对用于本文所述的任何组合物、药盒和方法中的载体的选择可取决于载体的大小。
在一些实施方案中,一种或多种载体是质粒,并且可包括多达约1kb、多达约2kb、多达约3kb、多达约4kb、多达约5kb、多达约6kb、多达约7kb、多达约8kb、多达约9kb、多达约10kb、多达约11kb、多达约12kb、多达约13kb、多达约14kb、或多达约15kb的总长度。在一些实施方案中,一种或多种载体是质粒,并且可具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约1kb至约11kb、约1kb至约12kb、约1kb至约13kb、约1kb至约14kb、或约1kb至约15kb的范围内的总长度。
在一些实施方案中,一种或多种载体是转座子(例如PiggyBac转座子),并且可包括大于200kb。在一些实例中,一种或多种载体是具有在约1kb至约10kb、约1kb至约20kb、约1kb至约30kb、约1kb至约40kb、约1kb至约50kb、约1kb至约60kb、约1kb至约70kb、约1kb至约80kb、约1kb至约90kb、约10kb至约20kb、约10kb至约30kb、约10kb至约40kb、约10kb至约50kb、约10kb至约60kb、约10kb至约70kb、约10kb至约90kb、约10kb至约100kb、约20kb至约30kb、约20kb至约40kb、约20kb至约50kb、约20kb至约60kb、约20kb至约70kb、约20kb至约80kb、约20kb至约90kb、约20kb至约100kb、约30kb至约40kb、约30kb至约50kb、约30kb至约60kb、约30kb至约70kb、约30kb至约80kb、约30kb至约90kb、约30kb至约100kb、约40kb至约50kb、约40kb至约60kb、约40kb至约70kb、约40kb至约80kb、约40kb至约90kb、约40kb至约100kb、约50kb至约60kb、约50kb至约70kb、约50kb至约80kb、约50kb至约90kb、约50kb至约100kb、约60kb至约70kb、约60kb至约80kb、约60kb至约90kb、约60kb至约100kb、约70kb至约80kb、约70kb至约90kb、约70kb至约100kb、约80kb至约90kb、约80kb至约100kb、约90kb至约100kb、约1kb至约100kb、约100kb至约200kb、约100kb至约300kb、约100kb至约400kb、或约100kb至约500kb的范围内的总长度的转座子。
在一些实施方案中,载体是粘粒,并且可具有多达55kb的总长度。在一些实例中,载体是粘粒,并且具有约1kb至约10kb、约1kb至约20kb、约1kb至约30kb、约1kb至约40kb、约1kb至约50kb、约1kb至约55kb、约10kb至约20kb、约10kb至约30kb、约10kb至约40kb、约10kb至约50kb、约10kb至约55kb、约15kb至约55kb、约15kb至约50kb、约15kb至约40kb、约15kb至约30kb、约15kb至约20kb、约20kb至约55kb、约20kb至约50kb、约20kb至约40kb、约20kb至约30kb、约25kb至约55kb、约25kb至约50kb、约25kb至约40kb、约25kb至约30kb、约30kb至约55kb、约30kb至约50kb、约30kb至约40kb、约35kb至约55kb、约40kb至约55kb、约40kb至约50kb、或约45kb至约55kb的核苷酸总数。
在一些实施方案中,一种或多种载体是人工染色体,并且可具有约100kb至约2000kb的核苷酸总数。在一些实施方案中,一种或多种人工染色体是人类人工染色体(HAC),并且可具有在约1kb至约10kb、1kb至约20kb、约1kb至约30kb、约1kb至约40kb、约1kb至约50kb、约1kb至约60kb、约10kb至约20kb、约10kb至约30kb、约10kb至约40kb、约10kb至约50kb、约10kb至约60kb、约20kb至约30kb、约20kb至约40kb、约20kb至约50kb、约20kb至约60kb、约30kb至约40kb、约30kb至约50kb、约30kb至约60kb、约40kb至约50kb、约40kb至约60kb、或约50kb至约60kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种人工染色体是酵母人工染色体(YAC),并且可具有多达1000kb的核苷酸总数。在一些实施方案中,一种或多种人工染色体是具有在约100kb至约1,000kb、约100kb至约900kb、约100kb至约800kb、约100kb至约700kb、约100kb至约600kb、约100kb至约500kb、约100kb至约400kb、约100kb至约300kb、约100kb至约200kb、约200kb至约1,000kb、约200kb至约900kb、约200kb至约800kb、约200kb至约700kb、约200kb至约600kb、约200kb至约500kb、约200kb至约400kb、约200kb至约300kb、约300kb至约1,000kb、约300kb至约900kb、约300kb至约800kb、约300kb至约700kb、约300kb至约600kb、约300kb至约500kb、约300kb至约400kb、约400kb至约1,000kb、约400kb至约900kb、约400kb至约800kb、约400kb至约700kb、约400kb至约600kb、约400kb至约500kb、约500kb至约1,000kb、约500kb至约900kb、约500kb至约800kb、约500kb至约700kb、约500kb至约600kb、约600kb至约1,000kb、约600kb至约900kb、约600kb至约800kb、约600kb至约700kb、约700kb至约1,000kb、约700kb至约900kb、约700kb至约800kb、约800kb至约1,000kb、约800kb至约900kb、或约900kb至约1,000kb的范围内的核苷酸总数的YAC。
在一些实施方案中,一种或多种人工染色体是细菌人工染色体(BAC),并且可具有多达750kb的核苷酸总数。在一些实施方案中,一种或多种人工染色体是BAC,并且可具有在约100kb至约750kb、约100kb至约700kb、约100kb至约600kb、约100kb至约500kb、约100kb至约400kb、约100kb至约300kb、约100kb至约200kb、约150kb至约750kb、约150kb至约700kb、约150kb至约600kb、约150kb至约500kb、约150kb至约400kb、约150kb至约300kb、约150kb至约200kb、约200kb至约750kb、约200kb至约700kb、约200kb至约600kb、约200kb至约500kb、约200kb至约400kb、约200kb至约300kb、约250kb至约750kb、约250kb至约700kb、约250kb至约600kb、约250kb至约500kb、约250kb至约400kb、约250kb至约300kb、约300kb至约750kb、约300kb至约700kb、约300kb至约600kb、约300kb至约500kb、约300kb至约400kb、约350kb至约750kb、约350kb至约700kb、约350kb至约600kb、约350kb至约500kb、约350kb至约400kb、约400kb至约750kb、约400kb至约700kb、约450kb至约600kb、约450kb至约500kb、约500kb至约750kb、约500kb至约700kb、约500kb至约600kb、约550kb至约750kb、约550kb至约700kb、约550kb至约600kb、约600kb至约750kb、约600kb至约700kb、或约650kb至约750kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种人工染色体是P1源性人工染色体(PAC),并且可具有多达300kb的核苷酸总数。在一些实施方案中,一种或多种P1源性人工染色体可具有在约100kb至约300kb、约100kb至约200kb、或约200kb至约300kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种载体是病毒载体,并且可具有多达10kb的核苷酸总数。在一些实施方案中,一种或多种病毒载体可具有在约1kb至约2kb、1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约2kb至约9kb、约2kb至约10kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约3kb至约9kb、约3kb至约10kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约4kb至约9kb、约4kb至约10kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约5kb至约9kb、约5kb至约10kb、约6kb至约7kb、约6kb至约8kb、约6kb至约9kb、约6kb至约10kb、约7kb至约8kb、约7kb至约9kb、约7kb至约10kb、约8kb至约9kb、约8kb至约10kb、或约9kb至约10kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种载体是慢病毒,并且可具有多达8kb的核苷酸总数。在一些实例中,一种或多种慢病毒可具有约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约8kb、约6kb至约7kb、或约7kb至约8kb的核苷酸总数。
在一些实施方案中,一种或多种载体是腺病毒,并且可具有多达8kb的核苷酸总数。在一些实施方案中,一种或多种腺病毒可具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约7kh、约6kb至约8kb、或约7kb至约8kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种载体是腺相关病毒(AAV载体),并且可包括多达5kb的核苷酸总数。在一些实施方案中,一种或多种AAV载体可包括在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约3kb至约4kb、约3kb至约5kb、或约4kb至约5kb的范围内的核苷酸总数。
在一些实施方案中,一种或多种载体是
Figure BDA0002959533770000991
载体,并且可包括多达5kb的核苷酸总数。在一些实施方案中,每种
Figure BDA0002959533770000992
载体包括在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约3kb至约4kb、约3kb至约5kb、或约4kb至约5kb的范围内的核苷酸总数。
在本文提供的任何组合物、药盒和方法的一些实施方案中,至少两种不同载体可为大致上相同类型的载体,并且在大小方面可不同。在一些实施方案中,至少两种不同载体可为不同类型的载体,并且可具有大致上相同的大小或具有不同大小。
在一些实施方案中,至少两种载体中的任一者可具有在以下范围内的核苷酸总数:约500个核苷酸至约10,000个核苷酸、约500个核苷酸至约9,500个核苷酸、约500个核苷酸至约9,000个核苷酸、约500个核苷酸至约8,500个核苷酸、约500个核苷酸至约8,000个核苷酸、约500个核苷酸至约7,800个核苷酸、约500个核苷酸至约7,600个核苷酸、约500个核苷酸至约7,400个核苷酸、约500个核苷酸至约7,200个核苷酸、约500个核苷酸至约7,000个核苷酸、约500个核苷酸至约6,800个核苷酸、约500个核苷酸至约6,600个核苷酸、约500个核苷酸至约6,400个核苷酸、约500个核苷酸至约6,200个核苷酸、约500个核苷酸至约6,000个核苷酸、约500个核苷酸至约5,800个核苷酸、约500个核苷酸至约5,600个核苷酸、约500个核苷酸至约5,400个核苷酸、约500个核苷酸至约5,200个核苷酸、约500个核苷酸至约5,000个核苷酸、约500个核苷酸至约4,800个核苷酸、约4,600个核苷酸、约500个核苷酸至约4,400个核苷酸、约500个核苷酸至约4,200个核苷酸、约500个核苷酸至约4,000个核苷酸、约500个核苷酸至约3,800个核苷酸、约500个核苷酸至约3,600个核苷酸、约500个核苷酸至约3,400个核苷酸、约500个核苷酸至约3,200个核苷酸、约500个核苷酸至约3,000个核苷酸、约500个核苷酸至约2,800个核苷酸、约500个核苷酸至约2,600个核苷酸、约500个核苷酸至约2,400个核苷酸、约500个核苷酸至约2,200个核苷酸、约500个核苷酸至约2,000个核苷酸、约500个核苷酸至约1,800个核苷酸、约500个核苷酸至约1,600个核苷酸、约500个核苷酸至约1,400个核苷酸、约500个核苷酸至约1,200个核苷酸、约500个核苷酸至约1,000个核苷酸、约500个核苷酸至约800个核苷酸、约800个核苷酸至约10,000个核苷酸、约800个核苷酸至约9,500个核苷酸、约800个核苷酸至约9,000个核苷酸、约800个核苷酸至约8,500个核苷酸、约800个核苷酸至约8,000个核苷酸、约800个核苷酸至约7,800个核苷酸、约800个核苷酸至约7,600个核苷酸、约800个核苷酸至约7,400个核苷酸、约800个核苷酸至约7,200个核苷酸、约800个核苷酸至约7,000个核苷酸、约800个核苷酸至约6,800个核苷酸、约800个核苷酸至约6,600个核苷酸、约800个核苷酸至约6,400个核苷酸、约800个核苷酸至约6,200个核苷酸、约800个核苷酸至约6,000个核苷酸、约800个核苷酸至约5,800个核苷酸、约800个核苷酸至约5,600个核苷酸、约800个核苷酸至约5,400个核苷酸、约800个核苷酸至约5,200个核苷酸、约800个核苷酸至约5,000个核苷酸、约800个核苷酸至约4,800个核苷酸、约800个核苷酸至约4,600个核苷酸、约800个核苷酸至约4,400个核苷酸、约800个核苷酸至约4,200个核苷酸、约800个核苷酸至约4,000个核苷酸、约800个核苷酸至约3,800个核苷酸、约800个核苷酸至约3,600个核苷酸、约800个核苷酸至约3,400个核苷酸、约800个核苷酸至约3,200个核苷酸、约800个核苷酸至约3,000个核苷酸、约800个核苷酸至约2,800个核苷酸、约800个核苷酸至约2,600个核苷酸、约800个核苷酸至约2,400个核苷酸、约800个核苷酸至约2,200个核苷酸、约800个核苷酸至约2,000个核苷酸、约800个核苷酸至约1,800个核苷酸、约800个核苷酸至约1,600个核苷酸、约800个核苷酸至约1,400个核苷酸、约800个核苷酸至约1,200个核苷酸、约800个核苷酸至约1,000个核苷酸、约1,000个核苷酸至约10,000个核苷酸、约1,000个核苷酸至约9,000个核苷酸、约1,000个核苷酸至约8,500个核苷酸、约1,000个核苷酸至约8,000个核苷酸、约1,000个核苷酸至约7,800个核苷酸、约1,000个核苷酸至约7,600个核苷酸、约1,000个核苷酸至约7,400个核苷酸、约1,000个核苷酸至约7,200个核苷酸、约1,000个核苷酸至约7,000个核苷酸、约1,000个核苷酸至约6,800个核苷酸、约1,000个核苷酸至约6,600个核苷酸、约1,000个核苷酸至约6,400个核苷酸、约1,000个核苷酸至约6,200个核苷酸、约1,000个核苷酸至约6,000个核苷酸、约1,000个核苷酸至约5,800个核苷酸、约1,000个核苷酸至约5,600个核苷酸、约1,000个核苷酸至约5,400个核苷酸、约1,000个核苷酸至约5,200个核苷酸、约1,000个核苷酸至约5,000个核苷酸、约1,000个核苷酸至约4,800个核苷酸、约1,000个核苷酸至约4,600个核苷酸、约1,000个核苷酸至约4,400个核苷酸、约1,000个核苷酸至约4,200个核苷酸、约1,000个核苷酸至约4,000个核苷酸、约1,000个核苷酸至约3,800个核苷酸、约1,000个核苷酸至约3,600个核苷酸、约1,000个核苷酸至约3,400个核苷酸、约1,000个核苷酸至约3,200个核苷酸、约1,000个核苷酸至约3,000个核苷酸、约1,000个核苷酸至约2,600个核苷酸、约1,000个核苷酸至约2,400个核苷酸、约1,000个核苷酸至约2,200个核苷酸、约1,000个核苷酸至约2,000个核苷酸、约1,000个核苷酸至约1,800个核苷酸、约1,000个核苷酸至约1,600个核苷酸、约1,000个核苷酸至约1,400个核苷酸、约1,000个核苷酸至约1,200个核苷酸、约1,200个核苷酸至约10,000个核苷酸、约1,200个核苷酸至约9,500个核苷酸、约1,200个核苷酸至约9,000个核苷酸、约1,200个核苷酸至约8,500个核苷酸、约1,200个核苷酸至约8,000个核苷酸、约1,200个核苷酸至约7,800个核苷酸、约1,200个核苷酸至约7,600个核苷酸、约1,200个核苷酸至约7,400个核苷酸、约1,200个核苷酸至约7,200个核苷酸、约1,200个核苷酸至约7,000个核苷酸、约1,200个核苷酸至约6,800个核苷酸、约1,200个核苷酸至约6,600个核苷酸、约1,200个核苷酸至约6,400个核苷酸、约1,200个核苷酸至约6,200个核苷酸、约1,200个核苷酸至约6,000个核苷酸、约1,200个核苷酸至约5,800个核苷酸、约1,200个核苷酸至约5,600个核苷酸、约1,200个核苷酸至约5,400个核苷酸、约1,200个核苷酸至约5,000个核苷酸、约1,200个核苷酸至约4,800个核苷酸、约1,200个核苷酸至约4,600个核苷酸、约1,200个核苷酸至约4,400个核苷酸、约1,200个核苷酸至约4,200个核苷酸、约1,200个核苷酸至约4,000个核苷酸、约1,200个核苷酸至约3,800个核苷酸、约1,200个核苷酸至约3,600个核苷酸、约1,200个核苷酸至约3,400个核苷酸、约1,200个核苷酸至约3,200个核苷酸、约1,200个核苷酸至约3,000个核苷酸、约1,200个核苷酸至约2,800个核苷酸、约1,200个核苷酸至约2,600个核苷酸、约1,200个核苷酸至约2,400个核苷酸、约1,200个核苷酸至约2,200个核苷酸、约1,200个核苷酸至约2,000个核苷酸、约1,200个核苷酸至约1,800个核苷酸、约1,200个核苷酸至约1,600个核苷酸、约1,200个核苷酸至约1,400个核苷酸、约1,400个核苷酸至约10,000个核苷酸、约1,400个核苷酸至约9,500个核苷酸、约1,400个核苷酸至约9,000个核苷酸、约1,400个核苷酸至约8,500个核苷酸、约1,400个核苷酸至约8,000个核苷酸、约1,400个核苷酸至约7,800个核苷酸、约1,400个核苷酸至约7,600个核苷酸、约1,400个核苷酸至约7,400个核苷酸、约1,400个核苷酸至约7,200个核苷酸、约1,400个核苷酸至约7,000个核苷酸、约1,400个核苷酸至约6,800个核苷酸、约1,400个核苷酸至约6,600个核苷酸、约1,400个核苷酸至约6,400个核苷酸、约1,400个核苷酸至约6,200个核苷酸、约1,400个核苷酸至约6,000个核苷酸、约1,400个核苷酸至约5,800个核苷酸、约1,400个核苷酸至约5,600个核苷酸、约1,400个核苷酸至约5,400个核苷酸、约1,400个核苷酸至约5,200个核苷酸、约1,400个核苷酸至约5,000个核苷酸、约1,400个核苷酸至约4,800个核苷酸、约1,400个核苷酸至约4,600个核苷酸、约1,400个核苷酸至约4,400个核苷酸、约1,400个核苷酸至约4,200个核苷酸、约1,400个核苷酸至约4,000个核苷酸、约1,400个核苷酸至约3,800个核苷酸、约1,400个核苷酸至约3,600个核苷酸、约1,400个核苷酸至约3,400个核苷酸、约1,400个核苷酸至约3,200个核苷酸、约1,400个核苷酸至约3,000个核苷酸、约1,400个核苷酸至约2,600个核苷酸、约1,400个核苷酸至约2,400个核苷酸、约1,400个核苷酸至约2,200个核苷酸、约1,400个核苷酸至约2,000个核苷酸、约1,400个核苷酸至约1,800个核苷酸、约1,400个核苷酸至约1,600个核苷酸、约1,600个核苷酸至约10,000个核苷酸、约1,600个核苷酸至约9,500个核苷酸、约1,600个核苷酸至约9,000个核苷酸、约1,600个核苷酸至约8,500个核苷酸、约1,600个核苷酸至约8,000个核苷酸、约1,600个核苷酸至约7,800个核苷酸、约1,600个核苷酸至约7,600个核苷酸、约1,600个核苷酸至约7,400个核苷酸、约1,600个核苷酸至约7,200个核苷酸、约1,600个核苷酸至约7,000个核苷酸、约1,600个核苷酸至约6,800个核苷酸、约1,600个核苷酸至约6,400个核苷酸、约1,600个核苷酸至约6,200个核苷酸、约1,600个核苷酸至约6,000个核苷酸、约1,600个核苷酸至约5,800个核苷酸、约1,600个核苷酸至约5,600个核苷酸、约1,600个核苷酸至约5,400个核苷酸、约1,600个核苷酸至约5,200个核苷酸、约1,600个核苷酸至约5,000个核苷酸、约1,600个核苷酸至约4,800个核苷酸、约1,600个核苷酸至约4,600个核苷酸、约1,600个核苷酸至约4,400个核苷酸、约1,600个核苷酸至约4,200个核苷酸、约1,600个核苷酸至约4,000个核苷酸、约1,600个核苷酸至约3,800个核苷酸、约1,600个核苷酸至约3,600个核苷酸、约1,600个核苷酸至约3,400个核苷酸、约1,600个核苷酸至约3,200个核苷酸、约1,600个核苷酸至约3,000个核苷酸、约1,600个核苷酸至约2,800个核苷酸、约1,600个核苷酸至约2,600个核苷酸、约1,600个核苷酸至约2,400个核苷酸、约1,600个核苷酸至约2,200个核苷酸、约1,600个核苷酸至约2,000个核苷酸、约1,600个核苷酸至约1,800个核苷酸、约1,800个核苷酸至约10,000个核苷酸、约1,800个核苷酸至约9,500个核苷酸、约1,800个核苷酸至约9,000个核苷酸、约1,800个核苷酸至约8,500个核苷酸、约1,800个核苷酸至约8,000个核苷酸、约1,800个核苷酸至约7,800个核苷酸、约1,800个核苷酸至约7,600个核苷酸、约1,800个核苷酸至约7,400个核苷酸、约1,800个核苷酸至约7,200个核苷酸、约1,800个核苷酸至约7,000个核苷酸、约1,800个核苷酸至约6,800个核苷酸、约1,800个核苷酸至约6,600个核苷酸、约1,800个核苷酸至约6,400个核苷酸、约1,800个核苷酸至约6,200个核苷酸、约1,800个核苷酸至约6,000个核苷酸、约1,800个核苷酸至约5,800个核苷酸、约1,800个核苷酸至约5,600个核苷酸、约1,800个核苷酸至约5,400个核苷酸、约1,800个核苷酸至约5,200个核苷酸、约1,800个核苷酸至约5,000个核苷酸、约1,800个核苷酸至约4,800个核苷酸、约1,800个核苷酸至约4,600个核苷酸、约1,800个核苷酸至约4,400个核苷酸、约1,800个核苷酸至约4,200个核苷酸、约1,800个核苷酸至约4,000个核苷酸、约1,800个核苷酸至约3,800个核苷酸、约1,800个核苷酸至约3,600个核苷酸、约1,800个核苷酸至约3,400个核苷酸、约1,800个核苷酸至约3,200个核苷酸、约1,800个核苷酸至约3,000个核苷酸、约1,800个核苷酸至约2,800个核苷酸、约1,800个核苷酸至约2,600个核苷酸、约1,800个核苷酸至约2,400个核苷酸、约1,800个核苷酸至约2,200个核苷酸、约1,800个核苷酸至约2,000个核苷酸、约2,000个核苷酸至约10,000个核苷酸、约2,000个核苷酸至约9,500个核苷酸、约2,000个核苷酸至约9,000个核苷酸、约2,000个核苷酸至约8,500个核苷酸、约2,000个核苷酸至约8,000个核苷酸、约2,000个核苷酸至约7,800个核苷酸、约2,000个核苷酸至约7,600个核苷酸、约2,000个核苷酸至约7,400个核苷酸、约2,000个核苷酸至约7,200个核苷酸、约2,000个核苷酸至约7,000个核苷酸、约2,000个核苷酸至约6,800个核苷酸、约2,000个核苷酸至约6,600个核苷酸、约2,000个核苷酸至约6,400个核苷酸、约2,000个核苷酸至约6,200个核苷酸、约2,000个核苷酸至约6,000个核苷酸、约2,000个核苷酸至约5,800个核苷酸、约2,000个核苷酸至约5,600个核苷酸、约2,000个核苷酸至约5,400个核苷酸、约2,000个核苷酸至约5,200个核苷酸、约2,000个核苷酸至约5,000个核苷酸、约2,000个核苷酸至约4,800个核苷酸、约2,000个核苷酸至约4,600个核苷酸、约2,000个核苷酸至约4,400个核苷酸、约2,000个核苷酸至约4,200个核苷酸、约2,000个核苷酸至约4,000个核苷酸、约2,000个核苷酸至约3,800个核苷酸、约2,000个核苷酸至约3,600个核苷酸、约2,000个核苷酸至约3,400个核苷酸、约2,000个核苷酸至约3,200个核苷酸、约2,000个核苷酸至约3,000个核苷酸、约2,000个核苷酸至约2,800个核苷酸、约2,000个核苷酸至约2,600个核苷酸、约2,000个核苷酸至约2,400个核苷酸、约2,000个核苷酸至约2,200个核苷酸、约2,200个核苷酸至约10,000个核苷酸、约9,500个核苷酸、约9,000个核苷酸、约8,500个核苷酸、约8,000个核苷酸、约7,800个核苷酸、约7,600个核苷酸、约7,400个核苷酸、约7,200个核苷酸、约7,000个核苷酸、约6,800个核苷酸、约6,600个核苷酸、约6,400个核苷酸、约6,200个核苷酸、约6,000个核苷酸、约5,800个核苷酸、约5,600个核苷酸、约5,400个核苷酸、约5,200个核苷酸、约5,000个核苷酸、约4,800个核苷酸、约4,600个核苷酸、约4,400个核苷酸、约4,200个核苷酸、约4,000个核苷酸、约3,800个核苷酸、约3,600个核苷酸、约3,400个核苷酸、约3,200个核苷酸、约3,000个核苷酸、约2,800个核苷酸、约2,600个核苷酸、约2,400个核苷酸、约2,400个核苷酸至约10,000个核苷酸、约2,400个核苷酸至约9,500个核苷酸、约2,400个核苷酸至约9,000个核苷酸、约2,400个核苷酸至约8,500个核苷酸、约2,400个核苷酸至约8,000个核苷酸、约2,400个核苷酸至约7,800个核苷酸、约2,400个核苷酸至约7,600个核苷酸、约2,400个核苷酸至约7,400个核苷酸、约2,400个核苷酸至约7,200个核苷酸、约2,400个核苷酸至约7,000个核苷酸、约2,400个核苷酸至约6,800个核苷酸、约2,400个核苷酸至约6,600个核苷酸、约2,400个核苷酸至约6,400个核苷酸、约2,400个核苷酸至约6,200个核苷酸、约2,400个核苷酸至约6,000个核苷酸、约2,400个核苷酸至约5,800个核苷酸、约2,400个核苷酸至约5,600个核苷酸、约2,400个核苷酸至约5,400个核苷酸、约2,400个核苷酸至约5,200个核苷酸、约2,400个核苷酸至约5,000个核苷酸、约2,400个核苷酸至约4,800个核苷酸、约2,400个核苷酸至约4,600个核苷酸、约2,400个核苷酸至约4,400个核苷酸、约2,400个核苷酸至约4,200个核苷酸、约2,400个核苷酸至约4,000个核苷酸、约2,400个核苷酸至约3,800个核苷酸、约2,400个核苷酸至约3,600个核苷酸、约2,400个核苷酸至约3,400个核苷酸、约2,400个核苷酸至约3,200个核苷酸、约2,400个核苷酸至约3,000个核苷酸、约2,400个核苷酸至约2,800个核苷酸、约2,400个核苷酸至约2,600个核苷酸、约2,600个核苷酸至约10,000个核苷酸、约2,600个核苷酸至约9,500个核苷酸、约2,600个核苷酸至约9,000个核苷酸、约2,600个核苷酸至约8,500个核苷酸、约2,600个核苷酸至约8,000个核苷酸、约2,600个核苷酸至约7,800个核苷酸、约2,600个核苷酸至约7,600个核苷酸、约2,600个核苷酸至约7,400个核苷酸、约2,600个核苷酸至约7,200个核苷酸、约2,600个核苷酸至约7,000个核苷酸、约2,600个核苷酸至约6,800个核苷酸、约2,600个核苷酸至约6,600个核苷酸、约2,600个核苷酸至约6,400个核苷酸、约2,600个核苷酸至约6,200个核苷酸、约2,600个核苷酸至约6,000个核苷酸、约2,600个核苷酸至约5,800个核苷酸、约2,600个核苷酸至约5,600个核苷酸、约2,600个核苷酸至约5,400个核苷酸、约2,600个核苷酸至约5,200个核苷酸、约2,600个核苷酸至约5,000个核苷酸、约2,600个核苷酸至约4,800个核苷酸、约2,600个核苷酸至约4,600个核苷酸、约2,600个核苷酸至约4,400个核苷酸、约2,600个核苷酸至约4,200个核苷酸、约2,600个核苷酸至约4,000个核苷酸、约2,600个核苷酸至约3,800个核苷酸、约2,600个核苷酸至约3,600个核苷酸、约2,600个核苷酸至约3,400个核苷酸、约2,600个核苷酸至约3,200个核苷酸、约2,600个核苷酸至约3,000个核苷酸、约2,600个核苷酸至约2,800个核苷酸、约2,800个核苷酸至约10,000个核苷酸、约2,800个核苷酸至约9,500个核苷酸、约2,800个核苷酸至约9,000个核苷酸、约2,800个核苷酸至约8,500个核苷酸、约2,800个核苷酸至约8,000个核苷酸、约2,800个核苷酸至约7,800个核苷酸、约2,800个核苷酸至约7,600个核苷酸、约2,800个核苷酸至约7,400个核苷酸、约2,800个核苷酸至约7,200个核苷酸、约2,800个核苷酸至约7,000个核苷酸、约2,800个核苷酸至约6,800个核苷酸、约2,800个核苷酸至约6,600个核苷酸、约2,800个核苷酸至约6,400个核苷酸、约2,800个核苷酸至约6,200个核苷酸、约2,800个核苷酸至约6,000个核苷酸、约2,800个核苷酸至约5,800个核苷酸、约2,800个核苷酸至约5,600个核苷酸、约2,800个核苷酸至约5,400个核苷酸、约2,800个核苷酸至约5,200个核苷酸、约2,800个核苷酸至约5,000个核苷酸、约2,800个核苷酸至约4,800个核苷酸、约2,800个核苷酸至约4,600个核苷酸、约2,800个核苷酸至约4,400个核苷酸、约2,800个核苷酸至约4,200个核苷酸、约2,800个核苷酸至约4,000个核苷酸、约2,800个核苷酸至约3,800个核苷酸、约2,800个核苷酸至约3,600个核苷酸、约2,800个核苷酸至约3,400个核苷酸、约2,800个核苷酸至约3,200个核苷酸、约2,800个核苷酸至约3,000个核苷酸、约3,000个核苷酸至约10,000个核苷酸、约3,000个核苷酸至约9,500个核苷酸、约3,000个核苷酸至约9,000个核苷酸、约3,000个核苷酸至约8,500个核苷酸、约3,000个核苷酸至约8,000个核苷酸、约3,000个核苷酸至约7,800个核苷酸、约3,000个核苷酸至约7,600个核苷酸、约3,000个核苷酸至约7,400个核苷酸、约3,000个核苷酸至约7,200个核苷酸、约3,000个核苷酸至约7,000个核苷酸、约3,000个核苷酸至约6,800个核苷酸、约3,000个核苷酸至约6,600个核苷酸、约3,000个核苷酸至约6,400个核苷酸、约3,000个核苷酸至约6,200个核苷酸、约3,000个核苷酸至约6,000个核苷酸、约3,000个核苷酸至约5,800个核苷酸、约3,000个核苷酸至约5,600个核苷酸、约3,000个核苷酸至约5,400个核苷酸、约3,000个核苷酸至约5,200个核苷酸、约3,000个核苷酸至约5,000个核苷酸、约3,000个核苷酸至约4,800个核苷酸、约3,000个核苷酸至约4,600个核苷酸、约3,000个核苷酸至约4,400个核苷酸、约3,000个核苷酸至约4,200个核苷酸、约3,000个核苷酸至约4,000个核苷酸、约3,000个核苷酸至约3,800个核苷酸、约3,000个核苷酸至约3,600个核苷酸、约3,000个核苷酸至约3,400个核苷酸、约3,000个核苷酸至约3,200个核苷酸、约3,200个核苷酸至约10,000个核苷酸、约3,200个核苷酸至约9,500个核苷酸、约3,200个核苷酸至约9,000个核苷酸、约3,200个核苷酸至约8,500个核苷酸、约3,200个核苷酸至约8,000个核苷酸、约3,200个核苷酸至约7,800个核苷酸、约3,200个核苷酸至约7,600个核苷酸、约3,200个核苷酸至约7,400个核苷酸、约3,200个核苷酸至约7,200个核苷酸、约3,200个核苷酸至约7,000个核苷酸、约3,200个核苷酸至约6,800个核苷酸、约3,200个核苷酸至约6,600个核苷酸、约3,200个核苷酸至约6,400个核苷酸、约3,200个核苷酸至约6,200个核苷酸、约3,200个核苷酸至约6,000个核苷酸、约3,200个核苷酸至约5,800个核苷酸、约3,200个核苷酸至约5,600个核苷酸、约3,200个核苷酸至约5,400个核苷酸、约3,200个核苷酸至约5,200个核苷酸、约3,200个核苷酸至约5,000个核苷酸、约3,200个核苷酸至约4,800个核苷酸、约3,200个核苷酸至约4,600个核苷酸、约3,200个核苷酸至约4,400个核苷酸、约3,200个核苷酸至约4,200个核苷酸、约3,200个核苷酸至约4,000个核苷酸、约3,200个核苷酸至约3,800个核苷酸、约3,200个核苷酸至约3,600个核苷酸、约3,200个核苷酸至约3,400个核苷酸、约3,400个核苷酸至约10,000个核苷酸、约3,400个核苷酸至约9,500个核苷酸、约3,400个核苷酸至约9,000个核苷酸、约3,400个核苷酸至约8,500个核苷酸、约3,400个核苷酸至约8,000个核苷酸、约3,400个核苷酸至约7,800个核苷酸、约3,400个核苷酸至约7,600个核苷酸、约3,400个核苷酸至约7,400个核苷酸、约3,400个核苷酸至约7,200个核苷酸、约3,400个核苷酸至约7,000个核苷酸、约3,400个核苷酸至约6,800个核苷酸、约3,400个核苷酸至约6,600个核苷酸、约3,400个核苷酸至约6,400个核苷酸、约3,400个核苷酸至约6,200个核苷酸、约3,400个核苷酸至约6,000个核苷酸、约3,400个核苷酸至约5,800个核苷酸、约3,400个核苷酸至约5,600个核苷酸、约3,400个核苷酸至约5,400个核苷酸、约3,400个核苷酸至约5,200个核苷酸、约3,400个核苷酸至约5,000个核苷酸、约3,400个核苷酸至约4,800个核苷酸、约3,400个核苷酸至约4,600个核苷酸、约3,400个核苷酸至约4,400个核苷酸、约3,400个核苷酸至约4,200个核苷酸、约3,400个核苷酸至约4,000个核苷酸、约3,400个核苷酸至约3,800个核苷酸、约3,400个核苷酸至约3,600个核苷酸、约3,600个核苷酸至约10,000个核苷酸、约3,600个核苷酸至约9,500个核苷酸、约3,600个核苷酸至约9,000个核苷酸、约3,600个核苷酸至约8,500个核苷酸、约3,600个核苷酸至约8,000个核苷酸、约3,600个核苷酸至约7,800个核苷酸、约3,600个核苷酸至约7,600个核苷酸、约3,600个核苷酸至约7,400个核苷酸、约3,600个核苷酸至约7,200个核苷酸、约3,600个核苷酸至约7,000个核苷酸、约3,600个核苷酸至约6,800个核苷酸、约3,600个核苷酸至约6,600个核苷酸、约3,600个核苷酸至约6,400个核苷酸、约3,600个核苷酸至约6,200个核苷酸、约3,600个核苷酸至约6,000个核苷酸、约3,600个核苷酸至约5,800个核苷酸、约3,600个核苷酸至约5,600个核苷酸、约3,600个核苷酸至约5,400个核苷酸、约3,600个核苷酸至约5,200个核苷酸、约3,600个核苷酸至约5,000个核苷酸、约3,600个核苷酸至约4,800个核苷酸、约3,600个核苷酸至约4,600个核苷酸、约3,600个核苷酸至约4,400个核苷酸、约3,600个核苷酸至约4,200个核苷酸、约3,600个核苷酸至约4,000个核苷酸、约3,600个核苷酸至约3,800个核苷酸、约3,800个核苷酸至约10,000个核苷酸、约3,800个核苷酸至约9,500个核苷酸、约3,800个核苷酸至约9,000个核苷酸、约3,800个核苷酸至约8,500个核苷酸、约3,800个核苷酸至约8,000个核苷酸、约3,800个核苷酸至约7,800个核苷酸、约3,800个核苷酸至约7,600个核苷酸、约3,800个核苷酸至约7,400个核苷酸、约3,800个核苷酸至约7,200个核苷酸、约3,800个核苷酸至约7,000个核苷酸、约3,800个核苷酸至约6,800个核苷酸、约3,800个核苷酸至约6,600个核苷酸、约3,800个核苷酸至约6,400个核苷酸、约3,800个核苷酸至约6,200个核苷酸、约3,800个核苷酸至约6,000个核苷酸、约3,800个核苷酸至约5,800个核苷酸、约3,800个核苷酸至约5,600个核苷酸、约3,800个核苷酸至约5,400个核苷酸、约3,800个核苷酸至约5,200个核苷酸、约3,800个核苷酸至约5,000个核苷酸、约3,800个核苷酸至约4,800个核苷酸、约3,800个核苷酸至约4,600个核苷酸、约3,800个核苷酸至约4,200个核苷酸、约3,800个核苷酸至约4,000个核苷酸、约4,000个核苷酸至约10,000个核苷酸、约4,000个核苷酸至约9,500个核苷酸、约4,000个核苷酸至约9,000个核苷酸、约4,000个核苷酸至约8,500个核苷酸、约4,000个核苷酸至约8,000个核苷酸、约4,000个核苷酸至约7,800个核苷酸、约4,000个核苷酸至约7,600个核苷酸、约4,000个核苷酸至约7,400个核苷酸、约4,000个核苷酸至约7,200个核苷酸、约4,000个核苷酸至约7,000个核苷酸、约4,000个核苷酸至约6,800个核苷酸、约4,000个核苷酸至约6,600个核苷酸、约4,000个核苷酸至约6,400个核苷酸、约4,000个核苷酸至约6,200个核苷酸、约4,000个核苷酸至约6,000个核苷酸、约4,000个核苷酸至约5,800个核苷酸、约4,000个核苷酸至约5,600个核苷酸、约4,000个核苷酸至约5,400个核苷酸、约4,000个核苷酸至约5,200个核苷酸、约4,000个核苷酸至约5,000个核苷酸、约4,000个核苷酸至约4,800个核苷酸、约4,000个核苷酸至约4,600个核苷酸、约4,000个核苷酸至约4,400个核苷酸、约4,000个核苷酸至约4,200个核苷酸、约4,200个核苷酸至约10,000个核苷酸、约4,200个核苷酸至约9,500个核苷酸、约4,200个核苷酸至约9,000个核苷酸、约4,200个核苷酸至约8,500个核苷酸、约4,200个核苷酸至约8,000个核苷酸、约4,200个核苷酸至约7,800个核苷酸、约4,200个核苷酸至约7,600个核苷酸、约4,200个核苷酸至约7,400个核苷酸、约4,200个核苷酸至约7,200个核苷酸、约4,200个核苷酸至约7,000个核苷酸、约4,200个核苷酸至约6,800个核苷酸、约4,200个核苷酸至约6,600个核苷酸、约4,200个核苷酸至约6,400个核苷酸、约4,200个核苷酸至约6,200个核苷酸、约4,200个核苷酸至约6,000个核苷酸、约4,200个核苷酸至约5,800个核苷酸、约4,200个核苷酸至约5,600个核苷酸、约4,200个核苷酸至约5,400个核苷酸、约4,200个核苷酸至约5,200个核苷酸、约4,200个核苷酸至约5,000个核苷酸、约4,200个核苷酸至约4,800个核苷酸、约4,200个核苷酸至约4,600个核苷酸、约4,200个核苷酸至约4,400个核苷酸、约4,400个核苷酸至约10,000个核苷酸、约4,400个核苷酸至约9,500个核苷酸、约4,400个核苷酸至约9,000个核苷酸、约4,400个核苷酸至约8,500个核苷酸、约4,400个核苷酸至约8,000个核苷酸、约4,400个核苷酸至约7,800个核苷酸、约4,400个核苷酸至约7,600个核苷酸、约4,400个核苷酸至约7,400个核苷酸、约4,400个核苷酸至约7,200个核苷酸、约4,400个核苷酸至约7,000个核苷酸、约4,400个核苷酸至约6,800个核苷酸、约4,400个核苷酸至约6,600个核苷酸、约4,400个核苷酸至约6,400个核苷酸、约4,400个核苷酸至约6,200个核苷酸、约4,400个核苷酸至约6,000个核苷酸、约4,400个核苷酸至约5,800个核苷酸、约4,400个核苷酸至约5,600个核苷酸、约4,400个核苷酸至约5,400个核苷酸、约4,400个核苷酸至约5,200个核苷酸、约4,400个核苷酸至约5,000个核苷酸、约4,400个核苷酸至约4,800个核苷酸、约4,400个核苷酸至约4,600个核苷酸、约4,600个核苷酸至约10,000个核苷酸、约4,600个核苷酸至约9,500个核苷酸、约4,600个核苷酸至约9,000个核苷酸、约4,600个核苷酸至约8,500个核苷酸、约4,600个核苷酸至约8,000个核苷酸、约4,600个核苷酸至约7,800个核苷酸、约4,600个核苷酸至约7,600个核苷酸、约4,600个核苷酸至约7,400个核苷酸、约4,600个核苷酸至约7,200个核苷酸、约4,600个核苷酸至约7,000个核苷酸、约4,600个核苷酸至约6,800个核苷酸、约4,600个核苷酸至约6,600个核苷酸、约4,600个核苷酸至约6,400个核苷酸、约4,600个核苷酸至约6,200个核苷酸、约4,600个核苷酸至约6,000个核苷酸、约4,600个核苷酸至约5,800个核苷酸、约4,600个核苷酸至约5,600个核苷酸、约4,600个核苷酸至约5,400个核苷酸、约4,600个核苷酸至约5,200个核苷酸、约4,600个核苷酸至约5,000个核苷酸、约4,600个核苷酸至约4,800个核苷酸、约4,800个核苷酸至约10,000个核苷酸、约4,800个核苷酸至约9,500个核苷酸、约4,800个核苷酸至约9,000个核苷酸、约4,800个核苷酸至约8,500个核苷酸、约4,800个核苷酸至约8,000个核苷酸、约4,800个核苷酸至约7,800个核苷酸、约4,800个核苷酸至约7,600个核苷酸、约4,800个核苷酸至约7,400个核苷酸、约4,800个核苷酸至约7,200个核苷酸、约4,800个核苷酸至约7,000个核苷酸、约4,800个核苷酸至约6,800个核苷酸、约4,800个核苷酸至约6,600个核苷酸、约4,800个核苷酸至约6,400个核苷酸、约4,800个核苷酸至约6,200个核苷酸、约4,800个核苷酸至约6,000个核苷酸、约4,800个核苷酸至约5,800个核苷酸、约4,800个核苷酸至约5,600个核苷酸、约4,800个核苷酸至约5,400个核苷酸、约4,800个核苷酸至约5,200个核苷酸、约4,800个核苷酸至约5,000个核苷酸、约5,000个核苷酸至约10,000个核苷酸、约5,000个核苷酸至约9,500个核苷酸、约5,000个核苷酸至约9,000个核苷酸、约5,000个核苷酸至约8,500个核苷酸、约5,000个核苷酸至约8,000个核苷酸、约5,000个核苷酸至约7,800个核苷酸、约5,000个核苷酸至约7,600个核苷酸、约5,000个核苷酸至约7,400个核苷酸、约5,000个核苷酸至约7,200个核苷酸、约5,000个核苷酸至约7,000个核苷酸、约5,000个核苷酸至约6,800个核苷酸、约5,000个核苷酸至约6,600个核苷酸、约5,000个核苷酸至约6,400个核苷酸、约5,000个核苷酸至约6,200个核苷酸、约5,000个核苷酸至约6,000个核苷酸、约5,000个核苷酸至约5,800个核苷酸、约5,000个核苷酸至约5,600个核苷酸、约5,000个核苷酸至约5,400个核苷酸、约5,000个核苷酸至约5,200个核苷酸、约5,200个核苷酸至约10,000个核苷酸、约5,200个核苷酸至约9,500个核苷酸、约5,200个核苷酸至约9,000个核苷酸、约5,200个核苷酸至约8,500个核苷酸、约5,200个核苷酸至约8,000个核苷酸、约5,200个核苷酸至约7,800个核苷酸、约5,200个核苷酸至约7,600个核苷酸、约5,200个核苷酸至约7,400个核苷酸、约5,200个核苷酸至约7,200个核苷酸、约5,200个核苷酸至约7,000个核苷酸、约5,200个核苷酸至约6,800个核苷酸、约5,200个核苷酸至约6,600个核苷酸、约5,200个核苷酸至约6,400个核苷酸、约5,200个核苷酸至约6,200个核苷酸、约5,200个核苷酸至约6,000个核苷酸、约5,200个核苷酸至约5,800个核苷酸、约5,200个核苷酸至约5,600个核苷酸、约5,200个核苷酸至约5,400个核苷酸、约5,400个核苷酸至约10,000个核苷酸、约5,400个核苷酸至约9,500个核苷酸、约5,400个核苷酸至约9,000个核苷酸、约5,400个核苷酸至约8,500个核苷酸、约5,400个核苷酸至约8,000个核苷酸、约5,400个核苷酸至约7,800个核苷酸、约5,400个核苷酸至约7,600个核苷酸、约5,400个核苷酸至约7,400个核苷酸、约5,400个核苷酸至约7,200个核苷酸、约5,400个核苷酸至约7,000个核苷酸、约5,400个核苷酸至约6,800个核苷酸、约5,400个核苷酸至约6,600个核苷酸、约5,400个核苷酸至约6,400个核苷酸、约5,400个核苷酸至约6,200个核苷酸、约5,400个核苷酸至约6,000个核苷酸、约5,400个核苷酸至约5,800个核苷酸、约5,400个核苷酸至约5,600个核苷酸、约5,600个核苷酸至约10,000个核苷酸、约5,600个核苷酸至约9,500个核苷酸、约5,600个核苷酸至约9,000个核苷酸、约5,600个核苷酸至约8,500个核苷酸、约5,600个核苷酸至约8,000个核苷酸、约5,600个核苷酸至约7,800个核苷酸、约5,600个核苷酸至约7,600个核苷酸、约5,600个核苷酸至约7,400个核苷酸、约5,600个核苷酸至约7,200个核苷酸、约5,600个核苷酸至约7,000个核苷酸、约5,600个核苷酸至约6,800个核苷酸、约5,600个核苷酸至约6,600个核苷酸、约5,600个核苷酸至约6,400个核苷酸、约5,600个核苷酸至约6,200个核苷酸、约5,600个核苷酸至约6,000个核苷酸、约5,600个核苷酸至约5,800个核苷酸、约5,800个核苷酸至约10,000个核苷酸、约5,800个核苷酸至约9,500个核苷酸、约5,800个核苷酸至约9,000个核苷酸、约5,800个核苷酸至约8,500个核苷酸、约5,800个核苷酸至约8,000个核苷酸、约5,800个核苷酸至约7,800个核苷酸、约5,800个核苷酸至约7,600个核苷酸、约5,800个核苷酸至约7,400个核苷酸、约5,800个核苷酸至约7,200个核苷酸、约5,800个核苷酸至约7,000个核苷酸、约5,800个核苷酸至约6,800个核苷酸、约5,800个核苷酸至约6,600个核苷酸、约5,800个核苷酸至约6,400个核苷酸、约5,800个核苷酸至约6,200个核苷酸、约5,800个核苷酸至约6,000个核苷酸、约6,000个核苷酸至约10,000个核苷酸、约6,000个核苷酸至约9,500个核苷酸、约6,000个核苷酸至约9,000个核苷酸、约6,000个核苷酸至约8,500个核苷酸、约6,000个核苷酸至约8,000个核苷酸、约6,000个核苷酸至约7,800个核苷酸、约6,000个核苷酸至约7,600个核苷酸、约6,000个核苷酸至约7,400个核苷酸、约6,000个核苷酸至约7,200个核苷酸、约6,000个核苷酸至约7,000个核苷酸、约6,000个核苷酸至约6,800个核苷酸、约6,000个核苷酸至约6,600个核苷酸、约6,000个核苷酸至约6,400个核苷酸、约6,000个核苷酸至约6,200个核苷酸、约6,200个核苷酸至约10,000个核苷酸、约6,200个核苷酸至约9,000个核苷酸、约6,200个核苷酸至约8,500个核苷酸、约6,200个核苷酸至约8,000个核苷酸、约6,200个核苷酸至约7,800个核苷酸、约6,200个核苷酸至约7,600个核苷酸、约6,200个核苷酸至约7,400个核苷酸、约6,200个核苷酸至约7,200个核苷酸、约6,200个核苷酸至约7,000个核苷酸、约6,200个核苷酸至约6,800个核苷酸、约6,200个核苷酸至约6,600个核苷酸、约6,200个核苷酸至约6,400个核苷酸、约6,400个核苷酸至约10,000个核苷酸、约6,400个核苷酸至约9,500个核苷酸、约6,400个核苷酸至约9,000个核苷酸、约6,400个核苷酸至约8,500个核苷酸、约6,400个核苷酸至约8,000个核苷酸、约6,400个核苷酸至约7,800个核苷酸、约6,400个核苷酸至约7,600个核苷酸、约6,400个核苷酸至约7,400个核苷酸、约6,400个核苷酸至约7,200个核苷酸、约6,400个核苷酸至约7,000个核苷酸、约6,400个核苷酸至约6,800个核苷酸、约6,400个核苷酸至约6,600个核苷酸、约6,600个核苷酸至约10,000个核苷酸、约6,600个核苷酸至约9,500个核苷酸、约6,600个核苷酸至约9,000个核苷酸、约6,600个核苷酸至约8,500个核苷酸、约6,600个核苷酸至约8,000个核苷酸、约6,600个核苷酸至约7,800个核苷酸、约6,600个核苷酸至约7,600个核苷酸、约6,600个核苷酸至约7,400个核苷酸、约6,600个核苷酸至约7,200个核苷酸、约6,600个核苷酸至约7,000个核苷酸、约6,600个核苷酸至约6,800个核苷酸、约6,800个核苷酸至约10,000个核苷酸、约6,800个核苷酸至约9,500个核苷酸、约6,800个核苷酸至约9,000个核苷酸、约6,800个核苷酸至约8,500个核苷酸、约6,800个核苷酸至约8,000个核苷酸、约6,800个核苷酸至约7,800个核苷酸、约6,800个核苷酸至约7,600个核苷酸、约6,800个核苷酸至约7,400个核苷酸、约6,800个核苷酸至约7,200个核苷酸、约6,800个核苷酸至约7,000个核苷酸、约7,000个核苷酸至约10,000个核苷酸、约7,000个核苷酸至约9,500个核苷酸、约7,000个核苷酸至约9,000个核苷酸、约7,000个核苷酸至约8,500个核苷酸、约7,000个核苷酸至约8,000个核苷酸、约7,000个核苷酸至约7,800个核苷酸、约7,000个核苷酸至约7,600个核苷酸、约7,000个核苷酸至约7,400个核苷酸、约7,000个核苷酸至约7,200个核苷酸、约7,200个核苷酸至约10,000个核苷酸、约7,200个核苷酸至约9,500个核苷酸、约7,200个核苷酸至约9,000个核苷酸、约7,200个核苷酸至约8,500个核苷酸、约7,200个核苷酸至约8,000个核苷酸、约7,200个核苷酸至约7,800个核苷酸、约7,200个核苷酸至约7,600个核苷酸、约7,200个核苷酸至约7,400个核苷酸、约7,400个核苷酸至约10,000个核苷酸、约7,400个核苷酸至约9,500个核苷酸、约7,400个核苷酸至约9,000个核苷酸、约7,400个核苷酸至约8,500个核苷酸、约7,400个核苷酸至约8,000个核苷酸、约7,400个核苷酸至约7,800个核苷酸、约7,400个核苷酸至约7,600个核苷酸、约7,600个核苷酸至约10,000个核苷酸、约7,600个核苷酸至约9,500个核苷酸、约7,600个核苷酸至约9,000个核苷酸、约7,600个核苷酸至约8,500个核苷酸、约7,600个核苷酸至约8,000个核苷酸、约7,600个核苷酸至约7,800个核苷酸、约7,800个核苷酸至约10,000个核苷酸、约7,800个核苷酸至约9,500个核苷酸、约7,800个核苷酸至约9,000个核苷酸、约7,800个核苷酸至约8,500个核苷酸、约7,800个核苷酸至约8,000个核苷酸、约8,000个核苷酸至约10,000个核苷酸、约8,000个核苷酸至约9,500个核苷酸、约8,000个核苷酸至约9,000个核苷酸、约8,000个核苷酸至约8,500个核苷酸、约8,500个核苷酸至约10,000个核苷酸、约8,500个核苷酸至约9,500个核苷酸、约8,500个核苷酸至约9,000个核苷酸、约9,000个核苷酸至约10,000个核苷酸、约9,000个核苷酸至约9,500个核苷酸、或约9,500个核苷酸至约10,000个核苷酸(包括端值)。
本文提供了可用于本文所述的任何组合物和方法中的示例性载体。参见例如图1至图6。
本领域中已知的多种不同方法可用于将本文公开的任何载体引入哺乳动物细胞(例如耳蜗外毛细胞)中。用于将核酸引入哺乳动物细胞中的方法的非限制性实例包括:脂质体转染、转染(例如磷酸钙转染、使用高度分支有机化合物进行的转染、使用阳离子聚合物进行的转染、基于树状体的转染、光学转染、基于颗粒的转染(例如纳米颗粒转染)、或使用脂质体(例如阳离子脂质体)进行的转染)、显微注射、电穿孔、细胞挤压、声致穿孔、原生质体融合、刺穿转染、流体动力学递送、基因枪、磁性转染、病毒转染和核转染。
熟练从业者将了解,本文所述的任何载体都可通过例如脂质体转染来引入哺乳动物细胞中,并且可稳定整合至内源性基因座(例如硬纤毛蛋白基因座或硬纤毛蛋白假基因1基因座)中。在一些实施方案中,本文提供的载体稳定整合至内源性缺陷性硬纤毛蛋白基因座中,并且由此用编码功能性(例如野生型)硬纤毛蛋白的核酸替换缺陷性硬纤毛蛋白基因。
可用于将一个或多个突变和/或一个或多个缺失引入内源性基因中的各种分子生物学技术在本领域中也是已知的。这类技术的非限制性实例包括定点诱变、CRISPR(例如CRISPR/Cas9诱导的敲入突变和CRISPR/Cas9诱导的敲除突变)和TALEN。这些方法可用于纠正存在于靶标细胞的染色体中的缺陷性内源性基因的序列。
本文所述的任何载体都可还包括控制序列,例如选自转录起始序列、转录终止序列、启动子序列、增强子序列、RNA剪接序列、多腺苷酸化(多聚(A))序列和Kozak共有序列的组的控制序列。这些控制序列的非限制性实例在本文中加以描述。在一些实施方案中,启动子可为天然启动子、组成型启动子、诱导型启动子和/或组织特异性启动子。
启动子
术语“启动子”意指由哺乳动物细胞中的为使特定基因(例如硬纤毛蛋白基因)的转录起始所需的酶/蛋白质识别的DNA序列。启动子通常是指例如RNA聚合酶和/或任何相关因子与其结合,并且转录得以起始所处的核苷酸序列。启动子的非限制性实例在本文中加以描述。启动子的额外实例在本领域中是已知的。
在一些实施方案中,编码硬纤毛蛋白(例如人硬纤毛蛋白)的N末端部分的载体可包括启动子和/或增强子。编码硬纤毛蛋白的N末端部分的载体可包括本文所述或本领域中已知的任何启动子和/或增强子。
在一些实施方案中,启动子是诱导型启动子、组成型启动子、哺乳动物细胞启动子、病毒启动子、嵌合启动子、经工程改造启动子、组织特异性启动子、或本领域中已知的任何其他类型的启动子。在一些实施方案中,启动子是RNA聚合酶II启动子,诸如哺乳动物RNA聚合酶II启动子。在一些实施方案中,启动子是RNA聚合酶III启动子,包括但不限于H1启动子、人U6启动子、小鼠U6启动子或猪U6启动子。启动子将通常是能够促进在耳蜗细胞诸如毛细胞中的转录的启动子。在一些实例中,启动子是耳蜗特异性启动子或耳蜗定向启动子。
可在本文中使用的多种启动子在本领域中是已知的。可在本文中使用的启动子的非限制性实例包括:人EF1a、人巨细胞病毒(CMV)(美国专利第5,168,062号)、人泛素C(UBC)、小鼠磷酸甘油酸激酶1、多瘤腺病毒、猿猴病毒40(SV40)、β-球蛋白、β-肌动蛋白、α-胎蛋白、γ-球蛋白、β-干扰素、γ-谷氨酰基转移酶、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒(Rous sarcoma virus)、大鼠胰岛素、甘油醛-3-磷酸脱氢酶、金属硫蛋白II(MT II)、淀粉酶、组织蛋白酶、MI蕈毒碱受体、逆转录病毒LTR(例如人T细胞白血病病毒HTLV)、AAVITR、白介素-2、胶原酶、血小板源性生长因子、腺病毒5E2、基质溶解素(stromelysin)、鼠MX基因、葡萄糖调控蛋白(GRP78和GRP94)、α-2-巨球蛋白、波形蛋白(vimentin)、I类MHC基因H-2κb、HSP70、增殖蛋白(proliferin)、肿瘤坏死因子、甲状腺刺激激素α基因、免疫球蛋白轻链、T细胞受体、HLA DQα和DQβ、白介素-2受体、II类MHC、II类MHC HLA-DRα、肌肉肌酸激酶、前白蛋白(转甲状腺素蛋白)、弹性蛋白酶I、白蛋白基因、c-fos、c-HA-ras、神经细胞粘附分子(NCAM)、H2B(TH2B)组蛋白、大鼠生长激素、人血清淀粉样蛋白(SAA)、肌钙蛋白I(troponin I,TN I)、杜兴肌营养不良(duchenne muscular dystrophy)蛋白、人免疫缺陷病毒以及长臂猿白血病病毒(GALV)启动子。启动子的额外实例在本领域中是已知的。参见例如Lodish,Molecular Cell Biology,Freeman and Company,New York2007。在一些实施方案中,启动子是CMV立即早期启动子。在一些实施方案中,启动子是CMV启动子,例如包含SEQ ID NO:21或由SEQ ID NO:21组成的CMV启动子。在一些实施方案中,启动子是CAG启动子或CAG/CBA启动子。在一些实施方案中,启动子是CBA启动子,例如包含SEQ ID NO:22或由SEQ ID NO:22组成的CBA启动子。
术语“组成型”启动子是指当与编码蛋白质(例如硬纤毛蛋白)的核酸可操作地连接时导致在哺乳动物细胞中在大多数或所有生理条件下从所述核酸转录RNA的核苷酸序列。
组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子(参见例如Boshart等人,Cell 41:521-530,1985)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1-α启动子(Invitrogen)。
诱导型启动子允许调控基因表达,并且可通过外源提供的化合物;环境因素诸如温度;或存在特定生理状态,例如急性期、细胞的特定分化状态或仅在复制细胞中,来调控。诱导型启动子和诱导型***可从多种商业来源包括但不限于Invitrogen、Clontech和Ariad获得。诱导型启动子的额外实例在本领域中是已知的。
通过外源提供的化合物来调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、***(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子***(WO 98/10088);蜕皮激素(ecdysone)昆虫启动子(No等人,Proc.Natl.Acad.Sci.U.S.A.93:3346-3351,1996)、四环素阻遏型***(Gossen等人,Proc.Natl.Acad.Sci.U.S.A.89:5547-5551,1992)、四环素诱导型***(Gossen等人,Science 268:1766-1769,1995,也参见Harvey等人,Curr.Opin.Chem.Biol.2:512-518,1998)、RU486诱导型***(Wang等人,Nat.Biotech.15:239-243,1997)以及Wang等人,GeneTher.4:432-441,1997)和雷帕霉素(rapamycin)诱导型***(Magari等人J.Clin.Invest.100:2865-2872,1997)。
术语“组织特异性”启动子是指仅在某些特定细胞类型和/或组织中具有活性的启动子(例如特定基因的转录仅在表达结合组织特异性启动子的转录调控蛋白的细胞内发生)。
在一些实施方案中,调控序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控序列结合以组织特异性方式诱导转录的组织特异性转录因子。
示例性组织特异性启动子包括但不限于以下:肝特异性甲状腺素结合球蛋白(TBG)启动子、胰岛素启动子、升糖素启动子、生长激素抑制素启动子、胰多肽(PPY)启动子、突触蛋白-1(Syn)启动子、肌酸激酶(MCK)启动子、哺乳动物肌间线蛋白(desmin,DES)启动子、α-肌球蛋白重链(a-MHC)启动子、以及心脏肌钙蛋白T(cTnT)启动子。额外示例性启动子包括β-肌动蛋白启动子、乙型肝炎病毒核心启动子(Sandig等人,Gene Ther.3:1002-1009,1996)、α-胎蛋白(AFP)启动子(Arbuthnot等人,Hum.Gene Ther.7:1503-1514,1996)、骨骨钙蛋白(osteocalcin)启动子(Stein等人,Mol.Biol.Rep.24:185-196,1997);骨唾液蛋白(sialoprotein)启动子(Chen等人,J.Bone Miner.Res.11:654-664,1996)、CD2启动子(Hansal等人,J.Immunol.161:1063-1068,1998);免疫球蛋白重链启动子;T细胞受体α链启动子、神经元性诸如神经元特异性烯醇化酶(NSE)启动子(Andersen等人,Cell.Mol.Neurobiol.13:503-515,1993)、神经丝轻链基因启动子(Piccioli等人,Proc.Natl.Acad.Sci.U.S.A.88:5611-5615,1991)、以及神经元特异性vgf基因启动子(Piccioli等人,Neuron 15:373-384,1995)。
在一些实施方案中,组织特异性启动子是耳蜗特异性启动子。在一些实施方案中,组织特异性启动子是耳蜗毛细胞特异性启动子。耳蜗毛细胞特异性启动子的非限制性实例包括但不限于:ATOH1启动子、POU4F3启动子、LHX3启动子、MYO7A启动子、MYO6启动子、α9ACHR启动子和α10ACHR启动子。在一些实施方案中,启动子是外毛细胞特异性启动子,诸如快蛋白(PRESTIN)启动子或癌调蛋白(ONCOMOD)启动子。参见例如Zheng等人,Nature 405:149-155,2000;Tian等人Dev.Dyn.231:199-203,2004;以及Ryan等人,Adv.Otorhinolaryngol.66:99-115,2009。
增强子和5’帽
在一些情况下,载体可包括启动子序列和/或增强子序列。术语“增强子”是指可使编码目标蛋白质(例如硬纤毛蛋白)的核酸的转录水平增加的核苷酸序列。增强子序列(长度是50-1500个碱基对)通常通过提供为转录相关蛋白(例如转录因子)所用的额外结合位点来使转录水平增加。在一些实施方案中,增强子序列见于内含子序列内。不同于启动子序列,增强子序列可在相距转录起始位点大得多的距离处起作用(例如相较于启动子)。增强子的非限制性实例包括RSV增强子、CMV增强子和SV40增强子。在一些实施方案中,CMV增强子序列包含SEQ ID NO:20或由SEQ ID NO:20组成。
多聚(A)序列
在一些实施方案中,本文提供的任何载体都可包括多聚(A)序列。大多数新生的真核mRNA在它们的3’末端具有在复杂过程期间添加的多聚(A)尾部,所述复杂过程包括对初级转录物的裂解,以及偶联多腺苷酸化反应(参见例如Proudfoot等人,Cell 108:501-512,2002)。多聚(A)尾部赋予mRNA稳定性和可转移性(Molecular Biology of the Cell,第三版,B.Alberts等人,Garland Publishing,1994)。在一些实施方案中,多聚(A)序列位于编码硬纤毛蛋白的C末端的核酸序列的3’。
如本文所用,“多腺苷酸化”是指多腺苷酰基部分或它的经修饰变体共价连接于信使RNA分子。在真核生物体中,大多数信使RNA(mRNA)分子在3'末端是多腺苷酸化的。3'多聚(A)尾部是通过酶即多腺苷酸聚合酶的作用来添加至前mRNA中的腺嘌呤核苷酸(例如50、60、70、100、200、500、1000、2000、3000、4000或5000个)的长序列。在高等真核生物中,多聚(A)尾部添加于含有特定序列即多腺苷酸化信号或“多聚(A)序列”的转录物上。多聚(A)尾部和结合于它的蛋白质有助于保护mRNA免遭由核酸外切酶达成的降解。多腺苷酸化对于转录终止、mRNA从核输出、以及翻译也是重要的。多腺苷酸化紧接在DNA转录成RNA之后在核中发生,但另外还可稍后在细胞质中发生。在转录已被终止之后,mRNA链通过与RNA聚合酶缔合的核酸内切酶复合物的作用来裂解。裂解位点的特征通常在于在裂解位点附近存在碱基序列AAUAAA。在mRNA已被裂解之后,腺苷残基在裂解位点处被添加至游离3'末端。
如本文所用,“多聚(A)序列”是触发核酸内切酶对mRNA的裂解以及一系列腺苷向经裂解mRNA的3’末端的添加的序列。
存在可使用的若干多聚(A)序列,包括源于牛生长激素(bgh)(Woychik等人,Proc.Natl.Acad.Sci.U.S.A.81(13):3944-3948,1984;美国专利第5,122,458号)、小鼠β-球蛋白、小鼠α-球蛋白(Orkin等人,EMBO J.4(2):453-456,1985;Thein等人,Blood 71(2):313-319,1988)、人胶原、多瘤病毒(Batt等人,Mol.Cell Biol.15(9):4783-4790,1995)、单纯疱疹病毒胸苷激酶基因(HSV TK)、IgG重链基因多腺苷酸化信号(US 2006/0040354)、人生长激素(hGH)(Szymanski等人,Mol.Therapy15(7):1340-1347,2007)、由SV40多聚(A)位点诸如SV40晚期和早期多聚(A)位点(Schek等人,Mol.Cell Biol.12(12):5386-5393,1992)组成的组的那些。在一些实施方案中,bGH多聚(A)序列包含SEQ ID NO:34或由SEQ IDNO:34组成。
多聚(A)序列可为序列AATAAA。AATAAA序列可用与AATAAA具有同源性,能够传导多腺苷酸化信号的其他六核苷酸序列替代,所述其他六核苷酸序列包括ATTAAA、AGTAAA、CATAAA、TATAAA、GATAAA、ACTAAA、AATATA、AAGAAA、AATAAT、AAAAAA、AATGAA、AATCAA、AACAAA、AATCAA、AATAAC、AATAGA、AATTAA或AATAAG(参见例如WO 06/12414)。
在一些实施方案中,多聚(A)序列可为合成多腺苷酸化位点(参见例如Promega的基于Levitt等人,Genes Dev.3(7):1019-1025,1989的pCl-neo表达载体)。在一些实施方案中,多聚(A)序列是可溶性神经纤毛蛋白-1(sNRP)的多腺苷酸化信号(AAATAAAATACGAAATG,SEQ ID NO:38)(参见例如WO 05/073384)。多聚(A)序列的额外实例在本领域中是已知的。
内部核糖体进入位点(IRES)
在一些实施方案中,编码硬纤毛蛋白的C末端的载体可包括多核苷酸内部核糖体进入位点(IRES)。IRES序列用于从单一基因转录物产生超过一个多肽。IRES形成允许从mRNA的紧靠在所述IRES所定位处的下游的任何位置发生翻译起始的复杂二级结构(参见例如Pelletier和Sonenberg,Mol.Cell.Biol.8(3):1103-1112,1988)。
存在为本领域技术人员所知的若干IRES序列,包括来自例如***病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)的那些。参见例如Alberts,MolecularBiology of the Cell,Garland Science,2002;以及Hellen等人,Genes Dev.15(13):1593-612,2001。
在一些实施方案中,并入编码硬纤毛蛋白的C末端的载体中的IRES序列是***病毒(FMDV)IRES序列。***病毒2A序列是一种已被显示会介导对多聚蛋白的裂解的小肽(长度是约18个氨基酸)(Ryan,M D等人,EMBO 4:928-933,1994;Mattion等人,J.Virology70:8124-8127,1996;Furler等人,Gene Therapy 8:864-873,2001;以及Halpin等人,Plant Journal 4:453-459,1999)。2A序列的裂解活性先前已在包括质粒和基因疗法载体(AAV和逆转录病毒)的人工***中证明(Ryan等人,EMBO 4:928-933,1994;Mattion等人,J.Virology70:8124-8127,1996;Furler等人,Gene Therapy 8:864-873,2001;以及Halpin等人,Plant Journal 4:453-459,1999;de Felipe等人,Gene Therapy 6:198-208,1999;de Felipe等人,Human Gene Therapy11:1921-1931,2000;以及Klump等人,GeneTherapy 8:811-817,2001)。
报告序列
本文提供的任何载体都可任选地包括编码报告蛋白的序列(“报告序列”)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和荧光素酶。报告序列的额外实例在本领域中是已知的。当与驱动它们的表达的调控元件相关联时,报告序列可提供可通过常规手段检测的信号,所述常规手段包括酶法测定、放射摄影测定、比色测定、荧光测定或其他光谱测定;荧光激活细胞分选(FACS)测定;免疫测定(例如酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学分析)。
在一些实施方案中,报告序列是turbo绿色荧光蛋白(tGFP)(SEQ ID NO:31)。
tGFP cDNA(SEQ ID NO:31)
Figure BDA0002959533770001251
tGFP蛋白(SEQ ID NO:32)
Figure BDA0002959533770001252
在一些实施方案中,报告序列是LacZ基因,并且携带所述LacZ基因的载体在哺乳动物细胞(例如耳蜗外毛细胞)中的存在性通过针对β-半乳糖苷酶活性的测定来检测。在其他实施方案中,报告体是荧光蛋白(例如绿色荧光蛋白)或荧光素酶,携带所述荧光蛋白或荧光素酶的载体在哺乳动物细胞(例如耳蜗外毛细胞)中的存在性可通过荧光技术(例如荧光显微术或FACS),或光度计(例如分光光度计或IVIS成像仪器)中的光产生来测量。在一些实施方案中,报告序列可用于验证本文所述的任何载体的组织特异性靶向能力和组织特异性启动子调控活性。
侧翼区非翻译区(UTR)
在一些实施方案中,本文所述的任何载体(例如至少两种不同载体中的任一者)都可包括非翻译区。在一些实施方案中,载体可包括5’UTR或3’UTR。
基因的非翻译区(UTR)被转录,但不被翻译。5'UTR起始于转录起始位点,并且延续至起始密码子,但不包括起始密码子。3'UTR紧接在终止密码子之后起始,并且延续直至转录终止信号。关于由UTR在核酸分子的稳定性和翻译方面所起的调控作用,存在处于增长中的一堆证据。可将UTR的调控特征并入如本文所述的任何载体、组合物、药盒或方法中以使硬纤毛蛋白的稳定性增强。
天然5'UTR包括在翻译起始中起作用的序列。它们具有如Kozak序列的特征,通常已知的是,所述Kozak序列涉及于核糖体使许多基因的翻译起始所采用的过程中。Kozak序列具有共有序列CCR(A/G)CCAUGG,其中R是在起始密码子(AUG)的上游三个碱基处的嘌呤(A或G),所述起始密码子继之以另一“G”。还已知5'UTR例如形成涉及于延伸因子结合中的二级结构。
举例来说,在一些实施方案中,5’UTR被包括在本文所述的任何载体中。5’UTR的非限制性实例,包括来自以下基因的那些:白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、α胎蛋白、红血球生成素和因子VIII,可用于使核酸分子诸如mRNA的表达增强。
在一些实施方案中,来自由耳蜗中的细胞转录的mRNA的5’UTR可被包括在本文所述的任何载体、组合物、药盒和方法中。
已知的是,3'UTR具有腺苷和嵌入它们之中的尿苷的链段。这些富含AU的特征在具有高转换速率的基因中是特别普遍的。基于它们的序列特征和功能性质,富含AU的元件(ARE)可被分成三个类别(Chen等人,Mol.Cell.Biol.15:5777-5788,1995;Chen等人,Mol.Cell Biol.15:2010-2018,1995):I类ARE在富含U的区域内含有AUUUA基序的若干分散拷贝。举例来说,c-Myc和MyoD mRNA含有I类ARE。II类ARE具有两个或更多个重叠UUAUUUA(U/A)(U/A)九聚体。GM-CSF和TNF-αmRNA是含有II类ARE的实例。III类ARE的定义不太明确。这些富含U的区域不含有AUUUA基序。这个类别的两个充分研究的实例是c-Jun和肌细胞生成素(myogenin)mRNA。
已知的是,大多数结合ARE的蛋白质使信使去稳定,而ELAV家族的成员,最特别是HuR,已有文件记载使mRNA的稳定性增加。HuR结合所有三个类别的ARE。将HuR特异性结合位点工程改造至核酸分子的3'UTR中将导致HuR结合,因此,导致体内信息的稳定化。
一示例性人野生型5’UTR是或包括SEQ ID NO:24的序列。一示例性人野生型3’UTR是或包括SEQ ID NO:33的序列。
在本文所述的任何组合物的一些实施方案中,5’UTR、3’UTR或两者被包括在载体(例如本文所述的任何载体)中。举例来说,本文所述的任何5’UTR都可操作性地连接于本文所述的任何编码序列中的起始密码子。举例来说,任何3’UTR都可操作性地连接于本文所述的任何编码序列中的3'-终末密码子(末个密码子)。
在本文所述的任何组合物的一些实施方案中,5’UTR包含来自SEQ ID NO:24内的任何地方的至少10个连续(例如至少15个连续、至少20个连续、至少25个连续、至少30个连续、至少35个连续、至少40个连续、至少45个连续、至少50个连续、至少55个连续、至少60个连续、至少65个连续或至少70个连续)核苷酸。
举例来说,5’UTR可包括以下中的一者或多者或由以下中的一者或多者组成:SEQID NO:24的核苷酸位置1至70、核苷酸位置1至60、核苷酸位置1至50、核苷酸位置1至40、核苷酸位置1至30、核苷酸位置1至20、核苷酸位置1至10、核苷酸位置10至70、核苷酸位置10至60、核苷酸位置10至50、核苷酸位置10至40、核苷酸位置10至30、核苷酸位置10至20、核苷酸位置20至70、核苷酸位置20至60、核苷酸位置20至50、核苷酸位置20至40、核苷酸位置20至30、核苷酸位置30至70、核苷酸位置30至60、核苷酸位置30至50、核苷酸位置30至40、核苷酸位置40至70、核苷酸位置40至60、核苷酸位置40至50、核苷酸位置50至70、核苷酸位置50至60、核苷酸位置60至70、核苷酸位置100至105。
在本文所述的任何组合物的一些实施方案中,5’UTR包含与SEQ ID NO:24具有至少70%(例如至少75%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)同一性的序列。
在本文所述的任何组合物的一些实施方案中,3’UTR包含来自SEQ ID NO:33内的任何地方的至少10个连续(例如至少15个连续、至少20个连续、至少25个连续、至少30个连续、至少35个连续、至少40个连续、至少45个连续、至少50个连续、至少55个连续、至少60个连续、至少65个连续、至少70个连续、至少75个连续、至少80个连续、至少85个连续、至少90个连续、至少95个连续、至少100个连续或至少105个连续)核苷酸。
举例来说,3’UTR可包括以下中的一者或多者或由以下中的一者或多者组成:SEQID NO:33的核苷酸位置1至107、核苷酸位置1至105、核苷酸位置1至100、核苷酸位置1至90、核苷酸位置1至80、核苷酸位置1至70、核苷酸位置1至60、核苷酸位置1至50、核苷酸位置1至40、核苷酸位置1至30、核苷酸位置1至20、核苷酸位置1至10、核苷酸位置10至107、核苷酸位置10至105、核苷酸位置10至100、核苷酸位置10至90、核苷酸位置10至80、核苷酸位置10至70、核苷酸位置10至60、核苷酸位置10至50、核苷酸位置10至40、核苷酸位置10至30、核苷酸位置10至20、核苷酸位置20至107、核苷酸位置20至105、核苷酸位置20至100、核苷酸位置20至90、核苷酸位置20至80、核苷酸位置20至70、核苷酸位置20至60、核苷酸位置20至50、核苷酸位置20至40、核苷酸位置20至30、核苷酸位置30至107、核苷酸位置30至105、核苷酸位置30至100、核苷酸位置30至90、核苷酸位置30至80、核苷酸位置30至70、核苷酸位置30至60、核苷酸位置30至50、核苷酸位置30至40、核苷酸位置40至107、核苷酸位置40至105、核苷酸位置40至100、核苷酸位置40至90、核苷酸位置40至80、核苷酸位置40至70、核苷酸位置40至60、核苷酸位置40至50、核苷酸位置50至107、核苷酸位置50至105、核苷酸位置50至100、核苷酸位置50至90、核苷酸位置50至80、核苷酸位置50至70、核苷酸位置50至60、核苷酸位置60至、核苷酸位置60至107、核苷酸位置60至105、核苷酸位置60至100、核苷酸位置60至90、核苷酸位置60至80、核苷酸位置60至70、核苷酸位置70至107、核苷酸位置70至105、核苷酸位置70至100、核苷酸位置70至90、核苷酸位置70至80、核苷酸位置80至107、核苷酸位置80至105、核苷酸位置80至100、核苷酸位置80至90、核苷酸位置90至107、核苷酸位置90至105、核苷酸位置90至100、核苷酸位置100至107、核苷酸位置100至105。
在本文所述的任何组合物的一些实施方案中,3’UTR包含与SEQ ID NO:33具有至少70%(例如至少75%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)同一性的序列。
STRC的人5’UTR(SEQ ID NO:24)
Figure BDA0002959533770001291
STRC的人3’UTR(SEQ ID NO:33)
Figure BDA0002959533770001292
在一些实施方案中,引入、移除或修饰3'UTR ARE可用于调节编码硬纤毛蛋白的mRNA的稳定性。在其他实施方案中,ARE可被移除或突变以使细胞内稳定性增加,因此使硬纤毛蛋白的翻译和产生增加。
在其他实施方案中,非UTR序列可并入5'或3'UTR中。在一些实施方案中,内含子或内含子序列的部分可并入本文提供的任何载体、组合物、药盒和方法中的多核苷酸的侧翼区中。内含子序列的并入可使蛋白质产生以及mRNA水平增加。内含子可为来自硬纤毛蛋白基因的内含子,或可为来自异源性基因的内含子,例如杂合腺病毒/小鼠免疫球蛋白内含子(Yew等人,Human Gene Ter.8(5):575-584,1997)、SV40内含子(Ostedgaard等人,Proc.Natl.Acad.Sci.U.S.A.102(8):2952-2957,2005)、MVM内含子(Wu等人,Mol.Ther.16(2):280-289,2008)、因子IX截短内含子1(Wu等人,Mol.Ther.16(2):280-289,2008;Kurachi等人,J.Biol.Chem.270(10):5276-5281,1995)、嵌合β-球蛋白剪接供体/免疫球蛋白重链剪接接受体内含子(Wu等人,Mol.Ther.16(2):280-289,2008;Choi等人,Mol.Brain7:17,2014)、SV40晚期剪接供体/剪接接受体内含子(19S/16S)(Yew等人,Human GeneTher.8(5):575-584,1997)、杂合腺病毒剪接供体/Igg剪接接受体(Choi等人,Mol.Brain7:17,1991;Huang和Gorman,Mol.Cell Biol.10(4):1805-1810,1990)。
剪接供体和剪接接受体序列的非限制性实例分别是SEQ ID NO:6和7。
在本文所述的任何载体的一些实施方案中,载体包括嵌合内含子序列(SEQ IDNO:23)。
在本文所述的任何载体的一些实施方案中,载体包括T2A序列(SEQ ID NO:29)。
T2A cDNA序列(SEQ ID NO:29)
Figure BDA0002959533770001301
T2A蛋白(SEQ ID NO:30)
Figure BDA0002959533770001302
额外序列
本文提供的任何载体都可任选地包括额外核苷酸序列(“填充序列”)以使载体中碱基对的总数最优化。举例来说,为使包装最优化,每种载体可被设计来含有总计约4,000个碱基对至约4,700个碱基对,例如约4,000个碱基对至约4,650个碱基对、约4,000个碱基对至约4,600个碱基对、约4,000个碱基对至约4,550个碱基对、约4,000个碱基对至约4,500个碱基对、约4,000个碱基对至约4,450个碱基对、约4,000个碱基对至约4,400个碱基对、约4,000个碱基对至约4,350个碱基对、约4,000个碱基对至约4,300个碱基对、约4,000个碱基对至约4,250个碱基对、约4,000个碱基对至约4,200个碱基对、约4,000个碱基对至约4,150个碱基对、约4,000个碱基对至约4,100个碱基对、约4,000个碱基对至约4,050个碱基对、约4,050个碱基对至约4,700个碱基对、约4,050个碱基对至约4,650个碱基对、约4,050个碱基对至约4,600个碱基对、约4,050个碱基对至约4,550个碱基对、约4,050个碱基对至约4,500个碱基对、约4,050个碱基对至约4,450个碱基对、约4,050个碱基对至约4,400个碱基对、约4,050个碱基对至约4,350个碱基对、约4,050个碱基对至约4,300个碱基对、约4,050个碱基对至约4,250个碱基对、约4,050个碱基对至约4,200个碱基对、约4,050个碱基对至约4,150个碱基对、约4,050个碱基对至约4,100个碱基对、约4,100个碱基对至约4,700个碱基对、约4,100个碱基对至约4,650个碱基对、约4,100个碱基对至约4,600个碱基对、约4,100个碱基对至约4,550个碱基对、约4,100个碱基对至约4,500个碱基对、约4,100个碱基对至约4,450个碱基对、约4,100个碱基对至约4,400个碱基对、约4,100个碱基对至约4,350个碱基对、约4,100个碱基对至约4,300个碱基对、约4,100个碱基对至约4,250个碱基对、约4,100个碱基对至约4,200个碱基对、约4,100个碱基对至约4,150个碱基对、约4,150个碱基对至约4,700个碱基对、约4,150个碱基对至约4,650个碱基对、约4,150个碱基对至约4,600个碱基对、约4,150个碱基对至约4,550个碱基对、约4,150个碱基对至约4,500个碱基对、约4,150个碱基对至约4,450个碱基对、约4,150个碱基对至约4,400个碱基对、约4,150个碱基对至约4,350个碱基对、约4,150个碱基对至约4,300个碱基对、约4,150个碱基对至约4,250个碱基对、约4,150个碱基对至约4,200个碱基对、约4,200个碱基对至约4,700个碱基对、约4,200个碱基对至约4,650个碱基对、约4,200个碱基对至约4,600个碱基对、约4,200个碱基对至约4,550个碱基对、约4,200个碱基对至约4,500个碱基对、约4,200个碱基对至约4,450个碱基对、约4,200个碱基对至约4,400个碱基对、约4,200个碱基对至约4,350个碱基对、约4,200个碱基对至约4,300个碱基对、约4,200个碱基对至约4,250个碱基对、约4,250个碱基对至约4,700个碱基对、约4,250个碱基对至约4,650个碱基对、约4,250个碱基对至约4,600个碱基对、约4,250个碱基对至约4,550个碱基对、约4,250个碱基对至约4,500个碱基对、约4,250个碱基对至约4,450个碱基对、约4,250个碱基对至约4,400个碱基对、约4,250个碱基对至约4,350个碱基对、约4,250个碱基对至约4,300个碱基对、约4,300个碱基对至约4,700个碱基对、约4,300个碱基对至约4,650个碱基对、约4,300个碱基对至约4,600个碱基对、约4,300个碱基对至约4,550个碱基对、约4,300个碱基对至约4,500个碱基对、约4,300个碱基对至约4,450个碱基对、约4,300个碱基对至约4,400个碱基对、约4,300个碱基对至约4,350个碱基对、约4,350个碱基对至约4,700个碱基对、约4,350个碱基对至约4,650个碱基对、约4,350个碱基对至约4,600个碱基对、约4,350个碱基对至约4,550个碱基对、约4,350个碱基对至约4,500个碱基对、约4,350个碱基对至约4,450个碱基对、约4,350个碱基对至约4,400个碱基对、约4,400个碱基对至约4,700个碱基对、约4,400个碱基对至约4,650个碱基对、约4,400个碱基对至约4,600个碱基对、约4,400个碱基对至约4,550个碱基对、约4,400个碱基对至约4,500个碱基对、约4,400个碱基对至约4,450个碱基对、约4,450个碱基对至约4,700个碱基对、约4,450个碱基对至约4,650个碱基对、约4,450个碱基对至约4,600个碱基对、约4,450个碱基对至约4,550个碱基对、约4,450个碱基对至约4,500个碱基对、约4,500个碱基对至约4,700个碱基对、约4,500个碱基对至约4,650个碱基对、约4,500个碱基对至约4,600个碱基对、约4,500个碱基对至约4,550个碱基对、约4,550个碱基对至约4,700个碱基对、约4,550个碱基对至约4,650个碱基对、约4,550个碱基对至约4,600个碱基对、约4,600个碱基对至约4,700个碱基对、约4,600个碱基对至约4,650个碱基对、或约4,650个碱基对至约4,700个碱基对(包括端值)。
填充序列可为例如多达1000bp的任何核苷酸序列,所述任何核苷酸序列可被包括在本文所述的任何载体中,不被转录,并且不发挥调控功能,为的是实现合乎需要的载体大小(例如约4kb至约5kb的载体大小,或本文提供的任何载体大小)。举例来说,填充序列可为约100bp至约1000bp(例如约100bp至约900bp、约100bp至约850bp、约100bp至约800bp、约100bp至约750bp、约100bp至约700bp、约100bp至约650bp、约100bp至约600bp、约100bp至约550bp、约100bp至约500bp、约100bp至约450bp、约100bp至约400bp、约100bp至约350bp、约100bp至约300bp、约100bp至约250bp、约100bp至约200bp、约100bp至约150bp、约150bp至约1000bp、约150bp至约900bp、约150bp至约850bp、约150bp至约800bp、约150bp至约750bp、约150bp至约700bp、约150bp至约650bp、约150bp至约600bp、约150bp至约550bp、约150bp至约500bp、约150bp至约450bp、约150bp至约400bp、约150bp至约350bp、约150bp至约300bp、约150bp至约250bp、约150bp至约200bp、约200bp至约1000bp、约200bp至约900bp、约200bp至约850bp、约200bp至约800bp、约200bp至约750bp、约200bp至约700bp、约200bp至约650bp、约200bp至约600bp、约200bp至约550bp、约200bp至约500bp、约200bp至约450bp、约200bp至约400bp、约200bp至约350bp、约200bp至约300bp、约200bp至约250bp、约250bp至约1000bp、约250bp至约900bp、约250bp至约850bp、约250bp至约800bp、约250bp至约750bp、约250bp至约700bp、约250bp至约650bp、约250bp至约600bp、约250bp至约550bp、约250bp至约500bp、约250bp至约450bp、约250bp至约400bp、约250bp至约350bp、约250bp至约300bp、约300bp至约1000bp、约300bp至约900bp、约300bp至约850bp、约300bp至约800bp、约300bp至约750bp、约300bp至约700bp、约300bp至约650bp、约300bp至约600bp、约300bp至约550bp、约300bp至约500bp、约300bp至约450bp、约300bp至约400bp、约300bp至约350bp、约350bp至约1000bp、约350bp至约900bp、约350bp至约850bp、约350bp至约800bp、约350bp至约750bp、约350bp至约700bp、约350bp至约650bp、约350bp至约600bp、约350bp至约550bp、约350bp至约500bp、约350bp至约450bp、约350bp至约400bp、约400bp至约1000bp、约400bp至约900bp、约400bp至约850bp、约400bp至约800bp、约400bp至约750bp、约400bp至约700bp、约400bp至约650bp、约400bp至约600bp、约400bp至约550bp、约400bp至约500bp、约400bp至约450bp、约450bp至约1000bp、约450bp至约900bp、约450bp至约850bp、约450bp至约800bp、约450bp至约750bp、约450bp至约700bp、约450bp至约650bp、约450bp至约600bp、约450bp至约550bp、约450bp至约500bp、约500bp至约1000bp、约500bp至约900bp、约500bp至约850bp、约500bp至约800bp、约500bp至约750bp、约500bp至约700bp、约500bp至约650bp、约500bp至约600bp、约500bp至约550bp、约550bp至约1000bp、约550bp至约900bp、约550bp至约850bp、约550bp至约800bp、约550bp至约750bp、约550bp至约700bp、约550bp至约650bp、约550bp至约600bp、约600bp至约1000bp、约600bp至约900bp、约600bp至约850bp、约600bp至约800bp、约600bp至约750bp、约600bp至约700bp、约600bp至约650bp、约650bp至约1000bp、约650bp至约900bp、约650bp至约850bp、约650bp至约800bp、约650bp至约750bp、约650bp至约700bp、约700bp至约1000bp、约700bp至约900bp、约700bp至约850bp、约700bp至约800bp、约700bp至约750bp、约750bp至约1000bp、约750bp至约900bp、约750bp至约850bp、约750bp至约800bp、约800bp至约1000bp、约800bp至约900bp、约800bp至约850bp、约850bp至约1000bp、约850bp至约900bp、约900bp至约1000bp、约900至约950bp、或约950bp至约1000bp)的任何核苷酸序列。SEQ ID NO.19、35和37是可用于本文所述的任何载体中的示例性人因子FVIII填充序列。额外填充序列在本领域中是已知的。包括填充序列的示例性载体显示于图1、图2和图4中。
哺乳动物细胞
本文还提供了一种包括本文所述的任何核酸、载体(例如本文所述的至少两种不同载体)或组合物的细胞(例如哺乳动物细胞)。熟练从业者将了解,本文所述的核酸和载体可被引入任何哺乳动物细胞中。载体以及用于将载体引入哺乳动物细胞中的方法的非限制性实例在本文中加以描述。
在一些实施方案中,细胞是人细胞、小鼠细胞、猪细胞、兔细胞、犬细胞、猫细胞、大鼠细胞或非人灵长类动物细胞。在一些实施方案中,细胞是耳蜗的特化细胞。在一些实施方案中,细胞是耳蜗内毛细胞或耳蜗外毛细胞。在一些实施方案中,细胞是耳蜗内毛细胞。在一些实施方案中,细胞是耳蜗外毛细胞。
在一些实施方案中,哺乳动物细胞在体外。在一些实施方案中,哺乳动物细胞存在于哺乳动物中。在一些实施方案中,哺乳动物细胞是从受试者获得,并且加以离体培养的自体细胞。
方法
本文还提供了一种向哺乳动物(例如人)的耳蜗中引入治疗有效量的本文所述的任何组合物的方法。还提供了使哺乳动物(例如人)的耳蜗中的外毛细胞中的活性硬纤毛蛋白(例如全长硬纤毛蛋白)的表达增加的方法,所述方法包括向所述哺乳动物的所述耳蜗中引入治疗有效量的本文所述的任何组合物。还提供了治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者(例如人)的非症状性感觉神经性听力损失的方法,其中所述方法包括向受试者的耳蜗中施用治疗有效量的本文所述的任何组合物。
在这些方法中的任一者的一些实施方案中,哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因(例如具有导致由硬纤毛蛋白基因编码的硬纤毛蛋白的表达和/或活性降低的突变的所述硬纤毛蛋白基因)。这些方法中的任一者的一些实施方案还包括在引入或施用步骤之前确定受试者具有缺陷性硬纤毛蛋白基因。这些方法中的任一者的一些实施方案可还包括检测受试者中硬纤毛蛋白基因中的突变。任何方法的一些实施方案可还包括将受试者鉴定或诊断为患有非症状性感觉神经性听力损失。
在这些方法中的任一者的一些实施方案中,向哺乳动物或受试者的耳蜗中引入或施用两剂或更多剂本文所述的任何组合物。这些方法中的任一者的一些实施方案可包括向哺乳动物或受试者的耳蜗中引入或施用第一剂组合物,在引入或施用所述第一剂之后评估所述哺乳动物或受试者的听力功能,以及向被发现不具有在正常范围内的听力功能(例如如使用本领域中已知的任何听力测试所测定)的哺乳动物或受试者的耳蜗中施用额外剂量的组合物。
在本文所述的任何方法的一些实施方案中,组合物可被配制用于耳蜗内施用。在本文所述的任何方法的一些实施方案中,本文所述的组合物可通过耳蜗内施用或局部施用来施用。在本文所述的任何方法的一些实施方案中,组合物通过使用医学装置(例如本文所述的任何示例性医学装置)来施用。
在一些实施方案中,耳蜗内施用可使用本文所述或本领域中已知的任何方法进行。举例来说,组合物可使用以下手术技术来向耳蜗中施用或引入:首先在使用以0度、2.5-mm刚性内窥镜进行显像的情况下,对外耳道进行清洁,并且使用圆刀来清晰勾划约5mm鼓室耳道皮瓣。接着将鼓室耳道皮瓣提升,并且在后面进入中耳。识别并分开鼓索神经,并且使用刮器来移除盾骨,从而暴露圆窗膜。为使所施用或引入的组合物的顶端分布增强,可使用手术激光来在卵圆窗中产生小型2-mm开窗以允许在跨圆窗膜输注组合物期间达成外淋巴位移。接着启动微量输注装置,并且带入手术区中。装置向圆窗进行运用,并且使顶端坐落在骨性圆窗悬突内以允许一个或多个微针对膜的穿透。用脚踏板进行接合以允许计量化稳定输注组合物。接着取出装置,并且用明胶海绵贴片密封圆窗和镫骨底板。
在本文所述的任何方法的一些实施方案中,受试者或哺乳动物是啮齿动物、非人灵长类动物或人。在本文所述的任何方法的一些实施方案中,受试者或哺乳动物是成人、少年、青少年、儿童、学步儿、婴儿或新生儿。在本文所述的任何方法的一些实施方案中,受试者或哺乳动物处于1-5、1-10、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、1-110、2-5、2-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-110、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-110、30-50、30-60、30-70、30-80、30-90、30-100、40-60、40-70、40-80、40-90、40-100、50-70、50-80、50-90、50-100、60-80、60-90、60-100、70-90、70-100、70-110、80-100、80-110、或90-110岁。在本文所述的任何方法的一些实施方案中,受试者或哺乳动物处于1、2、3、4、5、6、7、8、9、10或11月龄。
在本文所述的任何方法的一些实施方案中,受试者或哺乳动物患有非综合征性感觉神经性听力损失或处于显现非综合征性感觉神经性听力损失的风险下。在本文所述的任何方法的一些实施方案中,受试者或哺乳动物先前已被鉴定为在硬纤毛蛋白基因中具有突变。(此处对“硬纤毛蛋白基因”的所有提及都指的是不是硬纤毛蛋白假基因的基因)。在本文所述的任何方法的一些实施方案中,受试者或哺乳动物在硬纤毛蛋白基因中具有本文描述或本领域中已知为与非症状性感觉神经性听力损失相关的任何突变。
在本文所述的任何方法的一些实施方案中,受试者或哺乳动物已被鉴定为是硬纤毛蛋白基因中的突变的携带者(例如通过遗传测试)。在本文所述的任何方法的一些实施方案中,受试者或人已被鉴定为在硬纤毛蛋白基因中具有突变,并且已被诊断有非症状性感觉神经性听力损失。在本文所述的任何方法的一些实施方案中,受试者或人已被鉴定为患有非症状性感觉神经性听力损失。
在一些实施方案中,对非症状性感觉神经性听力损失的成功治疗可在受试者中使用本领域中已知的任何常规功能性听力测试来确定。功能性听力测试的非限制性实例是各种类型的测听测定(例如纯音测试、言语测试、中耳测试、听性脑干响应以及耳声发射)。
本文还提供了使哺乳动物细胞中活性硬纤毛蛋白(例如全长硬纤毛蛋白)的表达增加的方法,所述方法包括将本文所述的任何组合物引入所述哺乳动物细胞中。在这些方法的一些实施方案中,哺乳动物细胞是耳蜗外毛细胞。在这些方法的一些实施方案中,哺乳动物细胞是人细胞(例如人耳蜗外毛细胞)。在这些方法的一些实施方案中,哺乳动物细胞在体外。在这些方法的一些实施方案中,哺乳动物细胞在哺乳动物中。在这些方法的一些实施方案中,哺乳动物细胞最初从哺乳动物获得,并且加以离体培养。在一些实施方案中,哺乳动物细胞先前已被确定为具有缺陷性硬纤毛蛋白基因。
用于将本文所述的任何组合物引入哺乳动物细胞中的方法在本领域中是已知的(例如通过脂质体转染或通过使用病毒载体,例如本文所述的任何病毒载体)。
如本文所述的活性硬纤毛蛋白(例如全长硬纤毛蛋白)的表达增加是例如相较于对照或相较于在引入一种或多种载体之前的活性硬纤毛蛋白(例如全长硬纤毛蛋白)表达水平来说的。
检测硬纤毛蛋白的表达和/或活性的方法在本领域中是已知的。在一些实施方案中,可直接检测硬纤毛蛋白的表达水平(例如检测硬纤毛蛋白或检测硬纤毛蛋白mRNA)。可用于直接检测硬纤毛蛋白的表达和/或活性的技术的非限制性实例包括:实时PCR、蛋白质印迹、免疫沉淀、免疫组织化学分析或免疫荧光。在一些实施方案中,可间接检测硬纤毛蛋白的表达(例如通过功能性听力测试)。
药物组合物和药盒
在一些实施方案中,本文所述的任何组合物都可还包括促进本文所述的核酸或任何载体进入哺乳动物细胞中的一种或多种剂(例如脂质体或阳离子脂质)。在一些实施方案中,本文所述的任何载体都可使用天然和/或合成聚合物来配制。可被包括在本文所述的任何组合物中的聚合物的非限制性实例可包括但不限于DYNAMIC
Figure BDA0002959533770001391
(Arrowhead Research Corp.,Pasadena,Calif.)、来自Mirus Bio(Madison,Wis.)和RocheMadison(Madison,Wis.)的制剂、PhaseRX聚合物制剂诸如但不限于SMARTT POLYMER
Figure BDA0002959533770001392
(PhaseRX,Seattle,Wash.)、DMRI/DOPE、泊洛沙姆(poloxamer)、来自Vical(San Diego,Calif.)的
Figure BDA0002959533770001393
佐剂、壳聚糖、来自CalandoPharmaceuticals(Pasadena,Calif.)的环糊精、树状体和聚(乳酸-共-乙醇酸)(PLGA)聚合物、RONDELTM(RNAi/寡核苷酸纳米颗粒递送)聚合物(Arrowhead Research Corporation,Pasadena,Calif.)、以及pH响应性共嵌段聚合物,诸如但不限于由PhaseRX(Seattle,Wash.)生产的那些。这些聚合物中的许多已在将寡核苷酸在体内递送至哺乳动物细胞中这个方面显示功效(参见例如deFougerolles,Human Gene Ther.19:125-132,2008;Rozema等人,Proc.Natl.Acad.Sci.U.S.A.104:12982-12887,2007;Rozema等人,Proc.Natl.Acad.Sci.U.S.A.104:12982-12887,2007;Hu-Lieskovan等人,Cancer Res.65:8984-8982,2005;Heidel等人,Proc.Natl.Acad.Sci.U.S.A.104:5715-5721,2007)。
本文所述的任何组合物都可为例如药物组合物。药物组合物可包括本文所述的任何组合物以及一种或多种药学上或生理上可接受的载体、稀释剂或赋形剂。这类组合物可包含一种或多种缓冲剂,诸如中性缓冲盐水、磷酸盐缓冲盐水等;一种或多种碳水化合物,诸如葡萄糖、甘露糖、蔗糖和右旋糖酐;甘露糖醇;一种或多种蛋白质、多肽或氨基酸,诸如甘氨酸;一种或多种抗氧化剂;一种或多种螯合剂,诸如EDTA或谷胱甘肽;和/或一种或多种防腐剂。
在一些实施方案中,组合物包括药学上可接受的载体(例如磷酸盐缓冲盐水、盐水、或抑菌水)。在配制后,溶液将以可与剂量制剂相容的方式,并且以诸如治疗有效的量施用。制剂易于以多种剂型诸如可注射溶液、可注射凝胶剂、药物释放胶囊等施用。
如本文所用,术语“药学上可接受的载体”包括可与药物施用相容的溶剂、分散介质、包覆剂、抗细菌剂、抗真菌剂等。还可将补充性活性化合物并入本文所述的任何组合物中。
在一些实施方案中,单剂本文所述的任何组合物可包括例如处于缓冲溶液中的至少两种不同载体的以下总量:至少1ng、至少2ng、至少4ng、约6ng、约8ng、至少10ng、至少20ng、至少30ng、至少40ng、至少50ng、至少60ng、至少70ng、至少80ng、至少90ng、至少100ng、至少200ng、至少300ng、至少400ng、至少500ng、至少1μg、至少2μg、至少4μg、至少6μg、至少8μg、至少10μg、至少12μg、至少14μg、至少16μg、至少18μg、至少20μg、至少22μg、至少24μg、至少26μg、至少28μg、至少30μg至少32μg、至少34μg、至少36μg、至少38μg、至少40μg、至少42μg、至少44μg、至少46μg、至少48μg、至少50μg、至少52μg、至少54μg、至少56μg、至少58μg、至少60μg、至少62μg、至少64μg、至少66μg、至少68μg、至少70μg、至少72μg、至少74μg、至少76μg、至少78μg、至少80μg、至少82μg、至少84μg、至少86μg、至少88μg、至少90μg、至少92μg、至少94μg、至少96μg、至少98μg、至少100μg、至少102μg、至少104μg、至少106μg、至少108μg、至少110μg、至少112μg、至少114μg、至少116μg、至少118μg、至少120μg、至少122μg、至少124μg、至少126μg、至少128μg、至少130μg至少132μg、至少134μg、至少136μg、至少138μg、至少140μg、至少142μg、至少144μg、至少146μg、至少148μg、至少150μg、至少152μg、至少154μg、至少156μg、至少158μg、至少160μg、至少162μg、至少164μg、至少166μg、至少168μg、至少170μg、至少172μg、至少174μg、至少176μg、至少178μg、至少180μg、至少182μg、至少184μg、至少186μg、至少188μg、至少190μg、至少192μg、至少194μg、至少196μg、至少198μg或至少200μg。
本文提供的组合物可例如被配制以可与它们的预定施用途径相容。预定施用途径的一非限制性实例是局部施用(例如耳蜗内施用)。
在一些实施方案中,治疗性组合物被配制以包括脂质纳米颗粒。在一些实施方案中,治疗性组合物被配制以包括聚合纳米颗粒。在一些实施方案中,治疗性组合物被配制以包含小环DNA。在一些实施方案中,治疗性组合物被配制以包含CELiD DNA。在一些实施方案中,治疗性组合物被配制以包含合成外淋巴溶液。一示例性合成外淋巴溶液包括20-200mMNaCl;1-5mM KCl;0.1-10mM CaCl2;1-10mM葡萄糖;2-50mM HEPES,具有在约6与约9之间的pH。
还提供了包括本文所述的任何组合物的药盒。在一些实施方案中,药盒可包括固体组合物(例如包括本文所述的至少两种不同载体的冻干组合物)和用于使冻干组合物溶解的液体。在一些实施方案中,药盒可包括预装载注射器,所述预装载注射器包括本文所述的任何组合物。
在一些实施方案中,药盒包括包含本文所述的任何组合物(例如配制成水性组合物,例如水性药物组合物)的小瓶。
在一些实施方案中,药盒可包括关于进行本文所述的任何方法的说明书。
施用途径
适于可注射使用的药物形式包括无菌水性溶液或分散液以及用于临时制备无菌可注射溶液或分散液的无菌粉末。还可于甘油、液体聚乙二醇以及它们的混合物中以及于油中制备分散液。在一般储存和使用条件下,这些制剂含有防腐剂以防止微生物生长。在许多情况下,形式是无菌的,并且就存在容易可注射性而言是流体。它在制造和储存条件下必须是稳定的,并且必须针对微生物诸如细菌和真菌的污染作用进行防腐。载体可为含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)、它们的适合混合物和/或植物油的溶剂或分散介质。适当流动性可例如通过使用包覆剂诸如卵磷脂,在分散液的情况下通过维持所需粒径,以及通过使用表面活性剂加以维持。防止微生物作用可通过各种抗细菌剂和抗真菌剂例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等来达成。在许多情况下,将优选的是包括等张剂,例如糖或氯化钠。延长可注射组合物的吸收可通过在组合物中使用延迟吸收剂,例如单硬脂酸铝和明胶来达成。
对于可注射水溶液的施用,举例来说,如果必要,那么所述溶液可加以适合缓冲,并且首先用足够盐水或葡萄糖致使液体稀释剂等张。这些特定水溶液尤其适于静脉内、肌肉内、皮下和腹膜内施用。就此而论,可采用的无菌水性介质将为本领域技术人员所知。举例来说,可将一剂溶解于1ml等张NaCl溶液中,并且添加至1000ml皮下灌注液中或在提出的输注部位处进行注射(参见例如“Remington's Pharmaceutical Sciences”第15版,第1035-1038以及1570-1580页)。视宿主的状况而定,某一剂量变化将必定存在。在任何情况下,负责施用的人士都将确定适于单个宿主的剂量。
无菌可注射溶液通过将活性AAV以所需量根据需要与本文列举的各种其他成分一起并入适当溶剂中,随后进行过滤灭菌来制备。通常,分散液通过将各种灭菌活性成分并入含有基础分散介质和来自以上列举的那些成分的所需其他成分的无菌媒介物中来制备。在用于制备无菌可注射溶液的无菌粉末的情况下,优选制备方法是真空干燥和冷冻干燥技术,所述技术产生活性成分外加来自其先前无菌过滤溶液的任何额外所需成分的粉末。
本文公开的任何组合物都还可以中性或盐形式配制。药学上可接受的盐包括酸加成盐(采用蛋白质的游离氨基加以形成),并且所述酸加成盐采用无机酸诸如像盐酸或磷酸,或诸如乙酸、草酸、酒石酸、杏仁酸等的有机酸加以形成。采用游离羧基形成的盐还可源于无机碱,诸如像氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁;以及诸如异丙胺、三甲胺、组氨酸、普鲁卡因等的有机碱。在配制后,溶液将以可与剂量制剂相容的方式,并且以诸如治疗有效的量施用。制剂易于以多种剂型诸如可注射溶液、药物释放胶囊等施用。
如本文所用,“载体”包括任何和所有溶剂、分散介质、媒介物、包覆剂、稀释剂、抗细菌剂和抗真菌剂、等张剂和吸收延迟剂、缓冲剂、载体溶液、混悬液、胶体等。关于药物活性物质使用这类介质和剂在本领域中是熟知的。还可将补充性活性成分并入组合物中。短语“药学上可接受”是指分子实体和组合物在向宿主施用时不产生过敏性反应或类似不适当反应。
递送载体诸如脂质体、纳米胶囊、微粒、微球体、脂质颗粒、囊泡等可用于将本发明组合物引入适合宿主细胞中。特别地,载体递送的转基因可被配制以达成囊封在脂质颗粒、脂质体、囊泡、纳米球体或纳米颗粒等中加以递送。
对于引入本文公开的核酸或任何载体的药学上可接受的制剂,这类制剂可为优选的。脂质体的形成和使用通常为本领域技术人员所知。近来,开发了具有改进的血清稳定性和循环半衰期的脂质体(美国专利第5,741,516号)。此外,已描述作为潜在药物载体的脂质体和脂质体样制剂的各种方法(美国专利第5,567,434;5,552,157;5,565,213;5,738,868和5,795,587号)。
脂质体已成功地与通常对通过其他程序进行的转染具有抗性的许多细胞类型一起使用。此外,脂质体没有基于病毒的递送***所典型具有的DNA长度限制。脂质体已被有效用于将基因、药物、放射冶疗剂、病毒、转录因子和变构效应物引入多种培养细胞系和动物中。此外,已完成了考查脂质体介导的药物递送的有效性的若干成功临床试验。
脂质体由分散在水性介质中,并且自发形成多层同心双层囊泡(也被称为多层囊泡(MLV))的磷脂形成。MLV通常具有25nm至4μm的直径。声波处理MLV会导致形成具有在200至500.ANG.的范围内的直径,在核心中含有水溶液的小单层囊泡(SUV)。
或者,可使用本文所述的任何载体的纳米胶囊制剂。纳米胶囊可通常以稳定和可重现方式圈闭物质。为避免归因于细胞内聚合过载的副作用,这类超细颗粒(尺寸是约0.1μm)应使用能够在体内降解的聚合物来设计。预期使用满足这些要求的生物可降解聚氰基丙烯酸烷酯纳米颗粒。
除以上所述的递送方法之外,还涵盖以下技术作为将本文所述的任何组合物递送至宿主的替代性方法。超声促渗(即超声)已在美国专利第5,656,016号中作为一种用于使药物向循环***中以及通过循环***进行渗透的速率和功效增强的装置加以使用和描述。涵盖的其他药物递送替代方案是骨内注射(美国专利第5,779,708号)、微芯片装置(美国专利第5,797,898号)、眼用制剂(Bourlais等人,1998)、经皮基质(美国专利第5,770,219和5,783,208号)以及反馈控制递送(美国专利第5,697,899号)。
主题组合物的施用可以任何适宜方式进行,包括通过气雾剂吸入、注射、摄取、输液、植入或移植。本文所述的组合物可以经动脉、皮下、真皮内、结节内、髓内、肌肉内、通过静脉内(i.v.)注射、或腹膜内方式向患者施用。在一个方面,本发明的核酸组合物通过真皮内或皮下注射来向患者施用。在一个方面,本发明的核酸组合物通过静脉内注射来施用。
装置和手术方法
本文提供了用于治疗非症状性感觉神经性听力损失的治疗性递送***。在一个方面,治疗性递送***包括i)能够在有需要的人受试者的内耳的圆窗膜中创建一个或多个切口的医学装置,和ii)有效剂量的组合物(例如本文所述的任何组合物)。在一些实施方案中,医学装置包括多个微针。
本文还提供了用于治疗听力损失(例如非症状性感觉神经性听力损失)的手术方法。在一些实施方案中,方法包括以下步骤:向人受试者的耳蜗中在第一切开点处引入第一切口;以及在耳蜗内施用治疗有效量的本文提供的任何组合物。在一些实施方案中,在第一切开点处向受试者施用组合物。在一些实施方案中,向第一切口中或穿过第一切口向受试者施用组合物。
在本文所述的任何方法的一些实施方案中,向耳蜗卵圆窗膜中或穿过耳蜗卵圆窗膜向受试者施用本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,向耳蜗圆窗膜中或穿过耳蜗圆窗膜向受试者施用本文所述的任何组合物。在本文所述的任何方法的一些实施方案中,使用能够在圆窗膜中创建多个切口的医学装置来施用组合物。在一些实施方案中,医学装置包括多个微针。在一些实施方案中,医学装置包括多个微针,所述微针包括大体上是环状的第一外观,其中每个微针具有至少约10微米的直径。在一些实施方案中,医学装置包括能够容纳组合物的基底和/或储库。在一些实施方案中,医学装置包括多个中空微针,所述微针单个地包括能够转移组合物的内腔。在一些实施方案中,医学装置包括用于产生至少部分真空的部件。
通过参考以下实验性实施例来进一步详细描述本发明。除非另外规定,否则这些实施例仅出于说明的目的而提供,并且不意图具有限制性。因此,本发明决不应解释为限于以下实施例,而是应解释为涵盖由于本文提供的教示内容而变得明显的任何和所有变化形式。
在不进一步描述的情况下,据信本领域普通技术人员可使用先前描述和以下说明性实施例制备和利用本发明化合物以及实施所要求保护的方法。以下工作实施例明确指出本发明的各个方面,并且不应解释为以任何方式限制本公开的其余部分。
实施例
实施例1:病毒载体的构建
重组AAV通过用如由Xiao等人J.Virol.73(5):3994-4003,1999使用的无腺病毒方法进行的转染来产生。将具有AAV ITR的顺式质粒、具有AAV Rep和Cap基因的反式质粒以及具有来自腺病毒基因组的必需区域的辅助质粒以1:1:2的比率共转染于293细胞中。此处使用的AAV载体在使用以下描述的构建体进行的多种双载体策略下表达人硬纤毛蛋白或小鼠硬纤毛蛋白。AAV血清型1、2、3、4、5、6、7、8、9、rh8、rh10、rh39、rh43和Anc80各自被制备来囊封三组硬纤毛蛋白构建体以测试(i)多联化-反式剪接策略,(ii)杂合内含子同源性重组-反式剪接策略,和(iii)外显子同源性重组策略,如由Pryadkina等人,Meth.Clin.Devel.2:15009,2015所概述。
实施例2:产生和纯化病毒颗粒
重组AAV-1使用三重转染方案来产生,并且通过两个连续氯化铯(CsCl)密度梯度来纯化,如由Pryadkina等人,Mol.Ther.2:15009,2015所描述。在第二离心结束时,从CsCl密度梯度管回收11个500μl级分,并且通过在1×PBS中透析来纯化。级分通过斑点印迹来分析以确定含有rAAV基因组的那些级分。每个制剂的病毒基因组数目(vg)通过使用对应于AAV载体基因组的ITR区域的引物和探针进行的基于定量实时PCR的滴定方法来测定(Bartoli等人Gene.Ther.13:20-28,2006)。
实施例3:病毒颗粒的配制
在人工外淋巴中在3.2e13、1.0e13、3.2e12、1.0e12 vg/mL的稀释度下制备在1e14vg/mL的效价下产生的AAV。人工外淋巴通过将以下试剂组合来制备:NaCl,120mM;KCl,3.5mM;CaCl2,1.5mM;葡萄糖,5.5mM;HEPES,20mM。人工外淋巴用NaOH滴定以将它的pH调整至7.5(130mM的总Na+浓度)(Chen等人,J.Controlled Rel.110:1-19,2005)。
实施例4:装置描述
使用被设计用于持续和安全穿透圆窗膜(RWM)的专门化微型导管将AAV-STRC制剂递送至耳蜗。对微型导管进行塑造以使进行递送程序的外科医师可通过外耳道进入中耳腔,并且使微型导管的末端与RWM接触。微型导管的远端包含至少一个具有在10与1,000微米之间的直径的微针,所述微针在RWM中产生足以允许AAV-STRC在约1uL/min的速率下进入鼓阶的耳蜗外淋巴,但足够小以致在不进行手术修复下可愈合的穿孔。微型导管的在一个或多个微针的近侧的其余部分装载有在约1e13 vg/mL的效价下的AAV-STRC/人工外淋巴制剂。微型导管的近端连接于允许以约1uL/min进行精确低体积输注的显微操纵器。
实施例5:动物模型1A:在老龄小鼠中进行的手术方法
向小鼠中的鼓阶施用在人工外淋巴中制备的AAV-STRC,如由Shu等人(Human GeneTherapy,doi:10.1089/hum.2016.053,2016年6月)所描述。使用腹膜内注射甲苯噻嗪(20mg/kg)和***(100mg/kg)来使六周龄雄性小鼠麻醉。使用电加热垫使体温维持在37℃下。从右侧耳后区域产生切口,并且使鼓泡暴露。用手术针对泡进行穿孔,并且使小孔扩展以提供到达耳蜗的通路。用牙钻使鼓阶的耳蜗侧壁的骨变薄,因此使膜性侧壁完整。与玻璃微量吸移器联合的纳升显微注射***用于在2nL/秒的速率下将总计约300nL的处于人工外淋巴中的AAV-STRC递送至鼓阶。在注射后,将玻璃微量吸移器在原地留置5分钟。在耳蜗造口术和注射之后,用牙科粘固剂密封鼓泡中的开口,并且将肌肉和皮肤进行缝合。使小鼠从麻醉中醒来,并且持续3天用0.15mg/kg盐酸丁丙诺啡控制它们的疼痛。
实施例6:动物模型2:在豚鼠中采用的往复式微量泵
手术程序
向豚鼠施用在人工外淋巴中制备的AAV-STRC以评估在用如由Tandon等人,LabChip,DOI:10.1039/c5lc01396h,2015所述的往复式微量泵进行耳蜗内递送之后的分布和毒性。用戊巴比妥钠(耐波他(Nembutal);25mg kg-1,腹膜内注射)、芬太尼(0.2mg kg-1,肌肉内)和氟哌啶醇(10mg kg-1,肌肉内)的组合使各自称重为约350g的雄性豚鼠(n=16)麻醉。含肾上腺素的利多卡因作为表面麻醉剂在切开部位处加以皮下给与。使用背侧方法,在泡中产生5mm直径的孔,并且在圆窗膜的远侧约0.5mm处创建耳蜗造口。将微量泵(以下描述)的导管***耳蜗造口中,向顶端穿行至耳蜗中3mm,并且用常用氰基丙烯酸酯胶水胶粘于泡。对于复合动作电位(CAP)测量,将全氟烷氧基-烷烃绝缘银线电极(203μm未涂布直径)***在圆窗小生境附近,并且胶粘于泡。
用于测量畸变产物耳声发射(DPOAE)和CAP的程序如先前于Tandon等人BiomedMicrodevices 17:3-21,2015中所述加以进行。在耳蜗造口术程序之前和之后在特征频率:32、24、16、12、8、5.6、4和2.78kHz下测量DPOAE以监测由于手术而发生的任何损害。
使用如由Tandon等人Lab Chip,DOI:10.1039/c5lc01396h,2015所述的微量泵,向豚鼠施用在1e14 vg/mL的最大效价下的AAV-STRC。微量泵***具有4个可选择端口。这些端口连接于:(i)用于人工外淋巴储存的大型流体电容器;(ii)连接于耳蜗的出口;(iii)来自集成AAV-STRC储库的出口;(iv)向集成AAV-STRC储库的进口。每个端口与中心泵室成流体连通,并且各自用阀加以单独定址。往复式AAV-STRC递送的事件顺序如下:(i)运行内部AAV-STRC更新环路,从而将AAV-STRC从AAV-STRC储库转移至主要输注–抽取管线中;(ii)将AAV-STRC输注至耳蜗中,并且从人工外淋巴储存电容器排放一些人工外淋巴;(iii)前两个步骤可重复数次以达成额外剂量;(iv)在已使AAV-STRC扩散一定时间之后,从耳蜗抽取与步骤(i)–(iii)中输注的体积相等的体积的外淋巴,从而再填充人工外淋巴储存电容器。这个过程导致药物的净递送,其中添加至耳蜗中的净流体体积是零。
微量泵中的流体电容器是圆柱形腔室,其顶板是薄的(25.4μm)柔性聚酰亚胺膜。泵室具有3.5mm的直径,流体储存电容器具有14mm的直径,并且所有其余电容器都具有4mm的直径。将相同的膜偏转以阻断在每个阀处的流动。阀室具有3.1mm的直径。包含药物储库的蛇形通道具有宽度762μm的方形截面和410mm的长度,总体积是238μL。泵中的所有其他微通道都具有400μm的宽度和254μm的高度。
在豚鼠中进行的急性药物递送
将微量泵装载以AAV-STRC和人工外淋巴,并且将导管***在耳蜗的处于具有24和32kHz的特征频率敏感性的位置之间的区域中产生的耳蜗造口中,并且向顶端穿行3mm,从而终止于12–16kHz区域中。在开始AAV-STRC/人工外淋巴输注之前进行基线DPOAE和CAP听力测试。接着使泵启动,并且每5分钟输注约1μL的人工外淋巴直至将总计约10μL的人工外淋巴递送至耳蜗。在20分钟等待时间之后,从耳蜗抽取约10μL的外淋巴。接着在每5分钟约1μL的速率下起始AAV-STRC递送直至递送总计约10μL的液体。
在处理后1周、1个月、3个月和6个月时将动物处死(n=4/组),并且提取它们的耳蜗。通过用抗STRC抗体进行免疫染色来评估沿柯蒂氏器的AAV转导和STRC表达的程度。针对毛细胞标志物(Myo7a)和支持细胞标志物(Sox2)的抗体用于定量IHC、OHC、支持细胞和硬纤毛形态。膜联蛋白V染色用于评估沿耳蜗感觉上皮的细胞中的凋亡的迹象。
实施例7:动物模型3:绵羊
向幼年绵羊施用在人工外淋巴中制备的AAV-STRC以评估在通过跨RWM输注递送至耳蜗之后的分布和毒性。在处于3月龄下的雌性绵羊(n=40)中在双侧测量基线听性脑干响应(ABR)和畸变产物耳声发射(DPOAE),以评估处理前内毛细胞(IHC)和外毛细胞(OHC)功能。在基线ABR和DPOAE测量之后,将20uL的在1.0e14、3.2e13、1.0e13和3.2e12 vg/mL的效价下的AAV1-STRC注射至绵羊的左侧鼓阶中(n=10/组)。每个动物的右耳留作未处理对照。在手术程序之后1、5和10天,在双侧再次获取ABR和DPOAE测量结果。在程序后6个月时,从所有动物获取额外双侧ABR和DPOAE测量结果,并且随后将动物处死,并且移除它们的耳蜗。
在半数处死动物(n=5,来自每个剂量群组)中,进行免疫染色以鉴定毛细胞结构,以及评估沿耳蜗感觉上皮的STRC蛋白表达。针对毛细胞标志物(Myo7a)、支持细胞标志物(Sox2)和硬纤毛蛋白的抗体如先前所述加以使用(Duncker等人2013,J Neurosci33(22):9508-9519)。在柯蒂氏器的底转、中转和顶转处,对在200um区域内的毛细胞和表达STRC的那些毛细胞的总数进行计数。
在其余半数处死动物(来自每个剂量群组的其余5个动物)中,从与以上所述相同的基底、中间和顶端区域收集耳蜗组织样品,并且测定硬纤毛蛋白mRNA转录物。
实施例8:动物模型3A:CRISPR产生的转基因大型动物模型(绵羊)
共表达Cas9和sgRNA的质粒的产生
将pX330-U6-嵌合_BB-CBh-hSpCas9质粒(Addgene质粒编号42230)用BsbI消化,使用Antartic磷酸酶脱磷酸,并且对线性化载体进行胶凝纯化。为产生表达Cas9和针对STRC的sgRNA的双顺反子载体(pX330-cas9-STRC),使用于靶向硬纤毛蛋白外显子1的一对寡聚物退火,磷酸化,并且连接于线性化载体(Cong等人,Science339(6121):819-23,2013)。
在细胞中进行的基因组编辑测定
在10%胎牛血清、2mM谷氨酰胺、1%丙酮酸钠和1%青霉素/链霉素的情况下,在DMEM中维持A15星形神经胶质绵羊细胞系(Vilette等人,2000In Vitro Cell Dev BiolAnim 36(1):45-9)。使用转脂胺LTX试剂,将细胞在24孔板中用2μg的共表达Cas9和针对硬纤毛蛋白的sgRNA的pX330-cas9-STRC转染。三天后,提取来自经转染细胞的基因组DNA,并且使用NanoDrop2000分光光度计定量,测量A260/A280和A260/A230比率以说明样品纯度。
使用T7EI错配检测测定来定量sgRNA序列在STRC外显子1的靶标基因座处的基因突变活性。使用特异性引物,用高保真聚合酶(Herculase II融合聚合酶)对目标DNA序列进行PCR扩增。接着使所得PCR产物变性,并且缓慢再退火(95℃,2分钟;95℃至85℃,-2℃/秒;85℃至25℃,-1℃/秒)以产生同源双链体/异源双链体混合物。这个混合物接着在37℃下通过5U的T7EI限制酶来消化30分钟。消化产物通过2%琼脂糖凝胶电泳来分离。经裂解产物与未裂解产物的比率用于如先前所述使用Image J软件计算NHEJ频率(Menoret等人2011Advanced protocols for Animal Transgenesis.An ISTT Manual.Heidelberg:Springer.第117-36页)。NHEJ频率计算为基因修饰%=100x(1-(1-裂解分数)^(1/2)。
sgRNA和Cas9 mRNA的产生
如先前所述(Bellec等人,Current Gene Ther.,2015),通过对pX330-cas9-STRC质粒的PCR扩增来将T7启动子添加至sgRNA模板中。使用
Figure BDA0002959533770001511
胶凝和PCR净化方法纯化PCR产物。它作为模板用于根据制造商手册使用MEGAshortscriptTM T7试剂盒进行体外转录。在转录完成之后,进行DNA酶I处理。
使用经PmeI消化Cas9表达JDS246质粒(Addgene质粒编号43861)和mMESSAGE
Figure BDA0002959533770001521
T7ULTRA转录试剂盒,根据制造商手册来转录Cas9 mRNA。在转录完成之后,进行多聚(A)加尾反应和DNA酶I处理。Cas9 mRNA与sgRNA两者均使用MEGAclearTM试剂盒纯化,并且洗脱于洗脱缓冲液中。
胚胎的体外产生
根据如先前所述的常规程序(Crispo等人2014Transgenic Res,24(1):31-41),通过体外受精来产生绵羊胚胎。简要来说,来自屠宰场的绵羊卵巢被运送至实验室,并且将卵丘***复合体(COC)于回收培养基中吸出。将所选COC放置在成熟培养基中,在39℃下,在含湿气空气氛围中,在5%CO2中持续24小时。接着,使扩张的COC在具有1x 106剂量的冷冻-解冻***的100μl液滴中受精,所述***根据上泳法通过上升迁移来选择。受精在39℃下,在含湿气氛围的情况下,在5%CO2中进行22小时。
向受精卵中的显微注射
在受精之后不久,将600个推定受精卵随机分配至三个实验组以加以显微注射(CRISPR组,n=200;以及缓冲液组,n=200)或不显微注射(对照组,n=200)。CRISPR组的显微注射通过用在注射缓冲液(10mM Tris,pH 7.5,0.1mM EDTA)中稀释的5ng/μl的sgRNA和20ng/μl的Cas9 mRNA向细胞质中显微注射来进行,而缓冲液组以相同程序,但用单独缓冲液加以注射。最后,将经注射和非注射胚胎转移至在39℃下,在含湿气氛围中,在5%CO2、5%O2和90%N2中,处于矿物油之下的培养基中。对于所有实验组,记录在第2天的卵裂率(卵裂受精卵/总***)以及在第6天的发育率(桑椹胚和胚泡/总***)。在第6天之后,通过桑格尔(Sanger)测序来分析来自20个CRISPR组胚胎的DNA以在STRC基因水平上检测突变。
为确定***的体内效率,将通过CRISPR/Cas9受精卵显微注射产生的胚泡转移至接受雌性中。在受精之后第6天仅转移分类为优秀或良好(即等级1,如Stringfellow等人2010,Manual of the International Embryo Transfer Society中所定义)的早期胚泡、胚泡和扩张胚泡。胚胎转移通过由腹腔镜检查辅助的微创手术进行以将胚胎放置至与黄体同侧的子宫角的颅侧中。如由Menchaca等人2004,Reprod Fertil Dev.16(4):403-413所述,使用先前所述的用以控制***的标准方案,先前使接受母羊同步为处于发情周期的第6天。
对胎畜和羔羊的监测
通过使用配备有5和3.5MHz探头的B型超声波检查法,分别在第30和105天进行妊娠诊断和胎畜发育检查。实验的第0天规定为胚胎受精的时刻。测量若干参数以研究在妊娠的第105天时的胎畜发育:胸径、双顶径、枕鼻长度和心率。在分娩时,记录妊娠时长、性别、直肠温度、心率和呼吸率、体重、胸围、双顶径、顶臀长度和枕鼻长度、鬐甲高、臀高、臀宽和胸宽。在出生时以及15、30和60天后,测定体重和形态测定变量。
对转基因动物的鉴定和基因分型
在出生之后七天获取来自羔羊的皮肤和肢体肌肉的样品,并且进行T7EI测定、蛋白质印迹测试和组织学检查以鉴定和表征KO建立者和脱靶位点。从所有动物的皮肤活检体以及从一些动物的肌肉分离总DNA。使用毛细管电泳分析样品。通过对PCR扩增子的直接测序,并且在肌肉活检体的情况下,通过对具有单个扩增子序列的经分离细菌克隆的额外测序来进行对STRC外显子1的基因分型。
对硬纤毛蛋白表达的分析
进行蛋白质印迹以确定肌抑素(myostatin)在肌肉纤维中的存在性。使等量的总蛋白质在12%(v/v)凝胶电泳上运行,并且以电泳方式转移至PVDF膜中。单克隆小鼠抗硬纤毛蛋白抗体用于蛋白质印迹中。使经洗涤膜与1:50000稀释度的连接于辣根过氧化物酶(HPR)的二级抗体一起孵育。使用蛋白质印迹化学发光检测HPR活性。
在转基因绵羊模型中进行的AAV-STRC挽救疗法
向STRC敲除转基因绵羊施用在人工外淋巴中制备的AAV-STRC以评估在通过跨RWM输注递送至耳蜗之后,使正常听力功能恢复的能力。在处于3月龄下的雌性绵羊(n=30)中在双侧测量基线听性脑干响应(ABR)和畸变产物耳声发射(DPOAE),以评估治疗前内毛细胞(IHC)和外毛细胞(OHC)功能。在基线ABR和DPOAE测量之后,将20uL的在1.0e14、3.2e13和1.0e13 vg/mL的效价下的AAV1-STRC注射至绵羊的左侧鼓阶中(n=10/组)。每个动物的右耳留作未治疗对照。在手术程序之后1、5和10天,在双侧再次获取ABR和DPOAE测量结果。在程序后6个月时,从所有动物获取额外双侧ABR和DPOAE测量结果,并且随后将动物处死,并且移除它们的耳蜗。
在半数处死动物(n=5,来自每个剂量群组)中,进行免疫染色以鉴定毛细胞结构,以及评估沿耳蜗感觉上皮的STRC蛋白表达。针对毛细胞标志物(Myo7a)、支持细胞标志物(Sox2)和硬纤毛蛋白的抗体如先前所述加以使用(Duncker等人,J Neurosci 33(22):9508-9519,2013)。在柯蒂氏器的底转、中转和顶转处,对在200um区域内的毛细胞和表达STRC的那些毛细胞的总数进行计数。
在其余半数处死动物(来自每个剂量群组的其余5个动物)中,从与以上所述相同的基底、中间和顶端区域收集耳蜗组织样品,并且测定硬纤毛蛋白mRNA转录物,如先前所述(Duncker等人2013,J Neurosci33(22):9508-9519,2013;Heidrych等人,Hum.Mol.Genet.17:3814-3821,2008;Heidrych等人,Hum.Mol.Genet.18:2779-2790,2009)。
实施例9:人临床实例(儿科治疗)
将患者置于全身麻醉下。外科医师从外耳道接近鼓膜,在外耳道的与鼓膜交会所处的下边缘处产生小切口,并且将鼓膜以皮瓣形式提升以暴露中耳间隙。手术激光用于在镫骨底板中产生小开口(约2mm)。外科医师接着用装载有在1e13 vg/mL的效价下的在人工外淋巴中制备的AAV-STRC溶液的微型导管穿透圆窗膜。微型导管连接于在约1uL/min的速率下输注约20uL的AAV-STRC溶液的显微操纵器。在AAV-STRC输注结束时,外科医师抽出微型导管,并且用明胶海绵贴片修补镫骨底板和RWM中的孔。程序以将鼓膜皮瓣复位来结束。
实施例10:用以检测STRC突变的对母体血液的非侵袭性产前测试
将母体血液样品(20-40mL)收集至无细胞DNA管中。通过2,000g持续20分钟继之以3,220g持续30分钟,其中在第一次旋转之后进行上清液转移的双重离心方案来从每个样品分离至少7mL的血浆。使用QIAGEN QIAmp循环核酸试剂盒从7-20mL血浆分离cfDNA,并且洗脱于45μL TE缓冲液中。从在第一次离心之后获得的血沉棕黄层分离纯净母体基因组DNA。
通过将用以选择探针-探针相互作用的可能性最小的探针的对测定进行的热力学建模与先前描述的扩增方法(Stiller等人,Genome Res.19(10):1843-1848,2009)组合,可实现11,000个测定的多路化。使用11,000个靶标特异性测定,对母体cfDNA和母体基因组DNA样品进行15个循环的预扩增,并且将等分试样转移至使用巢式引物进行15个循环的第二PCR反应中。通过在第三轮12循环PCR中添加条形码化标签来制备用于测序的样品。靶标包括染色体15中已知是硬纤毛蛋白功能丧失突变的位点的基因组序列(Mandelker等人,J.Mol.Diagnostics 16(6):639-647,2014)。接着使用Illumina HiSeq测序仪对扩增子进行测序。使用可商购获得的软件进行基因组序列比对。
实施例11:腺病毒(AAV)反式剪接策略
至少两种不同核酸载体(例如AAV载体)可用于在分子间多联化和反式剪接之后在细胞内重构活性硬纤毛蛋白基因(例如全长硬纤毛蛋白基因)。参见例如Yan等人,Proc.Natl.Acad.Sci.U.S.A.97:12;6716-6721,2000,其以它的整体并入本文。
在一些实例中,将使用两种不同核酸载体。第一核酸载体可包括启动子(例如本文所述的任何启动子)、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何N末端部分)的第一编码序列、以及位于所述第一编码序列的3’末端的剪接供体信号序列。第二核酸载体可包括剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分(即硬纤毛蛋白的不包括在N末端部分中的整个部分)(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何C末端部分)的第二编码序列、以及在所述第二编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在一些实施方案中,所编码部分中的每一者的长度是至少30个氨基酸残基(例如的长度是至少50个氨基酸、至少75个氨基酸、或至少100个氨基酸),所编码部分中的每一者的氨基酸序列不与其他所编码部分的序列重叠,并且两种不同载体中没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在剪接供体信号序列与剪接接受体信号序列之间发生剪接,由此形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。
在另一实例中,可使用三种不同核酸载体。第一核酸载体可包括启动子序列(例如本文所述的任何启动子序列)的一部分;硬纤毛蛋白基因的编码硬纤毛蛋白的第一部分,位于所述启动子的3’的第一编码序列(例如本文所述的任何硬纤毛蛋白编码序列);以及位于所述第一编码序列的3’末端的第一剪接供体信号序列。第二核酸载体可包括第一剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第二部分,位于所述第一剪接接受体信号序列的3’末端的第二编码序列;以及位于所述第二编码序列的3’末端的第二剪接供体信号序列(例如本文所述的任何剪接供体信号)。第二核酸载体的特征将是不能发生自剪接(即剪接将不在第二核酸载体的第二剪接供体信号序列与第一剪接接受体信号序列之间发生)。在一些实施方案中,第一核酸载体的剪接供体信号序列和第二核酸载体的第二剪接供体信号是相同的(例如本文所述或本领域中已知的任何剪接供体信号)。在一些实施方案中,第一核酸载体的第一剪接供体信号序列和第二核酸载体的第二剪接供体信号序列是不同的(例如本文所述或本领域中已知的任何剪接供体信号序列)。第三核酸载体将包括第二剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第三部分,位于所述第二剪接接受体信号序列的3’末端的第三编码序列;以及位于所述第三编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在其中使用三种核酸载体的这类方法中,第一剪接供体序列和第一剪接接受体序列可组装在一起(重组),并且第二剪接供体序列和第二剪接接受体序列可组装在一起(重组),并且硬纤毛蛋白的由第一、第二和第三编码序列编码的部分不重叠,并且当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在第一剪接供体序列与第一剪接接受体序列之间,以及在第二剪接供体序列与第二剪接接受体序列之间发生剪接,以形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。基于以上提供的策略,本领域技术人员将了解如何开发使用四种、五种或六种不同核酸载体进行的策略。
在这些方法的任何实例中,所编码部分中的每一者的氨基酸序列不重叠,并且没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。
至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,并且所编码部分中的每一者可为至少30个氨基酸(例如在约30个氨基酸至约1600个氨基酸之间,或本文所述的这个范围的任何其他子范围)。
在一些实施方案中,编码序列中的每一者可包括SEQ ID NO:4的至少一个外显子和至少一个内含子(例如至少两个外显子和至少一个内含子、至少两个外显子和至少两个内含子、至少三个外显子和至少一个内含子、至少三个外显子和至少两个内含子、或至少三个外显子和至少三个内含子)。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者可编码SEQ ID NO:1的氨基酸序列的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%或多达70%),以致所编码部分中的每一者是非重叠的。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:1的氨基酸序列的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%或多达70%),以致所编码部分中的每一者是非重叠的。
至少两种核酸载体中的每一者可还包括反向末端重复序列(ITR)以允许头-尾重组。ITR将随后通过剪接而移除。举例来说,ITR可为如以它的整体并入本文的Yan等人,Proc.Natl.Acad.Sci.U.S.A.97(12):6716-6721,2000中所述的回文双D ITR。举例来说,ITR可为如Gosh等人,Mol.Ther.16:124-130,2008以及Gosh等人,Human Gene Ther.22:77-83,2011中所述的AAV血清型-2ITR。在本文所述的任何载体的一些实施方案中,载体可包括5’ITR和/或3’ITR。在一些实施方案中,5’ITR包括SEQ ID NO:18或由SEQ ID NO:18组成。在一些实施方案中,3’ITR包括SEQ ID NO:36或由SEQ ID NO:36组成。
剪接接受体和/或供体信号序列的非限制性实例在本领域中是已知的。参见例如Reich等人,Human Gene Ther.14(1):37-44,2003以及Lai等人(2005)Nat.Biotechnol.23(11):1435-1439,2005,2005。剪接供体和接受体信号序列可为基因(例如硬纤毛蛋白基因)的任何内源性内含子剪接信号。举例来说,剪接供体信号序列可为:5’-GTAA GTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT-3’(SEQ IDNO:6),并且剪接接受体信号可为5’-GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG-3’(SEQ ID NO:7)(参见例如Trapani等人,EMBOMol.Med.6(2):194-211,2014)。评估剪接和剪接效率的方法在本领域中是已知的(参见例如Lai等人,Nat.Biotechnol.23(11):1435-1439,2005)。
实施例12:使用碱性磷酸酶(AP)高度致重组外源性基因区域进行的杂合载体反式剪接策略
至少两种(例如两种、三种、四种、五种或六种)不同核酸载体(例如AAV载体)还可在本文所述的任何方法中用于在分子间多联化、标记基因介导的重组以及反式剪接之后在细胞内重构活性硬纤毛蛋白基因(例如全长硬纤毛蛋白基因)。这个策略是一种杂合策略,因为它将包括同源性重组和/或反式剪接。参见例如Gosh等人,Mol.Ther.16:124-130,2008;Gosh等人,Human Gene Ther.22:77-83,2011;以及Duan等人,Mol.Ther.4:383-391,2001,其各自以它的整体并入本文。如本文所用,可检测标记基因可为将允许进行编码序列非依赖性重组的高度致重组DNA序列。可检测标记基因的一非限制性实例是碱性磷酸酶(AP)基因。举例来说,可检测标记基因可为人胎盘AP互补性DNA的中间三分之一,长度是872bp(参见例如Gosh等人,2008)。至少两种不同核酸载体将含有可检测标记基因(例如本文所述的任何可检测标记基因)。因为杂合载体将基于如实施例10中所述的反式剪接载体构建,所以活性硬纤毛蛋白基因(例如全长硬纤毛蛋白基因)可使用ITR介导的重组和反式剪接或可检测标记基因介导(例如AP基因介导)的重组和反式剪接加以重构。在反式剪接之后,活性硬纤毛蛋白基因(例如全长硬纤毛蛋白基因)将在哺乳动物细胞(例如本文所述的任何哺乳动物细胞)的基因组DNA中加以重构。
在一个实例中,将使用两种不同核酸载体。第一核酸载体可包括启动子(例如本文所述的任何启动子)、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何N末端部分)的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的第一可检测标记基因。第二核酸载体可包括第二可检测标记基因、位于所述第二可检测标记基因的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何C末端部分)的第二编码序列、以及在所述第二编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在一些实施方案中,所编码部分中的每一者的长度是至少30个氨基酸残基(例如的长度是至少50个氨基酸、至少75个氨基酸、或至少100个氨基酸),所编码部分中的每一者的氨基酸序列不重叠,并且两种不同载体中没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在剪接供体信号序列与剪接接受体信号序列之间发生剪接,由此形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。
在另一实例中,可使用三种不同核酸载体。第一核酸载体可包括启动子序列(例如本文所述的任何启动子序列)的一部分;硬纤毛蛋白基因的编码硬纤毛蛋白的第一部分,位于所述启动子的3’的第一编码序列(例如本文所述的任何硬纤毛蛋白编码序列);位于所述第一编码序列的3’末端的第一剪接供体信号序列;以及第一可检测标记基因。第二核酸载体可包括第二可检测标记基因;位于所述第二可检测标记基因的3’的第一剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第二部分,位于所述第一剪接接受体信号序列的3’末端的第二编码序列;位于所述第二编码序列的3’末端的第二剪接供体信号序列(例如本文所述的任何剪接供体信号);以及第三可检测标记基因。第二核酸载体的特征将是不能发生自剪接(即剪接将不在第二核酸载体的第二剪接供体信号序列与第一剪接接受体信号序列之间发生)。在一些实施方案中,第一核酸载体的剪接供体信号序列和第二核酸载体的第二剪接供体信号是相同的(例如本文所述或本领域中已知的任何剪接供体信号)。在一些实施方案中,第一核酸载体的第一剪接供体信号序列和第二核酸载体的第二剪接供体信号序列是不同的(例如本文所述或本领域中已知的任何剪接供体信号序列)。第三核酸载体可包括第四可检测标记基因;位于所述第四可检测标记基因的3’的第二剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第三部分,位于所述第二剪接接受体信号序列的3’末端的第三编码序列;以及位于所述第三编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在其中使用三种核酸载体的这类方法中,第一剪接供体序列和第一剪接接受体序列可组装在一起(重组),并且第二剪接供体序列和第二剪接接受体序列可组装在一起(重组),并且硬纤毛蛋白的由第一、第二和第三编码序列编码的部分不重叠,并且当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在第一剪接供体序列与第一剪接接受体序列之间,以及在第二剪接供体序列与第二剪接接受体序列之间发生剪接,以形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。如本领域中可了解,当使用三种核酸载体时,至少两种不同核酸载体中的两者可包括可检测标记基因(例如AP标记基因),并且至少两种不同核酸载体中的一者可包括互补于包括可检测标记基因的核酸载体中的剪接供体信号序列的剪接接受体信号序列。举例来说,在一些实施方案中,第一和第二核酸载体可包括可检测标记基因(例如AP标记基因),并且第三核酸载体将包括互补于第二核酸载体中的剪接供体信号序列的剪接接受体信号序列,并且第三核酸载体将不包括可检测标记基因(例如AP标记基因)。在其他实例中,第二和第三核酸载体可包括可检测标记基因(例如AP标记基因),并且第一核酸载体将包括互补于第二核酸载体中的剪接接受体信号序列的剪接供体信号序列,并且第一核酸载体将不包括可检测标记基因(例如AP标记基因)。
基于以上提供的策略,本领域技术人员将了解如何开发使用四种、五种或六种载体进行的策略。
至少两种核酸载体(例如两种、三种、四种、五种或六种)中提供的编码序列将不是重叠的。至少两种不同载体中的每一者可包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者是例如至少30个氨基酸(例如约30个氨基酸至约1600个氨基酸,或本文所述的这个范围的任何其他子范围)。
在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:4的至少一个外显子和至少一个内含子(例如至少两个外显子和至少一个内含子、至少两个外显子和至少两个内含子、至少三个外显子至少一个内含子、至少三个外显子和至少两个内含子、或至少三个外显子和至少三个内含子)。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:1的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%、多达70%),以致所编码部分中的每一者是非重叠的。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:1的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%或多达70%),以致所编码部分中的每一者是非重叠的。
如实施例10中所述,至少两种核酸载体中的每一者可还包括反向末端重复序列(ITR)以允许头-尾重组。ITR将随后通过剪接而移除。ITR和剪接接受体和/或供体信号序列的实例在本领域中是已知的,并且已在实施例10中描述。
实施例13:使用F1噬菌体高度致重组外源性基因区域(AK)进行的杂合载体反式剪接策略
至少两种(例如两种、三种、四种、五种或六种)不同核酸载体(例如AAV载体)还可在本文所述的任何方法中用于在分子间多联化、标记基因介导的重组以及反式剪接之后在细胞内重构活性硬纤毛蛋白基因(例如全长硬纤毛蛋白基因)。这个策略是一种杂合策略,因为它将包括同源性重组和/或反式剪接。参见例如Trapani等人,EMBO Mol.Med.6(2):194-211,2014,其以它的整体并入本文。如本文所用,F1噬菌体致重组区域(AK)将用于允许进行编码序列非依赖性重组。F1噬菌体致重组区域可为如Trapani等人(2014)中所述的来自F1噬菌体基因组的77bp致重组区域。至少两种不同核酸载体将含有F1噬菌体致重组区域。因为杂合载体将基于如实施例10中所述的反式剪接载体构建,所以编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的核酸可使用ITR介导的重组和反式剪接或F1噬菌体致重组区域诱导的重组和反式剪接来产生。在反式剪接之后,编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的核酸将在哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中产生。
在一个实例中,将使用两种不同核酸载体。第一核酸载体可包括启动子(例如本文所述的任何启动子)、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何N末端部分)的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的F1噬菌体致重组区域。第二核酸载体可包括F1噬菌体致重组区域、位于所述F1噬菌体致重组区域的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分(例如本文所述的硬纤毛蛋白的任何大小的一部分和/或本文所述的硬纤毛蛋白的任何C末端部分)的第二编码序列、以及在所述第二编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在一些实施方案中,所编码部分中的每一者的长度是至少30个氨基酸残基(例如的长度是至少50个氨基酸、至少75个氨基酸、或至少100个氨基酸),所编码部分中的每一者的氨基酸序列不重叠,并且两种不同载体中没有单一载体编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)。当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在剪接供体信号序列与剪接接受体信号序列之间发生剪接,由此形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。
在另一实例中,将使用三种不同核酸载体。第一核酸载体可包括启动子序列(例如本文所述的任何启动子序列)的一部分;硬纤毛蛋白基因的编码硬纤毛蛋白的第一部分,位于所述启动子的5’的第一编码序列(例如本文所述的任何硬纤毛蛋白编码序列);位于所述第一编码序列的3’末端的第一剪接供体信号序列;以及F1噬菌体致重组区域。第二核酸载体可包括F1噬菌体致重组区域;位于所述F1噬菌体致重组区域的3’的第一剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第二部分,位于所述第一剪接接受体信号序列的3’末端的第二编码序列;位于所述第二编码序列的3’末端的第二剪接供体信号序列(例如本文所述的任何剪接供体信号);以及F1噬菌体致重组区域。第二核酸载体的特征将是不能发生自剪接(即剪接将不在第二核酸载体的第二剪接供体信号序列与第一剪接接受体信号序列之间发生)。在一些实施方案中,第一核酸载体的剪接供体信号序列和第二核酸载体的第二剪接供体信号是相同的(例如本文所述或本领域中已知的任何剪接供体信号)。在一些实施方案中,第一核酸载体的第一剪接供体信号序列和第二核酸载体的第二剪接供体信号序列是不同的(例如本文所述或本领域中已知的任何剪接供体信号序列)。第三核酸载体可包括F1噬菌体致重组区域;位于所述F1噬菌体致重组区域的3’的第二剪接接受体信号序列;硬纤毛蛋白基因的编码硬纤毛蛋白的第三部分,位于所述第二剪接接受体信号序列的3’末端的第三编码序列;以及位于所述第三编码序列的3’末端的多腺苷酸化序列(例如本文所述的任何多腺苷酸化序列)。在其中使用三种核酸载体的这类方法中,第一剪接供体序列和第一剪接接受体序列可组装在一起(重组),并且第二剪接供体序列和第二剪接接受体序列可组装在一起(重组),并且硬纤毛蛋白的由第一、第二和第三编码序列编码的部分不重叠,并且当引入哺乳动物细胞(例如本文所述的任何哺乳动物细胞)中时,在第一剪接供体序列与第一剪接接受体序列之间,以及在第二剪接供体序列与第二剪接接受体序列之间发生剪接,以形成编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的重组核酸。如本领域中可了解,当使用三种核酸载体时,不同核酸载体中的两者可包括F1噬菌体致重组区域,并且不同核酸载体中的一者可包括互补于包括F1噬菌体致重组区域的核酸载体中的剪接供体信号序列的剪接接受体信号序列。举例来说,在一些实施方案中,第一和第二核酸载体可包括F1噬菌体致重组区域,并且第三核酸载体将包括互补于第二核酸载体中的剪接供体信号序列的剪接接受体信号,并且第三核酸载体将不包括F1噬菌体致重组区域(例如AP标记基因)。在其他实例中,第二和第三核酸载体可包括F1噬菌体致重组区域,并且第一核酸载体将包括互补于第二核酸载体中的剪接接受体信号序列的剪接供体信号序列,并且第一核酸载体将不包括F1噬菌体致重组区域。基于以上提供的策略,本领域技术人员将了解如何开发使用四种、五种或六种载体进行的策略。
至少两种核酸载体(例如两种、三种、四种、五种或六种)中的每一者中提供的编码序列将不是重叠的。至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者是至少30个氨基酸(例如约30个氨基酸至约1600个氨基酸,或本文所述的这个范围的任何子范围)。
在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:4的至少一个外显子和至少一个内含子(例如至少两个外显子和至少一个内含子、至少两个外显子和至少两个内含子、至少三个外显子至少一个内含子、至少三个外显子和至少两个内含子、或至少三个外显子和至少三个内含子)。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:1的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%或多达70%),以致所编码部分中的每一者是非重叠的。在一些实施方案中,至少两种不同载体中的每一者包括编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者编码SEQ ID NO:1的多达80%(例如SEQ ID NO:1的多达10%、多达20%、多达30%、多达40%、多达50%、多达60%或多达70%),以致所编码部分中的每一者是非重叠的。
如实施例10中所述,至少两种核酸载体中的每一者可还包括反向末端重复序列(ITR)以允许头-尾重组。ITR将随后通过剪接而移除。ITR和剪接接受体和/或供体信号的实例在本领域中是已知的,并且已在实施例10中描述。
实施例14:CRISPR-Cas9介导的敲入缺乏非所需残基的STRC假基因
功能性STRC基因和STRC假基因的基因组序列具有98.9%的同一性,并且编码区是99.6%同源的(Francey等人,Am.J.Med.Genet.A.158A(2):298-308,2012)。Francey等人确定在外显子16与28之间的56bp是相异的。Verpy等人确定STRC假基因的外显子20中的无义突变致使从假基因表达的蛋白质是非活性的(Verpy等人,Nat.Genet.29:345-349,2001)。功能性STRC基因的表达可使用包括CRISPR-Cas9载体的组合物获得,所述组合物用以纠正(例如修改、替换)STRC假基因(SEQ ID NO:5)的外显子20中的无义突变以在哺乳动物细胞中产生编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的序列,并且由此治疗有需要的受试者的非综合征性感觉神经性听力损失。可用于将突变引入内源性基因中的各种CRISRP-Cas9技术在本领域中也是已知的。参见例如Merkle等人,Cell Rep.11(6):875-883,2015;He等人,Nucleic Acids Res.44(9):e85,2016;Wang等人,Mol.Ther.Nucleic Acids 5:e396,2016以及Verma等人,Methods Mol.Biol.1513:119-140,2017。举例来说,包括Cas9核酸酶(例如化脓性链球菌(Streptococcus pyogenes))和引导RNA的组合物可在CRISPR/Cas9RNA引导的基因组编辑中用于在SEQ ID NO:5的内源性硬纤毛蛋白假基因序列中的预定位点处移除无义突变;并且当引入哺乳动物细胞中时,编码活性硬纤毛蛋白(例如全长硬纤毛蛋白)的核酸在硬纤毛蛋白假基因的基因座处得以重构,所述引导RNA在其5’末端包括由互补于SEQ ID NO:5的位置13955-14151内的约20(例如20、21或22)个连续核苷酸的约20个核苷酸(例如20、21或22个)组成的互补性区域。
实施例15:AAV介导的反义寡核苷酸递送
用以从STRC假基因产生功能性STRC转录物的额外方法将包括使用AAV介导的反义寡核苷酸递送,通过外显子跳跃达成。参见例如Chamorro等人,Mol.Ther.Nucleic Acids5:e307,2016;Kawecka等人,Curr.Gene Ther.15(4):395-415,2015;Bremer等人,Mol.Ther.5:e3379,2016;Tei等人,Biochem.Biophys.Res.Commun.461(3):481-486,2015;以及Jirka等人,Nucleic Acid Ther.24(1):25-36,2014。如Bremer等人中所示,反义寡核苷酸可被设计来结合特定目标外显子,并且导致在RNA水平上进行框内外显子跳跃,由此使基因功能恢复。
在硬纤毛蛋白基因的情况下,可进行研究以使用诸如Bremer等人(2016)中使用的技术的技术来确定STRC假基因的外显子20作为外显子跳跃的靶标的合格性。在确定了STRC假基因的外显子20的合格性后,可产生具有对应于外显子20中的17-23个碱基对的序列的反义寡核苷酸,并且分析它们的熔解温度、GC含量、脱靶结合和结合能。在一些实施方案中,寡核苷酸将被合成为2’-O-甲基硫代磷酸酯反义寡核苷酸,并且通过RT-PCR来分析外显子跳跃。为确定经纠正STRC假基因在细胞中的重新表达,将使用本领域中的已知转染方法,用包括硬纤毛蛋白基因的反义寡核苷酸(例如对应于STRC假基因的外显子20的一部分的反义寡核苷酸)的核酸载体(例如AAV载体)转染细胞(例如哺乳动物细胞、人细胞或本文所述的任何细胞),并且将使用诸如RT-PCR、免疫荧光或蛋白质印迹、以及针对硬纤毛蛋白的功能性生化测定的方法来确定经纠正STRC假基因的表达。举例来说,在一些实施方案中,包括核酸载体的组合物将被引入哺乳动物细胞中,并且将产生功能性硬纤毛蛋白,所述核酸载体包括互补于SEQ ID NO:5的核苷酸序列的在位置13955-14151内的至少一部分(例如至少5个连续核苷酸、至少10个连续核苷酸、至少15个连续核苷酸、至少20个连续核苷酸、至少25个连续核苷酸、至少30个连续核苷酸、至少35个连续核苷酸、至少40个连续核苷酸、至少45个连续核苷酸、至少50个连续核苷酸、至少55个连续核苷酸、至少60个连续核苷酸、至少65个连续核苷酸、至少70个连续核苷酸、至少75个连续核苷酸、至少80个连续核苷酸、至少85个连续核苷酸、至少90个连续核苷酸、至少95个连续核苷酸、至少100个连续核苷酸、至少105个连续核苷酸、至少110个连续核苷酸、至少115个连续核苷酸、至少120个连续核苷酸、至少125个连续核苷酸、至少130个连续核苷酸、至少135个连续核苷酸、至少140个连续核苷酸、至少145个连续核苷酸、至少150个连续核苷酸、至少155个连续核苷酸、至少160个连续核苷酸、至少165个连续核苷酸、至少170个连续核苷酸、至少175个连续核苷酸、至少180个连续核苷酸、至少185个连续核苷酸、或至少190个连续核苷酸)的反义寡核苷酸。本领域技术人员将了解,外显子20反义寡核苷酸(例如SEQ ID NO:5的互补于在由位置13955-14141界定的区域内的序列的反义寡核苷酸)在长度方面将是10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸,或在下端具有这些数值中的一者,并且在上端具有更高数值的任何数值范围。在一些实施方案中,外显子20的反义寡核苷酸在长度方面将是20个核苷酸。在一些实施方案中,外显子20的反义寡核苷酸(例如SEQ ID NO:5的互补于包含位置13955-14141的序列的反义寡核苷酸)在长度方面将是15至30个核苷酸。在一些实施方案中,外显子20的反义寡核苷酸(例如SEQ ID NO:5的反义寡核苷酸)与由SEQ ID NO:5的位置13955-14151界定的区域的一部分的互补序列将具有至少80%(例如至少85%、至少90%、至少95%、至少97%、至少98%、至少99%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的同一性。
实施例16.STRC在HEK293FT细胞中的表达
将HEK293FT细胞在7E4个细胞/孔下在24孔形式中接种过夜,并且使用jetprime试剂,用示例性单一或双重STRC载体转染。在转染后72小时,用200μL RIPA缓冲液/孔收集HEK293FT细胞。将三十微升的样品于4-12%Bis-Tris蛋白质凝胶上上样至每个孔中。使用STRC多克隆抗体测定STRC蛋白表达。β-肌动蛋白(ACTB)用作上样对照。
如图7中所示,使用CBA/CAG启动子的双重STRC载体(pITR-205加pITR-202以及pITR-205加pITR-202GFP)在HEK293FT细胞中产生更强烈的全长STRC蛋白。这个结果确认STRC蛋白可通过本文所述的示例性STRC载体来表达。
接着,用双重STRC载体在不同MOI下转导的HEK293FT细胞,并且在1.2E5个细胞/孔下在具有依托泊苷试剂的24孔形式中接种过夜。在感染后72小时,用200μL RIPA缓冲液/孔收集HEK293FT细胞。如图8中所示,相较于用AAV.Anc80载体转导的HEK293FT细胞,用AAV2载体转导的HEK293FT细胞显示全长STRC蛋白的更高表达。
图9显示在用Anc80.STRC(在MOI 8.6E4和MOI 2.6E5下)或AAV2.STRC(在MOI8.6E4和MOI 2.6E5下)感染的HEK293FT细胞中,相对于GAPDH,STRC RNA表达具有高水平。
实施例17.STRC在P1-3耳蜗小鼠外植体中的表达
在涂铺之后,对来自野生型小鼠的P2耳蜗进行感染,并且在感染之后72小时进行收集以测定RNA和免疫荧光。如图10中所示,全长STRC在分别用Anc80.STRC在MOI 3.9E10下以及AAV2.STRC在MOI 1.3E10下感染的耳蜗外植体中高效表达。
如图11A至图11E以及图12A至图12C中所示,当用AAV.Anc80.dSTRC(7.8E VG/耳蜗、2.6E8 VG/耳蜗)和AAV2.dSTRC(7.8E8 VG/耳蜗和2.6E8 VG/耳蜗)转导时,P1-3耳蜗外植体的外毛细胞和内细胞表达Myo7a和鬼笔环肽。图11A和图11B显示天然耳蜗结构,其中Myo7a在外毛细胞与内毛细胞两者中均表达,而鬼笔环肽仅在内毛细胞中表达。在用AAV.Anc80.STRC转导的P1-3耳蜗外植体中(图11C至图11E),以及在用AAV2.STRC转导的P1-3耳蜗外植体中(图12A至图12C),观察到类似染色样式。
用任一载体转染都不破坏耳蜗的外毛细胞或内毛细胞的结构完整性。在非感染外植体与经AAV2.dSTRC和AAV.Anc80.dSTRC感染外植体之间的比较显示了稳健数目的活毛细胞,从而表明载体具有相对安全性。因此,图11A至图11E以及图12A至图12C以有活力和组织化的外毛细胞、内毛细胞和硬纤毛束显示STRC载体没有毒性。
其他实施方案
应了解尽管本发明已与其具体实施方式联合加以描述,但先前描述意图说明而非限制由随附权利要求的范围限定的本发明的范围。其他方面、优势和修改在以下权利要求的范围内。
本文提及的所有出版物、专利申请、专利和其他参考文献都通过引用以它们的整体并入本文。在有冲突的情况下,将以包括定义的本说明书为准。此外,章节标题、材料、方法和实例仅具有说明性,而非意图具有限制性。
序列表
<110> 阿库斯股份有限公司(Akouos, Inc.)
<120> 治疗非综合征性感觉神经性听力损失的方法
<130> 44628-0006WO1
<150> US 62/697,652
<151> 2018-07-13
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 1810
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Ala Leu Ser Leu Trp Pro Leu Leu Leu Leu Leu Leu Leu Leu Leu
1 5 10 15
Leu Leu Ser Phe Ala Val Thr Leu Ala Pro Thr Gly Pro His Ser Leu
20 25 30
Asp Pro Gly Leu Ser Phe Leu Lys Ser Leu Leu Ser Thr Leu Asp Gln
35 40 45
Ala Pro Gln Gly Ser Leu Ser Arg Ser Arg Phe Phe Thr Phe Leu Ala
50 55 60
Asn Ile Ser Ser Ser Phe Glu Pro Gly Arg Met Gly Glu Gly Pro Val
65 70 75 80
Gly Glu Pro Pro Pro Leu Gln Pro Pro Ala Leu Arg Leu His Asp Phe
85 90 95
Leu Val Thr Leu Arg Gly Ser Pro Asp Trp Glu Pro Met Leu Gly Leu
100 105 110
Leu Gly Asp Met Leu Ala Leu Leu Gly Gln Glu Gln Thr Pro Arg Asp
115 120 125
Phe Leu Val His Gln Ala Gly Val Leu Gly Gly Leu Val Glu Val Leu
130 135 140
Leu Gly Ala Leu Val Pro Gly Gly Pro Pro Thr Pro Thr Arg Pro Pro
145 150 155 160
Cys Thr Arg Asp Gly Pro Ser Asp Cys Val Leu Ala Ala Asp Trp Leu
165 170 175
Pro Ser Leu Leu Leu Leu Leu Glu Gly Thr Arg Trp Gln Ala Leu Val
180 185 190
Gln Val Gln Pro Ser Val Asp Pro Thr Asn Ala Thr Gly Leu Asp Gly
195 200 205
Arg Glu Ala Ala Pro His Phe Leu Gln Gly Leu Leu Gly Leu Leu Thr
210 215 220
Pro Thr Gly Glu Leu Gly Ser Lys Glu Ala Leu Trp Gly Gly Leu Leu
225 230 235 240
Arg Thr Val Gly Ala Pro Leu Tyr Ala Ala Phe Gln Glu Gly Leu Leu
245 250 255
Arg Val Thr His Ser Leu Gln Asp Glu Val Phe Ser Ile Leu Gly Gln
260 265 270
Pro Glu Pro Asp Thr Asn Gly Gln Cys Gln Gly Val Phe Phe Leu Thr
275 280 285
Leu Ser Leu Leu Gly Asn Leu Gln Gln Leu Leu Leu Trp Gly Val Arg
290 295 300
His Asn Leu Ser Trp Asp Val Gln Ala Leu Gly Phe Leu Ser Gly Ser
305 310 315 320
Pro Pro Pro Pro Pro Ala Leu Leu His Cys Leu Ser Thr Gly Val Pro
325 330 335
Leu Pro Arg Ala Ser Gln Pro Ser Ala His Ile Ser Pro Arg Gln Arg
340 345 350
Arg Ala Ile Thr Val Glu Ala Leu Cys Glu Asn His Leu Gly Pro Ala
355 360 365
Pro Pro Tyr Ser Ile Ser Asn Phe Ser Ile His Leu Leu Cys Gln His
370 375 380
Thr Lys Pro Ala Thr Pro Gln Pro His Pro Ser Thr Thr Ala Ile Cys
385 390 395 400
Gln Thr Ala Val Trp Tyr Ala Val Ser Trp Ala Pro Gly Ala Gln Gly
405 410 415
Trp Leu Gln Ala Cys His Asp Gln Phe Pro Asp Glu Phe Leu Asp Ala
420 425 430
Ile Cys Ser Asn Leu Ser Phe Ser Ala Leu Ser Gly Ser Asn Arg Arg
435 440 445
Leu Val Lys Arg Leu Cys Ala Gly Leu Leu Pro Pro Pro Thr Ser Cys
450 455 460
Pro Glu Gly Leu Pro Pro Val Pro Leu Thr Pro Asp Ile Phe Trp Gly
465 470 475 480
Cys Phe Leu Glu Asn Glu Thr Leu Trp Ala Glu Arg Leu Cys Gly Glu
485 490 495
Ala Ser Leu Gln Ala Val Pro Pro Ser Asn Gln Ala Trp Val Gln His
500 505 510
Val Cys Gln Gly Pro Thr Pro Asp Val Thr Ala Ser Pro Pro Cys His
515 520 525
Ile Gly Pro Cys Gly Glu Arg Cys Pro Asp Gly Gly Ser Phe Leu Val
530 535 540
Met Val Cys Ala Asn Asp Thr Met Tyr Glu Val Leu Val Pro Phe Trp
545 550 555 560
Pro Trp Leu Ala Gly Gln Cys Arg Ile Ser Arg Gly Gly Asn Asp Thr
565 570 575
Cys Phe Leu Glu Gly Leu Leu Gly Pro Leu Leu Pro Ser Leu Pro Pro
580 585 590
Leu Gly Pro Ser Pro Leu Cys Leu Thr Pro Gly Pro Phe Leu Leu Gly
595 600 605
Met Leu Ser Gln Leu Pro Arg Cys Gln Ser Ser Val Pro Ala Leu Ala
610 615 620
His Pro Thr Arg Leu His Tyr Leu Leu Arg Leu Leu Thr Phe Leu Leu
625 630 635 640
Gly Pro Gly Ala Gly Gly Ala Glu Ala Gln Gly Met Leu Gly Arg Ala
645 650 655
Leu Leu Leu Ser Ser Leu Pro Asp Asn Cys Ser Phe Trp Asp Ala Phe
660 665 670
Arg Pro Glu Gly Arg Arg Ser Val Leu Arg Thr Ile Gly Glu Tyr Leu
675 680 685
Glu Gln Asp Glu Glu Gln Pro Thr Pro Ser Gly Phe Glu Pro Thr Val
690 695 700
Asn Pro Ser Ser Gly Ile Ser Lys Met Glu Leu Leu Ala Cys Phe Ser
705 710 715 720
Pro Val Leu Trp Asp Leu Leu Gln Arg Glu Lys Ser Val Trp Ala Leu
725 730 735
Gln Ile Leu Val Gln Ala Tyr Leu His Met Pro Pro Glu Asn Leu Gln
740 745 750
Gln Leu Val Leu Ser Ala Glu Arg Glu Ala Ala Gln Gly Phe Leu Thr
755 760 765
Leu Met Leu Gln Gly Lys Leu Gln Gly Lys Leu Gln Val Pro Pro Ser
770 775 780
Glu Glu Gln Ala Leu Gly Arg Leu Thr Ala Leu Leu Leu Gln Arg Tyr
785 790 795 800
Pro Arg Leu Thr Ser Gln Leu Phe Ile Asp Leu Ser Pro Leu Ile Pro
805 810 815
Phe Leu Ala Val Ser Asp Leu Met Arg Phe Pro Pro Ser Leu Leu Ala
820 825 830
Asn Asp Ser Val Gln Gln Gly Tyr Arg Gly Ser Glu Glu Asn Ser Leu
835 840 845
Glu Glu Asp Lys Gly Leu Arg Pro Met Thr Pro Arg Ser Leu Ala Ala
850 855 860
Ile Arg Asp Tyr Ser Pro Gly Met Arg Pro Glu Gln Lys Glu Ala Leu
865 870 875 880
Ala Lys Arg Leu Leu Ala Pro Glu Leu Phe Gly Glu Val Pro Ala Trp
885 890 895
Pro Gln Glu Leu Leu Trp Ala Val Leu Pro Leu Leu Pro His Leu Pro
900 905 910
Leu Glu Asn Phe Leu Gln Leu Ser Pro His Gln Ile Gln Ala Leu Glu
915 920 925
Asp Ser Trp Pro Ala Ala Gly Leu Gly Pro Gly His Ala Arg His Val
930 935 940
Leu Arg Ser Leu Val Asn Gln Ser Val Gln Asp Gly Glu Glu Gln Val
945 950 955 960
Arg Arg Leu Gly Pro Leu Ala Cys Phe Leu Ser Pro Glu Glu Leu Gln
965 970 975
Ser Leu Val Pro Leu Ser Asp Pro Thr Gly Pro Val Glu Arg Gly Leu
980 985 990
Leu Glu Cys Ala Ala Asn Gly Thr Leu Ser Pro Glu Gly Arg Val Ala
995 1000 1005
Tyr Glu Leu Leu Gly Val Leu Arg Ser Ser Gly Gly Ala Val Leu
1010 1015 1020
Ser Pro Arg Glu Leu Arg Val Trp Ala Pro Leu Phe Ser Gln Leu
1025 1030 1035
Gly Leu Arg Phe Leu Gln Glu Leu Ser Glu Pro Gln Leu Arg Ala
1040 1045 1050
Met Leu Pro Val Leu Gln Gly Thr Ser Val Thr Pro Ala Gln Ala
1055 1060 1065
Val Leu Leu Leu Gly Arg Leu Leu Pro Arg His Asp Leu Ser Leu
1070 1075 1080
Glu Glu Leu Cys Ser Leu His Leu Leu Leu Pro Gly Leu Ser Pro
1085 1090 1095
Gln Thr Leu Gln Ala Ile Pro Arg Arg Val Leu Val Gly Ala Cys
1100 1105 1110
Ser Cys Leu Ala Pro Glu Leu Ser Arg Leu Ser Ala Cys Gln Thr
1115 1120 1125
Ala Ala Leu Leu Gln Thr Phe Arg Val Lys Asp Gly Val Lys Asn
1130 1135 1140
Met Gly Thr Thr Gly Ala Gly Pro Ala Val Cys Ile Pro Gly Gln
1145 1150 1155
Gln Pro Ile Pro Thr Thr Trp Pro Asp Cys Leu Leu Pro Leu Leu
1160 1165 1170
Pro Leu Lys Leu Leu Gln Leu Asp Ser Leu Ala Leu Leu Ala Asn
1175 1180 1185
Arg Arg Arg Tyr Trp Glu Leu Pro Trp Ser Glu Gln Gln Ala Gln
1190 1195 1200
Phe Leu Trp Lys Lys Met Gln Val Pro Thr Asn Leu Thr Leu Arg
1205 1210 1215
Asn Leu Gln Ala Leu Gly Thr Leu Ala Gly Gly Met Ser Cys Glu
1220 1225 1230
Phe Leu Gln Gln Ile Asn Ser Met Val Asp Phe Leu Glu Val Val
1235 1240 1245
His Met Ile Tyr Gln Leu Pro Thr Arg Val Arg Gly Ser Leu Arg
1250 1255 1260
Ala Cys Ile Trp Ala Glu Leu Gln Arg Arg Met Ala Met Pro Glu
1265 1270 1275
Pro Glu Trp Thr Thr Val Gly Pro Glu Leu Asn Gly Leu Asp Ser
1280 1285 1290
Lys Leu Leu Leu Asp Leu Pro Ile Gln Leu Met Asp Arg Leu Ser
1295 1300 1305
Asn Glu Ser Ile Met Leu Val Val Glu Leu Val Gln Arg Ala Pro
1310 1315 1320
Glu Gln Leu Leu Ala Leu Thr Pro Leu His Gln Ala Ala Leu Ala
1325 1330 1335
Glu Arg Ala Leu Gln Asn Leu Ala Pro Lys Glu Thr Pro Val Ser
1340 1345 1350
Gly Glu Val Leu Glu Thr Leu Gly Pro Leu Val Gly Phe Leu Gly
1355 1360 1365
Thr Glu Ser Thr Arg Gln Ile Pro Leu Gln Ile Leu Leu Ser His
1370 1375 1380
Leu Ser Gln Leu Gln Gly Phe Cys Leu Gly Glu Thr Phe Ala Thr
1385 1390 1395
Glu Leu Gly Trp Leu Leu Leu Gln Glu Ser Val Leu Gly Lys Pro
1400 1405 1410
Glu Leu Trp Ser Gln Asp Glu Val Glu Gln Ala Gly Arg Leu Val
1415 1420 1425
Phe Thr Leu Ser Thr Glu Ala Ile Ser Leu Ile Pro Arg Glu Ala
1430 1435 1440
Leu Gly Pro Glu Thr Leu Glu Arg Leu Leu Glu Lys Gln Gln Ser
1445 1450 1455
Trp Glu Gln Ser Arg Val Gly Gln Leu Cys Arg Glu Pro Gln Leu
1460 1465 1470
Ala Ala Lys Lys Ala Ala Leu Val Ala Gly Val Val Arg Pro Ala
1475 1480 1485
Ala Glu Asp Leu Pro Glu Pro Val Pro Asn Cys Ala Asp Val Arg
1490 1495 1500
Gly Thr Phe Pro Ala Ala Trp Ser Ala Thr Gln Ile Ala Glu Met
1505 1510 1515
Glu Leu Ser Asp Phe Glu Asp Cys Leu Thr Leu Phe Ala Gly Asp
1520 1525 1530
Pro Gly Leu Gly Pro Glu Glu Leu Arg Ala Ala Met Gly Lys Ala
1535 1540 1545
Lys Gln Leu Trp Gly Pro Pro Arg Gly Phe Arg Pro Glu Gln Ile
1550 1555 1560
Leu Gln Leu Gly Arg Leu Leu Ile Gly Leu Gly Asp Arg Glu Leu
1565 1570 1575
Gln Glu Leu Ile Leu Val Asp Trp Gly Val Leu Ser Thr Leu Gly
1580 1585 1590
Gln Ile Asp Gly Trp Ser Thr Thr Gln Leu Arg Ile Val Val Ser
1595 1600 1605
Ser Phe Leu Arg Gln Ser Gly Arg His Val Ser His Leu Asp Phe
1610 1615 1620
Val His Leu Thr Ala Leu Gly Tyr Thr Leu Cys Gly Leu Arg Pro
1625 1630 1635
Glu Glu Leu Gln His Ile Ser Ser Trp Glu Phe Ser Gln Ala Ala
1640 1645 1650
Leu Phe Leu Gly Thr Leu His Leu Gln Cys Ser Glu Glu Gln Leu
1655 1660 1665
Glu Val Leu Ala His Leu Leu Val Leu Pro Gly Gly Phe Gly Pro
1670 1675 1680
Ile Ser Asn Trp Gly Pro Glu Ile Phe Thr Glu Ile Gly Thr Ile
1685 1690 1695
Ala Ala Gly Ile Pro Asp Leu Ala Leu Ser Ala Leu Leu Arg Gly
1700 1705 1710
Gln Ile Gln Gly Val Thr Pro Leu Ala Ile Ser Val Ile Pro Pro
1715 1720 1725
Pro Lys Phe Ala Val Val Phe Ser Pro Ile Gln Leu Ser Ser Leu
1730 1735 1740
Thr Ser Ala Gln Ala Val Ala Val Thr Pro Glu Gln Met Ala Phe
1745 1750 1755
Leu Ser Pro Glu Gln Arg Arg Ala Val Ala Trp Ala Gln His Glu
1760 1765 1770
Gly Lys Glu Ser Pro Glu Gln Gln Gly Arg Ser Thr Ala Trp Gly
1775 1780 1785
Leu Gln Asp Trp Ser Arg Pro Ser Trp Ser Leu Val Leu Thr Ile
1790 1795 1800
Ser Phe Leu Gly His Leu Leu
1805 1810
<210> 2
<211> 5433
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
atggctctca gcctctggcc cctgctgctg ctgctgctgc tgctgctgct gctgtccttt 60
gcagtgactc tggcccctac tgggcctcat tccctggacc ctggtctctc cttcctgaag 120
tcattgctct ccactctgga ccaggctccc cagggctccc tgagccgctc acggttcttt 180
acattcctgg ccaacatttc ttcttccttt gagcctggga gaatggggga aggaccagta 240
ggagagcccc cacctctcca gccgcctgct ctgcggctcc atgattttct agtgacactg 300
agaggtagcc ccgactggga gccaatgcta gggctgctag gggatatgct ggcactgctg 360
ggacaggagc agactccccg agatttcctg gtgcaccagg caggggtgct gggtggactt 420
gtggaggtgc tgctgggagc cttagttcct gggggccccc ctaccccaac tcggccccca 480
tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg actggttgcc ttctctgctg 540
ctgttgttag agggcacacg ctggcaagct ctggtgcagg tgcagcccag tgtggacccc 600
accaatgcca caggcctcga tgggagggag gcagctcctc actttttgca gggtctgttg 660
ggtttgctta ccccaacagg ggagctaggc tccaaggagg ctctttgggg cggtctgcta 720
cgcacagtgg gggcccccct ctatgctgcc tttcaggagg ggctgctccg tgtcactcac 780
tccctgcagg atgaggtctt ctccattttg gggcagccag agcctgatac caatgggcag 840
tgccagggag ttttcttcct tactctttcc ctcctaggta accttcaaca gctgctctta 900
tggggcgtcc ggcacaacct ttcctgggat gtccaggcgc tgggctttct gtctggatca 960
ccacccccac cccctgccct ccttcactgc ctgagcacgg gcgtgcctct gcccagagct 1020
tctcagccgt cagcccacat cagcccacgc caacggcgag ccatcactgt ggaggccctc 1080
tgtgagaacc acttaggccc agcaccaccc tacagcattt ccaacttctc catccacttg 1140
ctctgccagc acaccaagcc tgccactcca cagccccatc ccagcaccac tgccatctgc 1200
cagacagctg tgtggtatgc agtgtcctgg gcaccaggtg cccaaggctg gctacaggcc 1260
tgccacgacc agtttcctga tgagtttttg gatgcgatct gcagtaacct ctccttttca 1320
gccctgtctg gctccaaccg ccgcctggtg aagcggctct gtgctggcct gctcccaccc 1380
cctaccagct gccctgaagg cctgccccct gttcccctca ccccagacat cttttggggc 1440
tgcttcttgg agaatgagac tctgtgggct gagcgactgt gtggggaggc aagtctacag 1500
gctgtgcccc ccagcaacca ggcttgggtc cagcatgtgt gccagggccc caccccagat 1560
gtcactgcct ccccaccatg ccacattgga ccctgtgggg aacgctgccc ggatgggggc 1620
agcttcctgg tgatggtctg tgccaatgac accatgtatg aggtcctggt gcccttctgg 1680
ccttggctag caggccaatg caggataagt cgtgggggca atgacacttg cttcctagaa 1740
gggctgctgg gcccccttct gccctctctg ccaccactgg gaccatcccc actctgtctg 1800
acccctggcc ccttcctcct tggcatgcta tcccagttgc cacgctgtca gtcctctgtc 1860
ccagctcttg ctcaccccac acgcctacac tatctcctcc gcctgctgac cttcctcttg 1920
ggtccagggg ctgggggcgc tgaggcccag gggatgctgg gtcgggccct actgctctcc 1980
agtctcccag acaactgctc cttctgggat gcctttcgcc cagagggccg gcgcagtgtg 2040
ctacggacga ttggggaata cctggaacaa gatgaggagc agccaacccc atcaggcttt 2100
gaacccactg tcaaccccag ctctggtata agcaagatgg agctgctggc ctgctttagt 2160
cctgtgctgt gggatctgct ccagagggaa aagagtgttt gggccctgca gattctagtg 2220
caggcgtacc tgcatatgcc cccagaaaac ctccagcagc tggtgctttc agcagagagg 2280
gaggctgcac agggcttcct gacactcatg ctgcagggga agctgcaggg gaagctgcag 2340
gtaccaccat ccgaggagca ggccctgggt cgcctgacag ccctgctgct ccagcggtac 2400
ccacgcctca cctcccagct cttcattgac ctgtcaccac tcatcccttt cttggctgtc 2460
tctgacctga tgcgcttccc accatccctg ttagccaacg acagtgtaca gcagggctac 2520
agagggtcag aggaaaacag tttggaggaa gacaaagggt taagacccat gactcctcgc 2580
agcctggctg ccatccggga ttacagccca ggaatgaggc ctgaacagaa ggaggctctg 2640
gcaaagcgac tgctggcccc tgaactgttt ggggaagtgc ctgcctggcc ccaggagctg 2700
ctgtgggcag tgctgcccct gctcccccac ctccctctgg agaacttttt gcagctcagc 2760
cctcaccaga tccaggccct ggaggatagc tggccagcag caggtctggg gccagggcat 2820
gcccgccatg tgctgcgcag cctggtaaac cagagtgtcc aggatggtga ggagcaggta 2880
cgcaggcttg ggcccctcgc ctgtttcctg agccctgagg agctgcagag cctagtgccc 2940
ctgagtgatc caacggggcc agtagaacgg gggctgctgg aatgtgcagc caatgggacc 3000
ctcagcccag aaggacgggt ggcatatgaa cttctgggtg tgttgcgctc atctggagga 3060
gcggtgctga gcccccggga gctgcgggtc tgggcccctc tcttctctca gctgggcctc 3120
cgcttccttc aggagctgtc agagccccag cttagagcca tgcttcctgt cctgcaggga 3180
actagtgtta cacctgctca ggctgtcctg ctgcttggac ggctccttcc taggcacgat 3240
ctatccctgg aggaactctg ctccttgcac cttctgctac caggcctcag cccccagaca 3300
ctccaggcca tccctaggcg agtcctggtc ggggcttgtt cctgcctggc ccctgaactg 3360
tcacgcctct cagcctgcca gaccgcagca ctgctgcaga cctttcgggt taaagatggt 3420
gttaaaaata tgggtacaac aggtgctggt ccagctgtgt gtatccctgg tcagcagcct 3480
attcccacca cctggccaga ctgcctgctt cccctgctcc cattaaagct gctacaactg 3540
gattccttgg ctcttctggc aaatcgaaga cgctactggg agctgccctg gtctgagcag 3600
caggcacagt ttctctggaa gaagatgcaa gtacccacca accttaccct caggaatctg 3660
caggctctgg gcaccctggc aggaggcatg tcctgtgagt ttctgcagca gatcaactcc 3720
atggtagact tccttgaagt ggtgcacatg atctatcagc tgcccactag agttcgaggg 3780
agcctgaggg cctgtatctg ggcagagcta cagcggagga tggcaatgcc agaaccagaa 3840
tggacaactg tagggccaga actgaacggg ctggatagca agctactcct ggacttaccg 3900
atccagttga tggacagact atccaatgaa tccattatgt tggtggtgga gctggtgcaa 3960
agagctccag agcagctgct ggcactgacc cccctccacc aggcagccct ggcagagagg 4020
gcactacaaa acctggctcc aaaggagact ccagtctcag gggaagtgct ggagacctta 4080
ggccctttgg ttggattcct ggggacagag agcacacgac agatccccct acagatcctg 4140
ctgtcccatc tcagtcagct gcaaggcttc tgcctaggag agacatttgc cacagagctg 4200
ggatggctgc tattgcagga gtctgttctt gggaaaccag agttgtggag ccaggatgaa 4260
gtagagcaag ctggacgcct agtattcact ctgtctactg aggcaatttc cttgatcccc 4320
agggaggcct tgggtccaga gaccctggag cggcttctag aaaagcagca gagctgggag 4380
cagagcagag ttggacagct gtgtagggag ccacagcttg ctgccaagaa agcagccctg 4440
gtagcagggg tggtgcgacc agctgctgag gatcttccag aacctgtgcc aaattgtgca 4500
gatgtacgag ggacattccc agcagcctgg tctgcaaccc agattgcaga gatggagctc 4560
tcagactttg aggactgcct gacattattt gcaggagacc caggacttgg gcctgaggaa 4620
ctgcgggcag ccatgggcaa agcaaaacag ttgtggggtc ccccccgggg atttcgtcct 4680
gagcagatcc tgcagcttgg taggctctta ataggtctag gagatcggga actacaggag 4740
ctgatcctag tggactgggg agtgctgagc accctggggc agatagatgg ctggagcacc 4800
actcagctcc gcattgtggt ctccagtttc ctacggcaga gtggtcggca tgtgagccac 4860
ctggacttcg ttcatctgac agcgctgggt tatactctct gtggactgcg gccagaggag 4920
ctccagcaca tcagcagttg ggagttcagc caagcagctc tcttcctcgg caccctgcat 4980
ctccagtgct ctgaggaaca actggaggtt ctggcccacc tacttgtact gcctggtggg 5040
tttggcccaa tcagtaactg ggggcctgag atcttcactg aaattggcac catagcagct 5100
gggatcccag acctggctct ttcagcactg ctgcggggac agatccaggg cgttactcct 5160
cttgccattt ctgtcatccc tcctcctaaa tttgctgtgg tgtttagtcc catccaacta 5220
tctagtctca ccagtgctca ggctgtggct gtcactcctg agcaaatggc ctttctgagt 5280
cctgagcagc gacgagcagt tgcatgggcc caacatgagg gaaaggagag cccagaacag 5340
caaggtcgaa gtacagcctg gggcctccag gactggtcac gaccttcctg gtccctggta 5400
ttgactatca gcttccttgg ccacctgcta tga 5433
<210> 3
<211> 5433
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 密码子优化的人静纤毛蛋白cDNA
<400> 3
atggctctgt ctctgtggcc tctgctgctg ctcctgttgc tgcttctgct gctcagcttc 60
gccgtgacac tggctccaac aggaccccac tctctggatc ctggcctgag ctttctgaag 120
tccctgctga gcaccctgga tcaggctcct cagggcagcc tgagcagatc cagattcttc 180
accttcctgg ccaacatcag cagcagcttc gagcctggca gaatgggaga aggacctgtg 240
ggagaacctc ctccactgca acctccagct ctgcggctgc acgattttct ggtcacactg 300
agaggcagcc ccgactggga acctatgctg ggactgctgg gagatatgct ggccctgctc 360
ggacaagagc agacccctag agatttcctg gtgcatcagg ctggcgtgct cggaggactg 420
gttgaagttc tgcttggagc actggtgcct ggcggacctc ctacacctac aagacctcca 480
tgcaccagag atggccccag cgattgtgtg ctggctgctg attggctgcc tagcctgctc 540
ctgcttctgg aaggcacaag atggcaggcc ctggtgcagg ttcagccttc tgtggatcct 600
accaatgcca ccggcctgga tggaagagaa gccgctccac actttctgca gggactgctt 660
ggactgctca cacctactgg cgagctgggc tctaaagaag ccctttgggg aggcctgctg 720
agaacagttg gagcccctct gtacgccgcc tttcaagagg gactcctgag agtgacacac 780
agcctgcagg acgaggtgtt cagcatcctg ggacagccag agcctgacac caatggacag 840
tgtcagggcg tgttctttct gaccctgagc ctgctgggca acctgcagca actgcttctg 900
tggggcgtca gacacaacct gagctgggat gtgcaggcac tgggctttct gtctggaagc 960
cctccacctc caccagcact gctgcattgt ctgtctactg gcgtgccact gcctagagcc 1020
tctcagccta gcgctcacat cagccccaga cagagaaggg ccatcaccgt ggaagctctg 1080
tgcgagaatc acctgggacc tgctcctcca tacagcatca gcaacttctc catccatctg 1140
ctgtgtcagc acaccaagcc tgccacacct cagcctcatc ctagcaccac agccatctgt 1200
cagaccgccg tttggtacgc cgtttcttgg gctcctggtg ctcaaggatg gctgcaggcc 1260
tgtcacgatc agttccccga cgagttcctg gacgccatct gcagcaatct gagcttctct 1320
gccctgtccg gcagcaatcg gagactggtc aaaagactgt gcgccggact gctgcctcct 1380
ccaacatctt gtcctgaggg actgcctcct gtgcctctga ctcccgatat cttttggggc 1440
tgcttcctgg aaaacgagac actgtgggcc gagagactgt gtggcgaagc ctctctgcaa 1500
gccgtgcctc catctaatca ggcctgggtg cagcacgttt gtcagggccc tacacctgac 1560
gtgacagcct ctcctccttg tcacatcgga ccttgcggcg agagatgtcc tgatggcggc 1620
agctttctcg tgatggtctg cgccaacgac actatgtacg aggtgctggt gcccttctgg 1680
ccttggctgg ctggccagtg tagaatctcc agaggcggca acgatacctg tttcctggaa 1740
ggactcctgg gaccactgct tccatctctg cctccgcttg gaccctctcc tctgtgtctt 1800
acccctggac ctttcctgct ggggatgctg tctcagctgc ctagatgcca gtctagcgtg 1860
ccagctctgg cccatccaac cagactgcac tatctgttgc ggctgctgac cttcctcctt 1920
ggacctggcg ctggcggagc tgaagctcaa ggcatgcttg gcagagccct gctgctgtca 1980
tccctgcctg acaactgcag cttctgggac gccttcagac ctgaaggacg cagaagcgtg 2040
ctgaggacca tcggcgagta cctggaacag gatgaggaac agcctacacc aagcggcttc 2100
gaacccaccg tgaatcctag cagcggcatc tccaagatgg aactgctggc ctgcttcagc 2160
cccgtgctgt gggatctgct gcagagggaa aaaagcgtgt gggccctgca gatcctggtc 2220
caggcctatc tgcacatgcc tccagagaac ctgcaacagc tggtgctgtc tgccgagaga 2280
gaagctgccc agggattcct gactctgatg ctgcagggaa agctgcaggg caaactccag 2340
gtgccaccta gcgaagaaca ggcccttggc agactgacag cactcctgct ccagagatac 2400
cccagactga cctctcagct gtttatcgat ctgagccctc tgatcccatt cctggccgtg 2460
tccgacctga tgagattccc tcctagtctg ctggccaacg actccgtgca gcagggatac 2520
agaggcagcg aggaaaacag cctggaagag gacaaaggcc tgcggcctat gacacctaga 2580
tctctggccg ccatccggga ttacagccct ggaatgaggc ccgagcagaa agaggccctg 2640
gctaagagac tgctggctcc cgagctgttt ggcgaagttc cagcctggcc tcaagaactg 2700
ctgtgggctg ttctgcccct gctgccacat ctgcctctgg aaaacttcct gcagctgagc 2760
ccacaccaga ttcaggccct cgaggattct tggcctgccg ctggactcgg acctggacat 2820
gctagacacg tgctgagaag cctggtcaac cagagcgttc aggacggcga ggaacaagtg 2880
cggagacttg gacccctggc ctgttttctg agccccgagg aactgcagag tctggtgcct 2940
ctgtctgacc ctacaggccc tgttgaaagg ggcctgctgg aatgtgccgc caatggaaca 3000
ctgagccctg agggcagagt ggcctatgaa cttctgggag tgctgagatc tagcggcgga 3060
gccgttctgt cccctaggga acttagagtg tgggcacccc tgtttagcca gctgggcctg 3120
agattcctgc aagagctgtc tgagccacag ctgagggcta tgctgcctgt gctccagggc 3180
acatctgtga caccagctca agccgtcctg ctgttgggca gactgctccc tagacacgat 3240
ctgtccctgg aagaactgtg cagcctgcac ttgctgctgc ctggactgtc tcctcagaca 3300
ctgcaggcca ttcctcggag agtgcttgtg ggagcctgta gctgtctggc ccctgagctg 3360
tctagactga gcgcctgtca aacagccgct ctcctgcaga ccttcagagt gaaggatggc 3420
gtgaagaaca tgggcaccac aggcgctgga cctgccgtgt gtattcctgg acagcagccc 3480
attcctacca cctggccaga ttgtctgctc ccactgctgc ccctgaaact gctgcagctg 3540
gattctctgg ctctgctggc taaccggcgg agatattggg aactgccttg gagcgaacag 3600
caggcacagt tcctgtggaa gaagatgcag gtccccacca atctgacact gcggaatctg 3660
caggctctcg gcacacttgc tggcggaatg agctgcgagt tcctccagca gatcaacagc 3720
atggtggact ttctggaagt ggtgcacatg atctaccagc tgccaaccag agtgcgggga 3780
agcctgagag cttgtatttg ggctgaactg cagcggcgga tggccatgcc tgaacctgaa 3840
tggacaacag tgggccccga gctgaacggc ctggactcta aacttctgct ggatctcccc 3900
atccagctga tggacagact gagcaacgag agcatcatgc tggtggtgga actggtgcag 3960
agagccccag aacagctgct ggcactgaca cctctgcatc aagctgctct ggccgaacgg 4020
gcccttcaga atctggctcc caaagaaacc cctgtgtccg gggaagtgct ggaaacactg 4080
ggacctcttg tgggcttcct gggcaccgag tctaccagac agattcctct ccagatcctg 4140
ctgtcccacc tgagccagct ccagggattt tgtctgggcg agacattcgc caccgaactc 4200
ggatggttgc tgctccaaga gagcgtgctg ggaaagcccg aactgtggtc acaggacgaa 4260
gtggaacagg ccggcagact ggtgtttacc ctgtctaccg aggccatcag tctgatcccc 4320
agagaagcac tgggccctga aacactcgag aggctgctgg aaaagcagca gtcttgggaa 4380
cagagcagag tgggccagct gtgtagagaa cctcagctgg ccgctaaaaa ggccgcactg 4440
gttgctggcg ttgtcagacc tgctgccgag gatctgccag agccagtgcc taattgtgcc 4500
gatgtgcggg gcacatttcc tgccgcttgg agcgctacac agatcgccga aatggaactg 4560
agcgacttcg aggactgtct gactctgttt gccggcgatc ctggactggg accagaagaa 4620
ctgagagccg ccatgggcaa agccaagcaa ctttggggac ctccaagagg cttcagaccc 4680
gaacagattc tgcagctcgg ccgcctgctt atcggactgg gcgatagaga gctgcaagaa 4740
ctgatcctgg tggactgggg cgtgctgtct actctgggac aaatcgacgg ctggtccacc 4800
acacagctgc ggattgtggt gtccagcttc ctgaggcagt ctggcagaca tgtgtctcac 4860
ctggacttcg tgcacctgac tgccctgggc tacacactgt gtggactgcg gcctgaggaa 4920
cttcagcaca tcagctcttg ggagttcagc caggcagccc tgtttctggg aaccctgcat 4980
ctgcagtgct ccgaagaaca actggaagtg ctcgcccatc tgctcgtgct gccaggcgga 5040
tttggcccca tctctaattg gggacccgag atcttcaccg agatcggcac cattgccgct 5100
ggcatccctg atctggccct gtctgcactg ctgagaggac agatccaggg cgtgacacca 5160
ctggccatta gcgtgatccc tccaccaaag ttcgccgtgg tgtttagccc cattcagctg 5220
tccagcctga catctgccca agccgtggct gtgacccctg aacagatggc atttctgtct 5280
cccgagcagc ggagagctgt tgcttgggct caacacgagg gcaaagagag tcctgagcaa 5340
cagggaagaa gcaccgcttg gggactgcag gattggtcca gaccttcttg gtcactggtg 5400
ctgaccatca gctttctggg ccacctcctg tga 5433
<210> 4
<211> 19238
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
gccctgccct cacctggcta tcccacacag gtgagaataa ccagaactca cctccggtac 60
cagtgttcac ttggaaacat ggctctcagc ctctggcccc tgctgctgct gctgctgctg 120
ctgctgctgc tgtcctttgc aggtaagaag aacagtgagc agaactgggg atgaggagga 180
gggtggctgg aaaaagactt taagaatatg gaggtgaacc tgttagatag aaggacaaag 240
gagagaggca gagacttgtg caaaagggaa aaatgagggt taagaaaagc aggccaagac 300
ttactgtagg ccagtgaaag gggttcagct caccatcccc tcacctcatc tttagatcca 360
ggtagggaac tgtgctcagg ggcagggttg agtttgggct ctgtgttcct ctccttcagt 420
gacctctggt ttctctcctt acagtgactc tggcccctac tgggcctcat tccctggacc 480
ctggtctctc cttcctgaag tcattgctct ccactctgga ccaggctccc cagggctccc 540
tgagccgctc acggttcttt acattcctgg ccaacatttc ttcttccttt gagcctggga 600
gaatggggga aggaccagta ggagagcccc cacctctcca gccgcctgct ctgcggctcc 660
atgattttct agtgacactg agaggtagcc ccgactggga gccaatgcta gggctgctag 720
gggatatgct ggcactgctg ggacaggagc agactccccg agatttcctg gtgcaccagg 780
caggggtgct gggtggactt gtggaggtgc tgctgggagc cttagttcct gggggccccc 840
ctaccccaac tcggccccca tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg 900
actggttgcc ttctctgctg ctgttgttag agggcacacg ctggcaagct ctggtgcagg 960
tgcagcccag tgtggacccc accaatgcca caggcctcga tgggagggag gcagctcctc 1020
actttttgca gggtctgttg ggtttgctta ccccaacagg ggagctaggc tccaaggagg 1080
ctctttgggg cggtctgcta cgcacagtgg gggcccccct ctatgctgcc tttcaggagg 1140
ggctgctccg tgtcactcac tccctgcagg atgaggtctt ctccattttg gggcagccag 1200
agcctgatac caatgggcag tgccagggag gtgagtgtgg ccagggctgg gactgggatg 1260
tggcagggca aggaaagtga aattggggta gttttcttcc ttactctttc cctcctaggt 1320
aaccttcaac agctgctctt atggtaagta acaggagacc agttctgagg gattgggcct 1380
ggaaaatctg gaggtgaaga gctgaagacc tcagcctcta gagaggaaaa ctgatgggag 1440
gagtgtagtt tagtggtttt ggggtgtgac tgtctgggtt ggtgtcccag ctccacctct 1500
tcctagccat atgaccttga gcaggttaca tagtctttct atacctcagt ttccccattt 1560
ataaaatgag aatgataata ttagttacca cagagttgtt gcacccggtt aaatgagttg 1620
atactgtgta tgcaaacgac ttaaaaccgt gctggcacat agcgcttaat aatgttagct 1680
agtaaagatg ggatttggaa aataaggaca cagctggatt cctctacccc cttactactt 1740
cagtacaaca atgccagaca gtagttagac atattgagtt gctgagcaga tttcctaaca 1800
tgaggcccgc tgagggttgt gtttaagcta tctaaaagca tacgaagaaa ggagacagaa 1860
gggggccagg tggacagaaa gaattccaac tggggcttct cctaggtgat tttggacctt 1920
ggcagggcag ctttctcttt tttgccccgt tgcagcattt caaccagtaa cgcctaaact 1980
ctcagggacc tcgcttgtag aaaagcctat gcttgccatg ccccttgagg gctctgagtc 2040
agggtcagaa tcttcagctg gaggaaatgt gaactgacca gatcctgcct gctcctccct 2100
ctgcacccag gggcgtccgg cacaaccttt cctgggatgt ccaggcgctg ggctttctgt 2160
ctggatcacc acccccaccc cctgccctcc ttcactgcct gagcacgggc gtgcctctgc 2220
ccagagcttc tcagccgtca gcccacatca gcccacgcca acggcgagcc atcactgtgg 2280
aggccctctg tgagaaccac ttaggcccag caccacccta cagcatttcc aacttctcca 2340
tccacttgct ctgccagcac accaagcctg ccactccaca gccccatccc agcaccactg 2400
ccatctgcca gacagctgtg tggtatgcag tgtcctgggc accaggtgcc caaggctggc 2460
tacaggcctg ccacgaccag tttcctgatg agtttttgga tgcgatctgc agtaacctct 2520
ccttttcagc cctgtctggc tccaaccgcc gcctggtgaa gcggctctgt gctggcctgc 2580
tcccaccccc taccagctgc cctgaaggcc tgccccctgt tcccctcacc ccagacatct 2640
tttggggctg cttcttggag aatgagactc tgtgggctga gcgactgtgt ggggaggcaa 2700
gtctacaggc tgtgcccccc agcaaccagg cttgggtcca gcatgtgtgc cagggcccca 2760
ccccagatgt cactgcctcc ccaccatgcc acattggacc ctgtggggaa cgctgcccgg 2820
atgggggcag cttcctggtg atggtctgtg ccaatgacac catgtatgag gtcctggtgc 2880
ccttctggcc ttggctagca ggccaatgca ggataagtcg tgggggcaat gacacttgct 2940
tcctagaagg gctgctgggc ccccttctgc cctctctgcc accactggga ccatccccac 3000
tctgtctgac ccctggcccc ttcctccttg gcatgctatc ccagttgcca cgctgtcagt 3060
cctctgtccc agctcttgct caccccacac gcctacacta tctcctccgc ctgctgacct 3120
tcctcttggg tccaggggct gggggcgctg aggcccaggg gatgctgggt cgggccctac 3180
tgctctccag tctcccagac aactgctcct tctgggatgc ctttcgccca gagggccggc 3240
gcagtgtgct acggacgatt ggggaatacc tggaacaaga tgaggagcag ccaaccccat 3300
caggctttga acccactgtc aaccccagct ctggtataag caagatggag ctgctggcct 3360
gctttagtgt gagtgctctg ccagagggaa agctcctaga acagtgagaa ggccctccag 3420
gggaattcct cgaatactca gaggcagtag tgtggggtag tagttgaagc acacagctct 3480
agagtcagac aggcttggat tcatatcttg gttctgtgac cagccttgaa tgagttattt 3540
aacttctctg agcaatattt ttctcgtctc atttataaac tagggatgat aatggtatat 3600
gagataatac atgctgtggg cttagcacag tgcatgatac acaaacatgc aataaatatt 3660
accttgttat tcttttgggc tctttgactc tctcactttc tgcaccagaa agaaaaagga 3720
tcaagttaga ggactctaaa tttttcccct agagagtgag aattggaggc tggcagaata 3780
caggaagata aggtaggaat gagaaagatt cagggacact accaatcaga agactttggt 3840
tctaggttca actgtgccac aaattagtgt gatcttaggc aagcaatttc atttagtttt 3900
tctgggcttc agtttttagt ctgtagaatg gaggggtgag aatatgttaa acaccataat 3960
taattcactg agtgcctatt atatgcaagg cactttgcta ggttctgtag gatatataaa 4020
gatttcttac tccatgttgg ggccaccttt ttcaaaccct gggcccagta aaatggaatt 4080
agatagtctc atagtatttg gttcaggtct acaagtatta attgagccaa ctatggacct 4140
ggcatgggag agggtacaag agaaattaga gatatgatcc cggacctaaa agagcttaat 4200
atctgaagaa tcacacttga gatgatggac aagcatccca gcaagtggag ctggaatgcc 4260
tgggggagct gcaggagaga cagagaagac agctctgttg gcatattgtc tttcttccca 4320
ccagcctgtg ctgtgggatc tgctccagag ggaaaagagt gtttgggccc tgcagattct 4380
agtgcaggta acaggtggag ggcacatggg tgggctgggt gacagccatg gctggaggtc 4440
cctgccccgt gaggtgaggc catacccacc atgacctcct attcgcaggc gtacctgcat 4500
atgcccccag aaaacctcca gcagctggtg ctttcagcag agagggaggc tgcacagggc 4560
ttcctgacac tcatgctgca ggggaagctg caggggaagc tgcaggtgag cactgagaaa 4620
ggggagcaag ggcacctgga gcctagtgtt cagagggctt gctttagtgg gaggaggaac 4680
tccagagagg aaatggcagg gatactgagc atctccagag gcagaatcca ttcctgtgcc 4740
cctacaggta ccaccatccg aggagcaggc cctgggtcgc ctgacagccc tgctgctcca 4800
gcggtaccca cgcctcacct cccagctctt cattgacctg tcaccactca tccctttctt 4860
ggctgtctct gacctgatgc gcttcccacc atccctgtta gccaacgaca gtgtgtaagg 4920
ttcttgcact actcctcctg ctcctgtcac ggtcaggcca accgcatcca cctggagcag 4980
ccccttccgg agctcctctc tgtttttttc tttcatgcca gataggcaat gtgccaacat 5040
cgtagcaagg tttgagagag gcacatctca cgcctgagtg tgaaaaccca atcattatgc 5100
taatgaacta caaaaggatc agagagctcc tctctattaa aaccagggag aggatgggcg 5160
tggtggctca tgcctgtaat cccagcacgt tgggagcccg aggcaggtgg atcactaggt 5220
ccgcctagtg agttcgagac cagcctggcc aatatggtga aaccccgtct ctattaaact 5280
acaaaaatta gccaggcatg gtggtgggcg cttgtagtcc cagttactct ggaggctgag 5340
gcaggaggat agcttgaacc tgggaggcag aggttgcagt gaaccaagat cgtgccactg 5400
cactccagcc tgggtgacag agcgagactc cgtcttaaaa aaaacaaaaa acaaaacaaa 5460
acaaaaaaac agggagagtc tccttcctat ctagacagca gggctacaga gggtcagagg 5520
aaaacagttt ggaggaagac aaagggttaa gacccatgac tcctcgcagc ctggctgcca 5580
tccgggatta cagcccagga atgaggcctg aacagaagga ggctctggca aagcgactgc 5640
tggcccctga actgtttggg gaagtgcctg cctggcccca ggagctgctg tgggcagtgc 5700
tgcccctgct cccccacctc cctctggaga actttttgca gctcagccct caccaggtat 5760
gagaatcatc ttctttactt gactggccca tcttctgcta gtggggacaa agagtcaatg 5820
gcatgtctct cagtggcccc tccctgcaag aaccctatag tgaccccagt gcgagctaac 5880
cttccccatc tcagatccag gccctggagg atagctggcc agcagcaggt ctggggccag 5940
ggcatgcccg ccatgtgctg cgcagcctgg taaaccagag tgtccaggat ggtgaggagc 6000
aggtacgcag gtgagttgtt gtgggatcag taaccaaggc aagagtggaa gaggtagaga 6060
gaggaaggca cagctgtcac gctgggtcgg tgttctagga agaaaggggc aagagagtag 6120
gcagtggcct caggcagcat agagttccag gagagaggtc tatagatggt gcccctgtgt 6180
agtggtgtag tgtcagagtg cccagtgtat gtacccatac catctgctgc caggcctgcc 6240
ttagtgctag tcttggggac cacacaaagg tcagcttcat gccctcctca ggcttgggcc 6300
cctcgcctgt ttcctgagcc ctgaggagct gcagagccta gtgcccctga gtgatccaac 6360
ggggccagta gaacgggggc tgctggaatg tgcagccaat gggaccctca gcccagaagg 6420
acgggtgagc ccctcagcac aagcctacaa gactttaggc ttcccctggg tctgtgtgga 6480
tggctttccc attgtgtcaa cttgagcaca gtggtgccag cccccatccc acttttgcaa 6540
cctccattcc ttactccatg gccattctta cctgttacca cctcttcctg gcccttctct 6600
atctggtctg tagcacccca aacataccct ttgccatttt gaacctaatc tactccagtc 6660
caatccctag ttccaaaccc tagcccaggc cctgggaaat tcagatgtgg gattagagag 6720
gaagttcaag gttcatctgt cttttctctc cagtcctaaa ccttctttgg ttacaggtgg 6780
catatgaact tctgggtgtg ttgcgctcat ctggaggagc ggtgctgagc ccccgggagc 6840
tgcgggtctg ggcccctctc ttctctcagc tgggcctccg cttccttcag gagctgtcag 6900
agccccagct tagagccatg cttcctgtcc tgcagggaac tagtgttaca cctgctcagg 6960
tttgcctgtc tcactccctg gcatgtaccc tccatccccg cttgagcccc agtcaagaga 7020
atcccattca gggataaaag cagcccctcc tttccctggg tgaacagtag aggtaaactc 7080
tgtctgcagg aggacgcctt cattcccttt cctcagatca agaagggacc tgagtcactg 7140
aggatggtta ctagggatgg ttaagaggca gcgggaagtt ttggagggtt tgccttagga 7200
acccacttag gacctggctg ctgggtcctg agagctgttg ttttcggtcc catcccaaca 7260
caggctgtcc tgctgcttgg acggctcctt cctaggcacg atgtgagtag cagcaacttc 7320
tcagcctccc gccagaggtc tctatcctct tttaacctgg ctcctgcatc tgcccctcct 7380
ctctctccgc tcccctcata cttactgcct tgctgcattg tgattgttgt cttccccaac 7440
acccttccct tcttcttcag gcctcttgtc tctcttgctc tttagctatc cctggaggaa 7500
ctctgctcct tgcaccttct gctaccaggc ctcagccccc agacactcca ggccatccct 7560
aggcgagtcc tggtcggggc ttgttcctgc ctggcccctg aactgtcacg cctctcagcc 7620
tgccagaccg cagcactgct gcagaccttt cgggtatgag agtggcaagg aggatgagat 7680
aatcagggat accggctctt tctggttggg aggaaggcat cttccctgag gccagggaag 7740
gcctttcata cctccccact tacacacaca cacacacaca cacacacaca cacacacaca 7800
accaattctc atgcaggtta aagatggtgt taaaaatatg ggtacaacag gtgctggtcc 7860
agctgtgtgt atccctggtc aggtaagtgt gagatctccc aactgagctc ctctccccat 7920
tctggggcag tttcatatgg ctggtgctac ctcccacact accctgcagt ggccctgaga 7980
gttctggtta gctctgtgcc cattagcagc cctccccagt gccagatgca ggacagcatg 8040
atccactcac attgtcctag actaatgtca aagctggaag ggcctgagaa atcttccagg 8100
ccacccaccc tgctttcaga tgaaaagacc aaggctggga gaagctaagg gactttgttt 8160
gcctggtgcc taactagcag caacacttga ccacagcagc ctgcagtgtg aggctcttag 8220
gcgtttattg ctacagtggc aaatgccatt ccacttctgt cctagctttg gtccctttcc 8280
acccccatgg ttccttttct ctgagtgcta agtacagact ctctcaccta tcactacact 8340
gctataccca tcaccgccag cagcctattc ccaccacctg gccagactgc ctgcttcccc 8400
tgctcccatt aaagctgcta caactggatt ccttggctct tctggcaaat cgaagacgct 8460
actgggagct gccctggtct gagcagcagg taattctccc cacttaattt cagaacttcc 8520
tccctcaatg tagtctacct tctttaccta tcccttagcc ctatttggcc agcttatccc 8580
tactatcctt tatttgattg tttgagatac agtctcactc tgttgcccag gctgcagtgc 8640
agtggcatga tcagagttcg ctgtaacctc aaactcctga gctcaggcaa tctttctgcc 8700
tcagcctcct gaatagctag gacgacaggt ggttaccacc atgcctggct aatttttaaa 8760
tttttttttt gttttttgag atgaagtctt gctctgtcac ccaggcttga gtacagtggc 8820
acaagcttgg ctcactgcaa cctctgtctc ccgggttcaa gcgattctcc tgcctcagcc 8880
tcccgagtag ctgggactac aggcactccc cacaatgcct ggctaatttt ttttttgttt 8940
tagtagagac agggtttcac catattggcc aggctggtct cgaactgctg accttgtgat 9000
ctgcctgcct ctgcctctca aagtgctggg attacaggtg tgagccacca tgcccggcca 9060
atttttaaat tttttgtaga gacagacaat acaaaaatgt ggacactatg tggagacact 9120
atgttgaggt actatgctgt ccagattggt cttgaactcc tggcctcaag caatcctcct 9180
gccttggcct cccaaagtgc tgggattaca gacctgagcc actgcaccca gccccctagt 9240
atctcttata atgtgacttg cttttctttt tctttctcct tcccttttct ttcatttctt 9300
tctcactctc gagagaagag tgggcatctg ggagagtggg aggctggtgg gtcccacaga 9360
gtgaggaggc aggactgggt ccaaggcagt cctgcctctc cactctaggg ggtatccttg 9420
gacagtgtct cttctgggaa ggggctcgtc tttctttctc ttgtaggcac agtttctctg 9480
gaagaagatg caagtaccca ccaaccttac cctcaggaat ctgcagtgag taacttgtgt 9540
tgagcagtgc gctgaattcg accaacattt ttttgagtgc ttactatgtg ccaggcacca 9600
tgtgatatgg aatgggggat atagggatga atgatgcata gtccctgcct cgtggacgtt 9660
ctcctagcac ctccctttgc cctcctttcc ttccacagtg ccatgcctat cctgactaga 9720
gccaaaggac tcagaaaacc tggattcagg ttccagtcct gtcacctact tgtcctcttg 9780
ggcaagtcat ttaacgtccc tgtgtcagtt ttcccttctt taaatgagaa ttacaatggc 9840
accagcctca taggtagtta ctgtgaagat taaatgaggt aggtcatgta agatatttaa 9900
cacagtgttt ggtccattgt aaagtcccag tagtcatttg ctactgttag tttacttcag 9960
gatgacttca gaggcactgg ccaagcaaga ataaatagga ataagaaggt atcactttac 10020
ttacacccac attagaagaa caatgggctt cagaatcttt tttttttttt ttttttcgag 10080
acagtcttgc tctgttgccc aggctggagt gcagtggcgc gatttcggct cactgcaacc 10140
tctgcctccc aggttcaagc gattctcctg tctcagcctc tggagtagct gggattacag 10200
gaatgtgcca ccatacccag ctaatttttg tatttttagt agagatgggg tttcaccatt 10260
ttggccaggc tggtctcaaa ctcctgacct caggtgatcc acccgcctca gcctcccaag 10320
ggcttcagaa tctaagacat ggctctagtt tcagtttacc acatttctag cagaatgatg 10380
ttgggaatgt cacctgactt ccataaatcc ttattttctc ctctgataaa cagcagtgat 10440
gttatgggga gctgatgaga tatctatgta aaaacatttc tcaaaccata aattacggtg 10500
gatgaacatc tgtacttgtg ttgagagtac tgatatcaag gagcaaacag gctgttgtat 10560
gtgttgaatg agcctctccc cactcacaca cccacagggc tctgggcacc ctggcaggag 10620
gcatgtcctg tgagtttctg cagcagatca actccatggt agacttcctt gaagtggtgc 10680
acatgatcta tcagctgccc actagagttc gagggagcct ggtgagaggg ggtgcctgga 10740
ctttagtggg agcagggagg ctgggaccct aggtatagaa cccagctcct atgttctgct 10800
ctggcctcac actgcttccc tacagagggc ctgtatctgg gcagagctac agcggaggat 10860
ggcaatgcca gaaccagaat ggacaactgt agggccagaa ctgaacgggc tggatagcaa 10920
gctactcctg gacttaccgt aagtactgca gctagagata ttggcccctc agaaagctca 10980
atctggggtg aagatctgcc cttagggaat gccctggagg aggtagtttt tctgtctggt 11040
agttccctga cataatttat agcccaaagc agaggatttt attcaaagtt gctctatgta 11100
ttgactggtt cccagaatat gctccagcac agggcagctg agggtggcaa cactgtattg 11160
aagcctgcca agtaatctta caataaccta gtccacatta attgagattg agacagagca 11220
tctgaagtga gggaggcaat gctccaaatc tgccccagag gattgtagtt tgctcagggc 11280
actgtgttct tagtgcattc agaggagtag atcgagagaa aaatatatga aaaatgtgat 11340
aaataccttc aaatacctga ggggctatca agtagaaatt agattgtcat atttatgagt 11400
ggccccattg ggcaagacta agagtagtta acggagatca gatttttaca tagtataaga 11460
aaaactaagg tagtgagttc ctggtccttg gagctgttcg agcctaagcc agatggcccc 11520
atggcaggaa tgttgtagag cacgttcata tacaggttgt gggaagaaaa ggctatagga 11580
acccaaggct cctccctacc catggagaaa tttattagta tgttactcat atgctgcttt 11640
tctcatttta cccctaccac caccccgttg ccatccgcac tgtaagtcag gataggaaaa 11700
tgctggtgtt acagtcttcc tggggaatat ggagctgaag tggagtaaaa gcagttgact 11760
tcattcctac ttttttcttt tttttctttt tttttttttt tgagacagag ttttgctgtg 11820
tcaccaaggc tggagtgcag tgacgtgatc tcggctcact gcaacctcca tcttccaggt 11880
tcaagcaatt ctcctgcctc agtctcccga gtagctggga ctgtaggtgt gcaccaccat 11940
gccaggctaa tttttgtatt tgttgtaggg acgagctttc accatgttgg ccaggctggt 12000
cttgaactcc tggcttcaag tgatctgccc acctcggctt cccaacattc ttatattttt 12060
ataggccttt ccacagattt cagctcttgt atgacttagc ccagttccag aactggtaat 12120
cctaggtagg gtacaggtta tcacctctga tttcgggtaa aagggattta tttatttatt 12180
tgtttattta tttatatttt tgagacagag tctcgctctg tcacccaggc tggagtgcaa 12240
tggtgccatc tcggctcact gcaacctctc cctctggggt tcaagcaatt ctcctgcctc 12300
agcctgctga gtagctggga ttacaggcgc gtgccaccac acccggctaa tttttgcatt 12360
tttagtagag acggggtttc accatgttgc tcagggtggt ctcgaatttc tgaccctgtg 12420
atctgcctgc ctcggcctcc caaagtgctg ggattacagg catgagccac tgcgtccggc 12480
ctgtttttac ttttttttaa tgccattcag atctgtttaa atatgtgggt tctgtgagat 12540
aatttagaat cccaaggtta cagatgaggt gaaagatcct agaccatgca tcaaaaaact 12600
tgagtttctc atttgtgaaa gaaggataag agaaacacct attttgtctg ggtgcagtgg 12660
ctcatgccta taatcccagc atttggggag gccaaggtgg gtggatcacg gaggtcaggt 12720
gttcaagacc agactggcca acatggcaaa acaccatctc tactaaaaat acaaaagtta 12780
gctgggcgtg gtggcacgtg cgtgtaattc cagctattcg ggaggctgag gcacgagaat 12840
tgcttgaacc tgggaggtgc gggttgcagt gaactgagat cgcagcacca ctgtgctcca 12900
gcctgagtga tggagtgagg ccaggtcttg ttgtaggatc aaatgagata acacctgaaa 12960
gaactttgta aattgtatag cacgtacaaa caagaaggga cctcttcaca agcagaggaa 13020
gggtggtcct gtggaaaaaa acgggaattg ggagtgagag acctcaacat ttgatctctg 13080
tgaacctcag ttttttaatc tataaaatgg ggaaatgtta atggtactta atatttggag 13140
cttttgagtc cattagatca ggtaggattg ttcgttattt ttttttttta ggaagactag 13200
aaatatgttg ctcccttttt ctcccccact caagcttgat ggtgggaatt ggccctggag 13260
ctgtttacta tcagttcctg tccagcttca ctaaatttgg tctggggtca catcttagct 13320
gcggactgtg gggttttgtg gtcccttctc gacttggccc agctccacct gaatcctgtt 13380
gttgtcaaat tgctgtaata ggatccagtt gatggacaga ctatccaatg aatccattat 13440
gttggtggtg gagctggtgc aaagagctcc agagcagctg ctggcactga cccccctcca 13500
ccaggcagcc ctggcagaga gggcactaca aaacctggta agagtccacc ctaccagact 13560
cagatttgct gccctgggca attcttgctc ctcagacaat gctctctgac tgtcccccaa 13620
ccctctactt cttgctttct tgctgccaaa cagattcctg tctacaaggc ctggcccctg 13680
ttttgcctct gggttctgtt ccttgataat atgcttcacg ttacttgtcc atacctcttg 13740
gagtccgaga aatctcttgg agtccacctc tcagtctttc tgcctgctcc tatctgggct 13800
cattgcttaa ggaagtgaac aaaggtagtg agcatcatag ggtgctgagc tgggagcagg 13860
agggagggaa ggttaggggg cttggtgtct tgatcaaggt gtctggtatt ctgagtcaga 13920
agtgcattgt ccaagttctg atgctcttct ccaggctcca aaggagactc cagtctcagg 13980
ggaagtgctg gagaccttag gccctttggt tggattcctg gggacagaga gcacacgaca 14040
gatcccccta cagatcctgc tgtcccatct cagtcagctg caaggcttct gcctaggaga 14100
gacatttgcc acagagctgg gatggctgct attgcaggag tctgttcttg ggtatggacc 14160
ttcgagaact tcagattcta actcattcta tacccagtcc ctcagccacc atcatcagtg 14220
gcagcctgtt ccatattctt aaggtcccct ggagccctgt gtccgaaatc ctagcatgtc 14280
ctcttttccc cttccttttc ctcacagttc cctcagctcc ccagcccccg attttcttcc 14340
tgtccccagg aaaccagagt tgtggagcca ggatgaagta gagcaagctg gacgcctagt 14400
attcactctg tctactgagg caatttcctt gatccccagg gtgagatgaa ggaagaaggg 14460
aagggagtaa atgcatagag gggactggtg agctggttat ggggacccgt ggccaaagag 14520
ggcaaaggat atgaagccta gatctggggg gagactgcaa aacagagaca ggactttgga 14580
cttagagcta tagcagcagg tcctgatctg tccagatctc cccactctcc ttctaccttc 14640
tcatgcagga ggccttgggt ccagagaccc tggagcggct tctagaaaag cagcagagct 14700
gggagcagag cagagttgga cagctgtgta gggagccaca gcttgctgcc aagaaagcag 14760
ccctggtagc aggggtggtg cgaccagctg ctgaggatct tccaggtgaa actacccaaa 14820
tacttatatg tccagcagga tgtacaggga gtatcaaacg gtctgggttc tacatgtgct 14880
cttccctggg actgggtttt ctaatttata aagcaaagag tttagaggga tgatcttcaa 14940
gcctcttgta gttctagaat tctgtagttc tgggagtttg taaactatta agttttcttt 15000
tagcccagaa cttccatttt cctgctctct cgtgtctgct ctagactcag ctctagctcg 15060
gctaagtgtg gagctctctg ctggggagat ccctagaagc tttgaaggag acattgtgag 15120
gctggagaac tgggttcaaa ttcagtgcta ccattaaatc tctgaataac atcctcagtc 15180
ttccatctat aaaagtcttg gcatctccaa tcacttcttg ttctattatc tcctaagccc 15240
tatacatatt actctgtaat actcctttga tccctatttc tcacagtgct ctatcctcca 15300
aaggttggaa gactcactct atctacagat atctctctgg gcatatttta ttactgcgct 15360
gacctcctgg ccctgccttc ccccttcaga acctgtgcca aattgtgcag atgtacgagg 15420
gacattccca gcagcctggt ctgcaaccca gattgcagag atggagctct cagactttga 15480
ggactgcctg acattatttg caggagaccc aggacttggg cctgaggaac tgcgggcagc 15540
catgggcaaa gcaaaacagg ttagggatgg agagccaact ggggttggcc atgaggaagc 15600
tatttgggtg tgatgtagga cacaaagaga atggagagtt ggatgagagg tgggggaagc 15660
aagagataga agagttagaa gatttgggtc acaagtagga ggtgaaggga gataaatatt 15720
gaggaaagag agctagtata atgaatagag ggacgaaagc agtggttacc aaattttaat 15780
gcatatcacg atcatcaagg gaacagattt ttttctttat ttttttttct ttcttaaaaa 15840
aataatggca tgcttcggct gggtgcagcg gctcacgcct ataatctcag aactttggga 15900
ggccaaggcg ggcagatcac gaggtcagga gatcaagacc atcctgtcta acacggcgaa 15960
acacggtctc tactaaaaat acaaaaaagt tagccgggca tggtggtgca cacttgttgt 16020
cccagctact tgggaggctg aggcaggaga atggcgtgaa cctgggaggg ggagcttgca 16080
gtgagccgaa gtcaagccaa tgcactccat cctgggtgac agagcaagac tccatctcaa 16140
aaaaaaaaaa aaaaaaaaaa ggcatgcttc atgaatttgc gtgttatcct tgcacaggcg 16200
ccatgcaaat ctctgtatca ttccaatttt ttggggtatg tgctgctgaa ctgagcatgg 16260
gaacagtgcc agtgccagat taccatgctt cactgactta ataaaaacct ttggggaggc 16320
tgggcgcagt gactcatgcc tgtaatcaca gcactttggg aggcggaggc aggtggattg 16380
cttgagccca ggagttagag accagactgg gcaacatggt gaaaccctgt ctctactaaa 16440
aatagaaaaa acattagctg ggtgtggcgg cacatgcctg taatcccagc tactcaggag 16500
gctggggtag gagaatccca tgagtgcagg aggtggaggg tgcaatgtgc caagatcgca 16560
ccactgccct ccagcctggg tgtcagagca agaccctgtc tcataaatta aaaaataagc 16620
ctctggggga aagagtctag acatctgcat ctcctttttt tttttttttt tttttttttg 16680
agacagagtc tcactctgtc acccagcatc caggctggag tgcagtggtg tgatcttggc 16740
tcactgtaac ctctacatcc tgggttcaaa cgatcctcct gcctcagcct ctcaagtagc 16800
tgggactaca ggtgcaccac acctggctaa tttttgtatc tttggtagag atggggtttc 16860
actatgttgc ccaggatggt ctcgaacttc tgggctcaag caatcctccc acctcagcct 16920
cccaaagtgc tgggattaca gctgttagcc actgtgctgg gccctaggca tctgttttaa 16980
taagcgtctc tgtgtctgat gcacataaaa gtgtggaact catggactag agttagtttg 17040
ctcttctttt ccactgattg taatgtcttt caaaacacct tagaggaact gtaaggcaac 17100
ggtctcattt tatagtggag gaaactaaag aaaaggcaaa tgatttacct agagttatac 17160
agctaagggc agaggcaaga cttaaaaccc agcagtatga ctcccaatcc actgcttttc 17220
cactcacatt gttcctgtct ttctcctagt tgtggggtcc cccccgggga tttcgtcctg 17280
agcagatcct gcagcttggt aggctcttaa taggtctagg agatcgggaa ctacaggagc 17340
tgatcctagt ggactgggga gtgctgagca ccctggggca gatagatggc tggagcacca 17400
ctcaggtaac acttttcctc ctccctacgg cttcccaaac acccatccca cagacccagc 17460
cctatagatc atctaaagcc caaggaattt ttttcctgtg accctacctg gtccttcttt 17520
ctatcttttg ttgatacccc atactagtga ccttcaggac tctgatttat tcactctgag 17580
gccctggaca cataatactg tctcctacct cttttcctgg aggcttcctc tttttctttc 17640
cttttctttt ctgagtcctc agccttcccc atgactcctt aggtcttaat agtaacagaa 17700
tataacccag taacacctat cacttccctg tccattaatt ctccataact ttcctccttc 17760
ccctcttctc ccacccccca ccccagctcc gcattgtggt ctccagtttc ctacggcaga 17820
gtggtcggca tgtgagccac ctggacttcg ttcatctgac agcgctgggt tatactctct 17880
gtggactgcg gccagaggag ctccagcaca tcagcagttg ggagttcagg tcatttgtga 17940
aggggctgag ggtggtggtg ctgaggtaaa ggtggactta ctggggaaag aaggatcatg 18000
aaggtctggt cccatggagg aagggaactc atttgaagcc atctcttcct ttgtctcatg 18060
accacagccc ctttcactga agccgaattc ttcttccttc cttcctactg ttctacagcc 18120
aagcagctct cttcctcggc accctgcatc tccagtgctc tgaggaacaa ctggaggttc 18180
tggcccacct acttgtactg cctggtgggt ttggcccaat cagtaactgg gggcctgaga 18240
tcttcactga aattggcacc atagcaggtg gggagctggg ccactgctgg tgcaagttgg 18300
tttggtttct ataccatggg tggactggat ggaagactgc cctgcaattc ttaaggtggg 18360
ggcctgaggg tgtttaaata aggggctaga gacatattgg ggaaggtcta tgatagggca 18420
ctttgggagt agttagagaa ggtctatagg tttgaagaga gggaaggtca gtctaagaca 18480
atgtttggat gccacttgct tcaacagctg ggatcccaga cctggctctt tcagcactgc 18540
tgcggggaca gatccagggc gttactcctc ttgccatttc tgtcatccct cctcctaaat 18600
ttgctgtaag tattaatgga ctggggtgac cacaggagag ccagggccca atggggacta 18660
catgcatgca ctgattccta cccctgccct caggtggtgt ttagtcccat ccaactatct 18720
agtctcacca gtgctcaggc tgtggctgtc actcctgagc aaatggcctt tctgagtcct 18780
gagcagcgac gagcagttgc atgggcccaa catgagggaa aggagagccc agaacagcaa 18840
ggtgagttcc cagctgcaca gcttgatcct ccatctcctg acccagaatc aaacccctaa 18900
tttggtgctg tctggctctt agagtgcacc cagggagatc cctggagtga aggagtctac 18960
aggcagagcg ctaatttcca agtatcaatg ctcctggaga gctgagttgt gatattactc 19020
ccattccctg tctattatag gtcgaagtac agcctggggc ctccaggact ggtcacgacc 19080
ttcctggtcc ctggtattga ctatcagctt ccttggccac ctgctatgag cctgtctcta 19140
cagtagaagg agattgtggg gagagaaatc ttaagtcata atgaataaag tgcaaacaga 19200
agtgcatcct gattattttc agaagctgat gaggaata 19238
<210> 5
<211> 18884
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
gccctgccct cacctggcta tcccacacag gtgagaataa ccagaactca cctccggtac 60
cagtgttcac ttggaaacat ggctctcagc ctctggcccc tgctgctgct gctgctgctg 120
ctgctgctgc tgtcctttgc aggtaagaag aacagtgagc agaactgggg atgaggagga 180
gggtggctgg aaaaagactt taagaatatg gaggtgaacc tgttagatag aaggacaaag 240
gagagaggca gagacttgtg caaaagggaa aaatgagggt taagaaaagc aggccaagac 300
ttactgtagg ccagtgaaag gggttcagct caccatcccc tcacctcatc tttagatcca 360
ggtagggaac tgtgctcagg ggcagggttg agtttgggct ctgtgttcct ctccttcagt 420
gacctctggt ttctctcctt acagtgactc tggcccctac tgggcctcat tccctggacc 480
ctggtctctc cttcctgaag tcattgctct ccactctgga ccaggctccc cagggctccc 540
tgagccgctc acggttcttt acattcctgg ccaacatttc ttcttccttt gagcctggga 600
gaatggggga aggaccagta ggagagcccc cacctctcca gccgcctgct ctgcggctcc 660
atgattttct agtgacactg agaggtagcc ccgactggga gccaatgcta gggctgctag 720
gggatatgct ggcactgctg ggacaggagc agactccccg agatttcctg gtgcaccagg 780
caggggtgct gggtggactt gtggaggtgc tgctgggagc cttagttcct gggggccccc 840
ctaccccaac tcagccccca tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg 900
actggttgcc ttctctgctg ctgttgttag agggcacacg ctggcaagct ctggtgcagg 960
tgcagcccag tgtggacccc accaatgcca caggcctcga tgggagggag gcagctcctc 1020
actttttgca gggtctgttg ggtttgctta ccccaacagg ggagctaggc tccaaggagg 1080
ctctttgggg cggtctgcta cgcacagtgg gggcccccct ctatgctgcc tttcaggagg 1140
ggctgctccg tgtcactcac tccctgcagg atgaggtctt ctccattttg gggcagccag 1200
agcctgatac caatgggcag tgccagggag gtgagtgtgg ccagggctgg gactgggatg 1260
tggcagggca aggaaagtga aattggggta gttttcttcc ttactctttc cctcctaggt 1320
aaccttcaac agctgctctt atggtaagta acaggagacc agttctgagg gattgggcct 1380
ggaaaatctg gaggtgaaga gctgaagacc tcagcctcta gagaggaaaa ctgatgggag 1440
gagtgtagtt tagtggtttt ggggtgtgac tgtctgggtt ggtgtcccag ctccacctct 1500
tcctagccat atgaccttga gcaggttaca tagtctttct atacctcagt ttccccattt 1560
ataaaatgag aatgataata ttagttacca cagagttgtt gcacccggtt aaatgagttg 1620
atactgtgta tgcaaacgac ttaaaaccgt gctggcacat agcgcttaat aatgttagct 1680
agtaaagatg ggatttggaa aataaggaca cagctggatt cctctacccc cttactactt 1740
cagtacaaca atgccagaca gtagttagac atattgagtt gctgagcaga tttcctaaca 1800
tgaggcccgc tgagggttgt gtttaagcta tctaaaagca tatgaagaaa ggagacagaa 1860
gggggccagg tggacagaaa gaattccaac tggggcttct cctaggtgat tttggacctt 1920
ggcagggcag ctttctcttt tttgccccgt tgcagcattt caaccagtaa cgcctaaact 1980
ctcagggacc tcgcttgtag aaaagcctat gcttgccatg ccccttgagg gctctgagtc 2040
agggtcagaa tcttcagctg gaggaaatgt gaactgacca gatcctgcct gctcctccct 2100
ctgcacccag gggcgtccgg cacaaccttt cctgggatgt ccaggcgctg ggctttctgt 2160
ctggatcacc acccccaccc cctgccctcc ttcactgcct gagcacgggc gtgcctctgc 2220
ccagagcttc tcagccgtca gcccacatca gcccacgcca acggcgagcc atcactgtgg 2280
aggccctctg tgagaaccac ttaggcccag caccacccta cagcatttcc aacttctcca 2340
tccacttgct ctgccagcac accaagcctg ccactccaca gccccatccc agcaccactg 2400
ccatctgcca gacagctgtg tggtatgcag tgtcctgggc accaggtgcc caaggctggc 2460
tacaggcctg ccacgaccag tttcctgatg agtttttgga tgcgatctgc agtaacctct 2520
ccttttcagc cctgtctggc tccaaccgcc gcctggtgaa gcggctctgt gctggcctgc 2580
tcccaccccc taccagctgc cctgaaggcc tgccccctgt tcccctcacc ccagacatct 2640
tttggggctg cttcttggag aatgagactc tgtgggctga gcgactgtgt ggggaggcaa 2700
gtctacaggc tgtgcccccc agcaaccagg cttgggtcca gcatgtgtgc cagggcccca 2760
ccccagatgt cactgcctcc ccaccatgcc acattggacc ctgtggggaa cgctgcccgg 2820
atgggggcag cttcctggtg atggtctgtg ccaatgacac catgtatgag gtcctggtgc 2880
ccttctggcc ttggctagca ggccaatgca ggataagtcg tgggggcaat gacacttgct 2940
tcctagaagg gctgctgggc ccccttctgc cctctctgcc accactggga ccatccccac 3000
tctgtctgac ccctggcccc ttcctccttg gcatgctatc ccagttgcca cgctgtcagt 3060
cctctgtccc agctcttgct caccccacac gcctacacta tctcctccgc ctgctgacct 3120
tcctcttggg tccaggggct gggggcgctg aggcccaggg gatgctgggt cgggccctac 3180
tgctctccag tctcccagac aactgctcct tctgggatgc ctttcgccca gagggccggc 3240
gcagtgtgct acggacgatt ggggaatacc tggaacaaga tgaggagcag ccaaccccat 3300
caggctttga acccactgtc aaccccagct ctggtataag caagatggag ctgctggcct 3360
gctttagtgt gagtgctctg ccagagggaa agctcctaga acagtgagaa ggccctccag 3420
gggaattcct cgaatactca gaggcagtag tgtggggtag tagttgaagc acacagctct 3480
agagtcagac aggcttggat tcatatcttg gttctgtgac cagccttgaa tgagttattt 3540
aacttctctg agcaatattt ttctcgtctc atttataaac tagggatgat aatggtatat 3600
gagataatac atgctgtggg cttagcacag tgcatgatac acaaacatgc aataaatatt 3660
accttgttat tcttttgggc tctttgactc tctcactttc tgcaccagaa agaaaaagga 3720
tcaagttaga ggactctaaa tttttcccct agagagtgag aattggaggc tggcagaata 3780
caggaagata aggtaggaat gagaaagatt cagggacact accaatcaga agactttggt 3840
tctaggttca actgtgccac aaattagtgt gatcttaggc aagcaatttc atttagtttt 3900
tctgggcttc agtttttagt ctgtagaatg gaggggtgag aatatgttaa acaccataat 3960
taattcactg agtgcctatt atatgcaagg cactttgcta ggttctgtag gatatataaa 4020
gatttcttac tccatgttgg ggccaccttt ttcaaaccct gggcccagta aaatggaatt 4080
agatagtctc atagtatttg gttcaggtct acaagtatta attgagccaa ctatggacct 4140
ggcatgggag agggtacaag agaaattaga gatatgatcc cggacctaaa agagcttaat 4200
atctgaagaa tcacacttga gatgatggac aagcatccca gcaagtggag ttggaatgcc 4260
tgggggagct gcaggagaga cagagaagac agctctgttg gcatattgtc tttcttccca 4320
ccagcctgtg ctgtgggatc tgctccagag ggaaaagagt gtttgggccc tgcagattct 4380
agtgcaggta acaggtggag ggcacatggg tgggctgggt gacagccatg gctggaggtc 4440
cctgccccgt gaggtgaggc catacccacc atgacctcct attcgcaggc gtacctgcat 4500
atgcccccag aaaacctcca gcagctggtg ctttcagcag agagggaggc tgcacagggc 4560
ttcctgacac tcatgctgca ggggaagctg caggggaagc tgcaggtgag cactgagaaa 4620
ggggagcaag ggcacctgga gcctagtgtt cagagggctt gctttagtgg gaggaggaac 4680
tccagagagg aaatggcagg gatactgagc atctccagag gcagaatcca ttcctgtgcc 4740
cctacaggta ccaccatccg aggagcaggc cctgggtcgc ctgacagccc tgctgctcca 4800
gcggtaccca cgcctcacct cccagctctt cattgacctg tcaccactca tccctttctt 4860
ggctgtctct gacctgatgc gcttcccacc atccctgtta gccaacgaca gtgtgtaagg 4920
ttcttgcact actcctcctg ctcctgtcac ggtcaggcca accgcatcca cctggagcag 4980
ccccttccgg agctcctctc tgtttttttc tttcatgcca gataggcaat gtgccaacat 5040
cgtagcaagg tttgagagag gcacatctca cgcctgagtg tgaaaaccca atcattatgc 5100
taatgaacta caaaaggatc agagagctcc tctctattaa aaccagggag aggatgggcg 5160
tggtggctca tgcctgtaat cccagcacgt tgggagcccg aggcaggtgg atcactaggt 5220
ccgcctagtg agttcgagac cagcctggcc aatatggtga aaccctgtct ctattaaact 5280
acaaaaatta gccaggcatg gtggtgggcg cttgtagtcc cagttactct ggaggctgag 5340
gcaggaggat agcttgaacc tgggaggcag aggttgcagt gagccaagat cgtgccactg 5400
cactccagcc tgggtgacag agcgagactc cgtcttaaaa aaaacaaaaa acaaaacaaa 5460
acaaaaaaac agggagagtc tccttcctat ctagacagca gggctacaga gggtcagagg 5520
aaaacagttt ggaggaagac aaagggttaa gacccatgac tcctcgcagc ctggctgcca 5580
tccgggatta cagcccagga atgaggcctg aacagaagga ggctctggca aagcgactgc 5640
tggcccctga actgtttggg gaagtgcctg cctggcccca ggagctgctg tgggcagtgc 5700
tgcccctgct cccccacctc cctctggaga actttttgca gctcagccct caccaggtat 5760
gagaatcatc ttctttactt gactggccca tcttctgcta gtggggacaa agagtcaatg 5820
gcatgtctct cagtggcccc tccctgcaag aaccctatag tgaccccagt gcgagctaac 5880
cttccccatc tcagatccag gccctggagg atagctggcc agcagcaggt ctggggccag 5940
ggcatgcccg ccatgtgctg cgcagcctgg taaaccagag tgtccaggat ggtgaggagc 6000
aggtacgcag gtgagttgtt gtgggatcag taaccaaggc aagagtggaa gaggtagaga 6060
gaggaaggca cagctgtcac gctgggtcgg tgttctagga agaaaggggc aagagagtag 6120
gcagtggcct caggcagcat agagttccag gagagaggtc tatagatggt gcccctgtgt 6180
agtggtgtag tgtcagagtg cccagtgtat gtacccatac catctgctgc caggcctgcc 6240
ttagtgctag tcttggggac cacacaaagg tcagcttcat gccctcctca ggcttgggcc 6300
cctcgcctgt ttcctgagcc ctgaggagct gcagagccta gtgcccctga gtgatccaac 6360
ggggccagta gaacgggggc tgctggaatg tgcagccaat gggaccctca gcccagaagg 6420
acgggtgagc ccctcagcac aagcctacaa gactttaggc ttcccctggg tctgtgtgga 6480
tggctttccc attgtgtcaa cttgagcaca gtggtgccag cccccatccc acttttgcaa 6540
cctccattcc ttactccatg gccattctta cctgttacca cctcttcctg gcccttctct 6600
atctggtctg tagcacccca aacataccct ttgccatttt gaacctaatc tactccagtc 6660
caatccctag ttccaaaccc tagcccaggc cctgggaaat tcagatgtgg gattagagag 6720
gaagttcaag gttcatctgt cttttctctc cagtcctaaa ccttctttgg ttacaggtgg 6780
catatgaact tctgggtgtg ttgcgctcat ctggaggagc ggtgctgagc ccccgggagc 6840
tgcgggtctg ggcccctctc ttctctcagc tgggcctccg cttccttcag gagctgtcag 6900
agccccagct tagagccatg cttcctgtcc tgcagggaac tagtgttaca cctgctcagg 6960
tttgcctgtc tcactccctg gcatgtaccc tccatccccg cttgagcccc agtcaagaga 7020
atcccattca gggataaaag cagcccctcc tttccctggg tgaacagtag aggtaaactc 7080
tgtctgcagg aggacgcctt cattcccttt cctcagatca agaagggacc tgagtcactg 7140
aggatggtta ctggggatgg ttaagaggca gcgggaagtt ttggagggtt tgccttagga 7200
acccacttag gacctggctg ctgggtcctg agagctgttg ttttcggtcc catcccaaca 7260
caggctgtcc tgctgcttgg acggctcctt cctaggcacg atgtgagtag cagcaacttc 7320
tcagcctccc gccagaggtc tctatcctct tttaacctgg ctcctgcatc tgcccctcct 7380
ctctctccgc tcccctcata cttactgcct tgctgcattg tgattgttgt cttccccaac 7440
acccttccct tcttcttcag gcctcttgtc tctcttgctc tttagctatc cctggaggaa 7500
ctctgctcct tgcaccttct gctaccaggc ctcagccccc agacactcca ggccatccct 7560
aggcgagtcc tggtcggggc ttgttcctgc ctggcccctg aactgtcacg cctctcagcc 7620
tgccagaccg cagcactgct gcagaccttt cgggtatgag agtggcaagg aggatgagat 7680
aatcagggat accggctctt tctggttggg aggaaggcat cttccctgag gccagggaag 7740
gcctttcata cctccccact tacacacaca cacacacaca cacacacaca accaattctc 7800
atgcaggtta aagatggtgt taaaaatatg ggtacaacag gtgctggtcc agctgtgtgc 7860
atccctggtc aggtaagtgt gagatctccc aactgagctc ctctccccat tctggggcag 7920
tttcatatgg ctggtgctac ctcccacact accctgcagt ggccctgaga gttctggtta 7980
gctctgtgcc cattagcagc cctccccagt gccagatgca ggacagcatg atccactcac 8040
attgtcctag actaatgtca aagctggaag ggcctgagaa atcttccagg ccacccaccc 8100
tgctttcaga tgaaaagacc aaggctggga gaagctaagg gactttgttt gcctggtgcc 8160
taactagcag caacacttga ccacagcagc ctgcagtgtg aggctcttag gcgtttattg 8220
ctacagtggc aaatgccatt ccacttctgt cctagctttg gtccctttcc acccccatgg 8280
ttccttttct ctgagtgcta agtacagact ctctcaccta tcactacact gctataccca 8340
tcaccgccag cagcctattc ccaccacctg gccagactgc ctgcttcccc tgctcccatt 8400
aaagctgcta caactggatt ccttggctct tctggcaaat cgaagacgct actgggagct 8460
gccctggtct gagcagcagg taattctccc cacttaattt cagaacttcc tccctcaatg 8520
tagtctacct tctttaccta tcccttagcc ctatttggcc agcttatccc tactatcctt 8580
tatttgattg tttgagatac agtctcactc tgttgcccag gctgcagtgc agtggcatga 8640
tcagagttcg ctgtaacctc aaactcatga gctcaggcaa tctttctgcc tcagcctcct 8700
gaatagctag gatgacaggt ggttaccacc atgcctggct aatttttaaa tttttttttt 8760
gttttttgag atgaagtctt gctctgtcac ccaggcttga gtacagtggc acaagcttgg 8820
ctcactgcaa cctctgtctc ccgggttcaa gcgattctcc tgcctcagcc tcccgagtag 8880
ctgggactac aggcactccc cacaatgccc ggctaatttt ttttttgttt tagtagagac 8940
agggtttcac catattggcc aggctggtct cgaactgctg accttgtgat ctgcctgcct 9000
ctgcctctca aagtgctggg attacaggtg tgagccacca tgcccggcca atttttaaat 9060
tttttgtaga gacagacaat acaaaaatgt ggacactatg tggagacact atgttgaggt 9120
actatgctgt ccagattggt cttgaactcc tggcctcaag caatcctcct gccttggcct 9180
cccaaagtgc tgggattaca gacctgagcc actgcaccca gccccctagt atcccttata 9240
atgtgacttg cttttctttt tctttctcct tcccttttct ttcatttctt tctcactctc 9300
gagagaagag tgggcatctg ggagagtggg aggctggtgg gtcccacaga gtgaggaggc 9360
aggactgggt ccaaggcagt cctgcctctc cactctaggg ggtatccttg gacagtgtct 9420
cttctgggaa ggggctcgtc tttctttctc ttgtaggcac agtttctctg gaagaagatg 9480
caagtaccca ccaacctgac cctcaggaat ctacagtgag taacttgtgt tgagcagtgc 9540
gctgaattcg accaacattt ttttgagtgc ttactatgtg ccaggcacca tatgatatgg 9600
aatgggggat atagggatga atgatgcata gtccctgcct cgtggacgtt ctcctagcac 9660
ctccctttgc cctcctttcc ttccacagtg ccatgcctat cctgactaga gccaaaggac 9720
tcagaaaacc tggattcagg ttccagtcct gtcacctact tgtcctcttg ggcaagtcat 9780
ttaacgtccc tgtgtcagtt ttcccttctt taaatgagaa ttacaatggc accagcctca 9840
taggtagtta ctgtgaagat taaatgaggt aggtcatgta agatatttaa cacagtgttt 9900
ggtccattgt aaagttccag tagtcatttg ctactgttag tttacttcag gatgacttca 9960
gaggcactgg ccaagcaaga ataaatagga ataagaaggt atcactttac ttatacccac 10020
attagaagaa caatgggctt cagaatcttt tttttttttt ttttcgagac agtcttgctc 10080
tgttgcccag gctggagtgc agtggcgcga tttcggctca ctgcaacctc tgcctcccag 10140
gttcaagcga ttctcctgtc tcagcctctg gagtagctgg gattacagga atgtgccacc 10200
atacccagct aatttttgta tttttagtag agatggggtt tcaccatttt ggccaggctg 10260
gtctcaaact cctgacctca ggtgatccac ccgcctcagc ctcccaaggg cttcagaatc 10320
taagacatgt ctctagtttc agtttaccac atttctagca gaatgatgtt gggaatgtca 10380
cctgacttcc ataaatcctt attttctcct ctgataaaca gcagtgatgt tatggggagc 10440
tgatgagata tctatgtaaa aacatttctc aaaccataaa ttacggtgga tgaacatctg 10500
tacttgtgtt gagagtactg atatcaagga gcaaacaggc tgttgtatgt gttgaatgag 10560
cctctcccca ctcacacacc cacagggctc tgggcaccct ggcaggaggc atgtcctgtg 10620
agtttctgca gcagatcaac tccatggtag acttccttga agtggtgcac atgatctatc 10680
agctgcccac tagagttcga gggagcctgg tgagagggga tgcctggact ttagtgggag 10740
cagggaggct gggaccctag gtatagaacc cagctcctat gttctgctct ggcctcactc 10800
tgcttcccta cagagggcct gtatctgggc agagctacag cggaggatgg caatgccaga 10860
accagaatgg acaactgtag ggccagaact gaacgggctg gatagcaagc tactcctgga 10920
cttaccgtaa gtactgcagc tagagatatt ggcccctcag aaagctcaat ctggggtgaa 10980
gatctgccct tagggaatgc cctggaggag gtagtttttc tgtctggtag ttccctgaca 11040
taatttatag cccaaagcag aggattttat tcaaagttgc tctatgtatt gactggttcc 11100
cagaatatgc tccagcacag ggcagctgag ggtggcaaca ctgtattgaa gcctgccaag 11160
taatcttaca ataacctagt ccacattaat tgagattgag acagagcatc tgaagtgagg 11220
gaggcaatgc tccaaatctg ccccagagga ttgtagtttg ctcagggcac tgtgttctta 11280
gtgcattcag aggagtggat cgagagaaaa atatatgaaa aatgtgataa ataccttcaa 11340
atacctgagg ggctatcaag tagaaattag attgtcatat ttatgagtgg ccccattggg 11400
caagactaag agtagttaac ggagatcaga tttttacata gtataagaaa aactaaggta 11460
gtgagttcct ggtccttgga gctgttcgag cctaagccag atggccccat ggcaggaatg 11520
ttgtagagca cgttcatata caggttgtgg gaagaaaagg ctataggaac ccaaggctcc 11580
tccctaccca tggagaaatt tattagtatg ttactcatat gctgcttttc tcattttacc 11640
cctaccacca ccccgttgcc atccgcactg taagtcagga taggaaaatg ctggtgttac 11700
agtcttcctg gggaatatgg agctgaagtg gagtaaaagc agttgacttc attcttactt 11760
ttttcttttt cttttttttt ttttttttga gacagagttt tgctgtgtca ccaaggctgg 11820
agtgcagtga cgtgatctcg gctcactgca acctccatct tccaggttca agcaattctc 11880
ctgcctcagt ctcccgagta gctgggactg taggtgtgca ccaccatgcc aggctaattt 11940
ttgtatttgt tgtagggacg agctttcacc atgttggcca ggctggtctt gaactcctgg 12000
cttcaagtga tctgcccacc tcggcttccc aacattctta tatttttata ggcctttcca 12060
cagatttcag ctcttgtatg acttagccca gttccagaac tggtaatcct aggtagggta 12120
caggttatca cctctgattt cgggtaaaag ggatttattt atttatttgt ttatttattt 12180
atatttttga gacagagtct cgctctgtca cccaggctgg agtgcaatgg tgccatctcg 12240
gctcactgca acctctccct ctggggttca agcacttctg cctcagcctc ctgagtagct 12300
gggattacag gcgcgtgcca ccacacccgg ctaatttttg catttttagt agagacgggg 12360
tttcaccatg ttgctcaggg tggtctcgaa tttctgaccc tgtgatctgc ctgcctcggc 12420
ctcccaaagt gctgggatta caggcatgag ccactgcgtc cggcctgttt ttactttttt 12480
ttaatgccat tcagatctgt ttaaatatgt gggttctgtg agataattta gaatcccaag 12540
gttacagatg aggtgaaaga tcctagacca tgcatcaaaa aacttgagtt tctcatttgt 12600
gaaagaagga taagagaaac acctattttg tctgggtgca gtggctcatg cctataatcc 12660
cagcatttgg ggaggccaag gtgggtggat cacggaggtc aggtgttcaa gaccagactg 12720
gccaacatgg caaaacacca tctctactaa aaatacaaaa gttagctggg cgtggtggca 12780
cgtgcgtgta attccagcta ttcgggaggc tgaggcacga gaattgcttg aacctgggag 12840
gtgcgggttg cagtgaactg agatcgcagc accactgtgc tccagcctga gtgatggagt 12900
gaggccaggt cttgttgtag gatcaaatga gataacacct gaaagaactt tgtaaattgt 12960
atagcacgta caaacaagaa gggacctctt cacaagcaga ggaagggtgg tcctgtggaa 13020
aaaaacggga attgggagtg agagacctca acatttgatc tctgtgaacc tcagtttttt 13080
aatctataaa atggggaaat gttaatggta cttaatattt ggagcttttg agtccattag 13140
atcaggtagg attgttcgtt attttttttt tttaggaaga ctagaaatat gttgctccct 13200
ttttctcccc cactcaagct tgatggtggg aattggccct ggagctgttt actgtcagtt 13260
cctgtccagc ttcactaaat ttggtctggg gtcacatctt agctggggac tgtggggttc 13320
tgtggtccct tctcgacttg gcccagctcc acttgaatga tattgttgtc aaattgctat 13380
aatagaatcc agttgatgga cagactatcc aatgaatcca ttatgttggt ggtggagctg 13440
gtgcaaagag ctccagagca gctgctggca ctgacccccc tccaccaggc agccctggca 13500
gagagggcac tacaaaacct ggtaagagtc caccctacca gactcagatt tgctgccctg 13560
ggcaattctt gctcctcaga caatgctctc tgactgtcct ccaaccctct acttcttgct 13620
ttcttgctgc caaacaggtt cctgtctaca aggcctggcc cgttttgcct ctgggttctg 13680
ttccttgata atatgcttca cgttacttgt ccatacctct tggagtccga gaaatctctt 13740
ggagtccacc tctcagtctt tctgcctgct cctatctggt ctcattgctt aagaaagtga 13800
acaaaggtag tgagcatcat agggtgctga gttgggagca ggagggaggg aaggtcaggg 13860
ggcttggtgt cttgatcaag gtgtctggta ttctgagtca gaagtgcatt gtccaagttc 13920
tgatgctctt ctccaggctc caaaggagac tccagtctca ggggaagtgc tggagacctt 13980
aggccctttg gttggattcc tggggacaga gagcacacga cagatccccc tacagatcct 14040
gctgtcccat ctcagtcagc tgtaaggctt ctgcctagga gagacatttg ccacagagct 14100
gggatggctg ctattgcagg agtctgttct tgggtatgga tcttcgagaa cttcagattc 14160
taactcattc tatacccagt ccctcagcca ccatcatcag tggcagcctg ttccatattc 14220
ctaagggccc ttggagccct gtgtccgaaa tcctagcatg tcctcttttc cccttccttt 14280
tcctcacagt tccctcagct ccccagcccc cgattttctt cctgtcccca ggaaaccaga 14340
gttgtggagc caggatgaag tagagcaagc tggacgccta gtattcactc tgtctactga 14400
ggcaatttcc ttgatcccca gggtgagatg aaggaagaag ggaagggagt aaatgcatag 14460
aggggactgg tgagctggtt atggggaccc gtggccaacg agggcaaagg atatgaagcc 14520
tagatctggg gggatactgc gaaacagaga caggactttg gacttatagc tatagcagca 14580
ggtcctgatc tgtccagatc tccccactct ccttctacct tctcatgcag gaggccttgg 14640
gtccagagac cctggagcgg cttctagaaa agcagcagag ctgggagcag agcagagttg 14700
gacagctgtg tagggggcca cagcttgctg ccaagaaagc agccctggta gcaggggtgg 14760
tgcgaccagc tgctgaggat cttccaggtg aaactaccca aatacttata tgtccagcag 14820
gatgtacagg gagtatcaaa cggtctgggt tctacatgtg cttttctctg ggactgggtt 14880
ttctaattta taaagcaaag agtttagagg gatgatcttc aagtctcgtc tagttctaaa 14940
attctatagc tctgggagtg tgtaaactat taagttttcc tttagcccag aacttccatt 15000
ttcctgctgt cttgtctctt taaacagctg actcagctct agctcggcta agtgtggagc 15060
tctctgctgg ggagatccct cgaaggagac attgtgaggc tagagaactg gtttcaaatt 15120
cagctctgcc atgaaatccc tgaccaacat cctcagtctt ccatctataa aatgagggac 15180
ttggcatctc caatcacttc ttgttcaatt cacttctaag ccctatacat cttaacctgt 15240
aatactccct cgatccctac ttcccacagt gctccatcct ccaaaggttg gaagagtcat 15300
tccatctaca gatacctcct ggccctgcct tcccccttca gaacctgtgc caaattgtgc 15360
agatgtacga gggacattcc cagcagcctg ctctgcaacc cagattgctg agatggagct 15420
ctcagacttt aaggactgcc tgacactatt tgcaggagac ccaggacttg ggcctgagga 15480
accacgggca gccatgggca aagcaaaatg ggtcagggac ggagagccaa ctgaggttgg 15540
ccatgaggaa gctgtgtggg tgtgatgtag gacacgaaga gaatagagag ttggatgaga 15600
ggtgggggaa gcagaagata aaagagttag aagatttggg tcacaagtag aaggtgagga 15660
gagataaata ttgaggaaag agagctacta taatgaatag agggactaaa gcagtgatta 15720
ccaaatttta atgcatatca caatcatcaa gggaacagat ttttttcttt tttctttttt 15780
tttctttctt aaaaaataat ggcatacttc atgaatttgt gtgttatcct tgcgcaggcg 15840
ccatgctaat ctctgtatca ttccaatttt tttttgtata tgtgctgctg aaccgagcac 15900
gggaacagtg ccaatgctgg attaccatgc tagactgact taataaaaac ctttgcggag 15960
gctggacgga gtggctcgtg cctgtaatca cagcactttg ggaggctgag gcaggtggat 16020
tgcttgagcc caggagtttg agaccagact gggcaacatg gtgaagccct gtctctacta 16080
aaaatagaaa aaaaattagc tgggtgtggc ggcacatgcc tgtaatccca gctactcagg 16140
aggctggggt aggagaatcc cctgagcgca ggaggtggag ggtgcaatga gccaagatca 16200
caccactgca ctccagcctg ggtgtcagag caagaccctg tctcataaat taaaaaataa 16260
gcctctggga gaaagtctag acatctgcat ctgctttttt tttttttttt ttttttgaga 16320
cacagtctca ctctgtcacc cagcatccag gctggagtgc ggtggtgtga tcttggctca 16380
ctgtaacctc tacatcctgg gctcaaacga tcctcctgcc tcagcctctc gagaagctgg 16440
gactacaggt gcacaccact acacctggct aatttttgta tttttggtag agatgaggtt 16500
tcgctgtgtt gcccaggatg gtcttgaact cctgggctca agcattcctc ccacctcagc 16560
ctcccaaagt gctgggatta cagctgtgag ccactgtgct gggccccagg catctgcatt 16620
ttaataagcg tctctgtgtc tgatgcacat aaaagtgtgg aactcatgga ctagagttag 16680
tttgctcttc ttttccactg attgtaatgt ctttcaaaac accttagagg aactgtaagg 16740
caacggtctc attttatagt ggaggaaacc aaagaaaagg caagtgactt gcctagagtt 16800
atacagctaa ggtcagaggc aagacttaaa acccagcatt ctgactccca atctactggt 16860
tttccactca cattgttcct ctctttctcc tagttgtggg gtcccccccg gggatttggt 16920
cctgagcaga tcctgcagct cggtagactc ttaataggtc tgggagatca ggaactacag 16980
gagctgatcc tagtggactg gggagtgctg agcaccctgg ggcagataga tggctggagc 17040
tccactcagg taacactttt actcctccct accgcttccc aaacacccat cccacagacc 17100
cagccctata gatcatctaa agcccaagga attttttcct gtgaccctac ctggtcattc 17160
tttctgtctt ttgttaatat cccatactag tgaccttcag gactcttgat ttattcactc 17220
tgaggccctg gacacataat actgtctcct acctcttttc ctggaggctt cctctttttc 17280
tttccttttc ttttctgagt cctcagcctt ccccatgact ccttaggtct taatagtaac 17340
agaatataac ccagtaacac ctatcacttc cctgtccatt aattctccat aactttcctc 17400
cttcccctct tctcccaccc cccaccccag ctccgcattg tggtctccag tttcctacgg 17460
cagagtggtc ggcatgtgag ccacctggac ttcgttcatc tgacagcgct gggttatact 17520
ctctgtggac tgcggccaga ggagctccag cacatcagca gttgggagtt taggtcattt 17580
gtgaaggggc tgagggtggt cgtgttcagg taaaggtgga cttgctgggg aaaggaggat 17640
catgaagtta tagtcccatg gaggaaggga actcatttga agccatctct tcctttgtct 17700
catgaccaca gtccctttca ctgaagccga attcttcttc cttccttccc actgttctac 17760
agccaagcag ctctcttcct gggcaccctg catctgcagt gctctgagga acaactggag 17820
tttctggccc acctctttgt actgcctggt gggtttggcc caatcagtaa ctgggggcct 17880
gagatcttca ctgaaattgg caccatagca ggtggggagc tgggccactg ctggtgcaag 17940
ttggtttggt ttctatacca tgggtggact ggatggaaga ctgccctgca attcttcagg 18000
tgtgggcctg agagggtgtt taaataaggg gctagagaca tattggggaa ggtctatgat 18060
agggcacttt gggagtagtt agagaaggtc tataggtttg aagagaggga aggtcagtct 18120
aagacaatgt ttggatgcca cttgcttcaa cagctgggat cccagacctg gctctttcag 18180
cactgctgcg gggacagatc cagggcgtta ctcctcttgc catttctgtc atccctcctc 18240
ctaaatttgc tgtaagtatt aatggactgg ggtgaccaca ggagagccag ggcccaatgg 18300
ggactacatg catgcactga ttcctacccc tgccctcagg tggtgtttag tcccatccaa 18360
ctatctagtc tcgccagtgc tcaggctgtg gctgtcactc ctgagcaaat ggcctttctg 18420
agtcctgagc agcgacgagc agttgcatgg gcccaacatg agggaaagga gagcccagaa 18480
cagcaaggtg agttcccagc tgcacagctt gatcctccat ctcctgaccc agaatcaaac 18540
ccctaatttg gtgctgtctg gctcttagag tgcacccagg gagatccctg gagtgaagga 18600
gtctacaggc agagcgctaa tttccaagta tcaatgctcc tggagagctg agttgtgata 18660
ttactcccat tccctgtcta ttataggtcg aagtacagcc tggggcctcc aggactggtc 18720
acgaccttcc tggtccctgg tattgactat cagcttcctt ggccacctgc tatgagcctg 18780
tctctacagt agaaggagat tgtggggaga gaaatcttaa gtcataatga ataaagtgca 18840
aacagaagtg catcctgatt attttcagaa gctgatgagg aata 18884
<210> 6
<211> 82
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 剪接供体信号
<400> 6
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 7
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 剪接接受信号
<400> 7
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51
<210> 8
<211> 1809
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 8
Met Ala Leu Ser Leu Gln Pro Gln Leu Leu Leu Leu Leu Ser Leu Leu
1 5 10 15
Pro Gln Glu Val Thr Ser Ala Pro Thr Gly Pro Gln Ser Leu Asp Ala
20 25 30
Gly Leu Ser Leu Leu Lys Ser Phe Val Ala Thr Leu Asp Gln Ala Pro
35 40 45
Gln Arg Ser Leu Ser Gln Ser Arg Phe Ser Ala Phe Leu Ala Asn Ile
50 55 60
Ser Ser Ser Phe Gln Leu Gly Arg Met Gly Glu Gly Pro Val Gly Glu
65 70 75 80
Pro Pro Pro Leu Gln Pro Pro Ala Leu Arg Leu His Asp Phe Leu Val
85 90 95
Thr Leu Arg Gly Ser Pro Asp Trp Glu Pro Met Leu Gly Leu Leu Gly
100 105 110
Asp Val Leu Ala Leu Leu Gly Gln Glu Gln Thr Pro Arg Asp Phe Leu
115 120 125
Val His Gln Ala Gly Val Leu Gly Gly Leu Val Glu Ala Leu Leu Gly
130 135 140
Ala Leu Val Pro Gly Gly Pro Pro Ala Pro Thr Arg Pro Pro Cys Thr
145 150 155 160
Arg Asp Gly Pro Ser Asp Cys Val Leu Ala Ala Asp Trp Leu Pro Ser
165 170 175
Leu Met Leu Leu Leu Glu Gly Thr Arg Trp Gln Ala Leu Val Gln Leu
180 185 190
Gln Pro Ser Val Asp Pro Thr Asn Ala Thr Gly Leu Asp Gly Arg Glu
195 200 205
Pro Ala Pro His Phe Leu Gln Gly Leu Leu Gly Leu Leu Thr Pro Ala
210 215 220
Gly Glu Leu Gly Ser Glu Glu Ala Leu Trp Gly Gly Leu Leu Arg Thr
225 230 235 240
Val Gly Ala Pro Leu Tyr Ala Ala Phe Gln Glu Gly Leu Leu Arg Val
245 250 255
Thr His Ser Leu Gln Asp Glu Val Phe Ser Ile Met Gly Gln Pro Glu
260 265 270
Pro Asp Ala Ser Gly Gln Cys Gln Gly Gly Asn Leu Gln Gln Leu Leu
275 280 285
Leu Trp Gly Met Arg Asn Asn Leu Ser Trp Asp Ala Arg Ala Leu Gly
290 295 300
Phe Leu Ser Gly Ser Pro Pro Pro Pro Pro Ala Leu Leu His Cys Leu
305 310 315 320
Ser Arg Gly Val Pro Leu Pro Arg Ala Ser Gln Pro Ala Ala His Ile
325 330 335
Ser Pro Arg Gln Arg Arg Ala Ile Ser Val Glu Ala Leu Cys Glu Asn
340 345 350
His Ser Gly Pro Glu Pro Pro Tyr Ser Ile Ser Asn Phe Ser Ile Tyr
355 360 365
Leu Leu Cys Gln His Ile Lys Pro Ala Thr Pro Arg Pro Pro Pro Thr
370 375 380
Thr Pro Arg Pro Pro Pro Thr Thr Pro Gln Pro Pro Pro Thr Thr Thr
385 390 395 400
Gln Pro Ile Pro Asp Thr Thr Gln Pro Pro Pro Val Thr Pro Arg Pro
405 410 415
Pro Pro Thr Thr Pro Gln Pro Pro Pro Ser Thr Ala Val Ile Cys Gln
420 425 430
Thr Ala Val Trp Tyr Ala Val Ser Trp Ala Pro Gly Ala Arg Gly Trp
435 440 445
Leu Gln Ala Cys His Asp Gln Phe Pro Asp Gln Phe Leu Asp Met Ile
450 455 460
Cys Gly Asn Leu Ser Phe Ser Ala Leu Ser Gly Pro Asn Arg Arg Leu
465 470 475 480
Val Lys Gln Leu Cys Ala Gly Leu Leu Pro Pro Pro Thr Ser Cys Pro
485 490 495
Pro Gly Leu Ile Pro Val Pro Leu Thr Pro Glu Ile Phe Trp Gly Cys
500 505 510
Phe Leu Glu Asn Glu Thr Leu Trp Ala Glu Arg Leu Cys Val Glu Asp
515 520 525
Ser Leu Gln Ala Val Pro Pro Arg Asn Gln Ala Trp Val Gln His Val
530 535 540
Cys Arg Gly Pro Thr Leu Asp Ala Thr Asp Phe Pro Pro Cys Arg Val
545 550 555 560
Gly Pro Cys Gly Glu Arg Cys Pro Asp Gly Gly Ser Phe Leu Leu Met
565 570 575
Val Cys Ala Asn Asp Thr Leu Tyr Glu Ala Leu Val Pro Phe Trp Ala
580 585 590
Trp Leu Ala Gly Gln Cys Arg Ile Ser Arg Gly Gly Asn Asp Thr Cys
595 600 605
Phe Leu Glu Gly Met Leu Gly Pro Leu Leu Pro Ser Leu Leu Pro Leu
610 615 620
Gly Pro Ser Pro Leu Cys Leu Ala Pro Gly Pro Phe Leu Leu Gly Met
625 630 635 640
Leu Ser Gln Leu Pro Arg Cys Gln Ser Ser Val Pro Ala Leu Ala His
645 650 655
Pro Thr Arg Leu His Tyr Leu Leu Arg Leu Leu Thr Phe Leu Leu Gly
660 665 670
Pro Gly Thr Gly Gly Ala Glu Thr Gln Gly Met Leu Gly Gln Ala Leu
675 680 685
Leu Leu Ser Ser Leu Pro Asp Asn Cys Ser Phe Trp Asp Ala Phe Arg
690 695 700
Pro Glu Gly Arg Arg Ser Val Leu Arg Thr Val Gly Glu Tyr Leu Gln
705 710 715 720
Arg Glu Glu Pro Thr Pro Pro Gly Leu Asp Ser Ser Leu Ser Leu Gly
725 730 735
Ser Gly Met Ser Lys Met Glu Leu Leu Ser Cys Phe Ser Pro Val Leu
740 745 750
Trp Asp Leu Leu Gln Arg Glu Lys Ser Val Trp Ala Leu Arg Thr Leu
755 760 765
Val Lys Ala Tyr Leu Arg Met Pro Pro Glu Asp Leu Gln Gln Leu Val
770 775 780
Leu Ser Ala Glu Met Glu Ala Ala Gln Gly Phe Leu Thr Leu Met Leu
785 790 795 800
Arg Ser Trp Ala Lys Leu Lys Val Gln Pro Ser Glu Glu Gln Ala Met
805 810 815
Gly Arg Leu Thr Ala Leu Leu Leu Gln Arg Tyr Pro Arg Leu Thr Ser
820 825 830
Gln Leu Phe Ile Asp Met Ser Pro Leu Ile Pro Phe Leu Ala Val Pro
835 840 845
Asp Leu Met Arg Phe Pro Pro Ser Leu Leu Ala Asn Asp Ser Val Leu
850 855 860
Ala Ala Ile Arg Asp His Ser Ser Gly Met Lys Pro Glu Gln Lys Glu
865 870 875 880
Ala Leu Ala Lys Arg Leu Leu Ala Pro Glu Leu Phe Gly Glu Val Pro
885 890 895
Asp Trp Pro Gln Glu Leu Leu Trp Ala Ala Leu Pro Leu Leu Pro His
900 905 910
Leu Pro Leu Glu Ser Phe Leu Gln Leu Ser Pro His Gln Ile Gln Ala
915 920 925
Leu Glu Asp Ser Trp Pro Val Ala Gly Leu Gly Pro Gly His Ala Arg
930 935 940
His Val Leu Arg Ser Leu Val Asn Gln Ser Met Glu Asp Gly Glu Glu
945 950 955 960
Gln Val Leu Arg Leu Gly Ser Leu Ala Cys Phe Leu Ser Pro Glu Glu
965 970 975
Leu Gln Ser Leu Val Pro Leu Ser Asp Pro Met Gly Pro Val Glu Gln
980 985 990
Gly Leu Leu Glu Cys Ala Ala Asn Gly Thr Leu Ser Pro Glu Gly Arg
995 1000 1005
Val Ala Tyr Glu Leu Leu Gly Val Leu Arg Ser Ser Gly Gly Thr
1010 1015 1020
Val Leu Ser Pro Arg Glu Leu Arg Val Trp Ala Pro Leu Phe Pro
1025 1030 1035
Gln Leu Gly Leu Arg Phe Leu Gln Glu Leu Ser Glu Thr Gln Leu
1040 1045 1050
Arg Ala Met Leu Pro Ala Leu Gln Gly Ala Ser Val Thr Pro Ala
1055 1060 1065
Gln Ala Val Leu Leu Phe Gly Arg Leu Leu Pro Lys His Asp Leu
1070 1075 1080
Ser Leu Glu Glu Leu Cys Ser Leu His Pro Leu Leu Pro Gly Leu
1085 1090 1095
Ser Pro Gln Thr Leu Gln Ala Ile Pro Lys Arg Val Leu Val Gly
1100 1105 1110
Ala Cys Ser Cys Leu Gly Pro Glu Leu Ser Arg Leu Ser Ala Cys
1115 1120 1125
Gln Ile Ala Ala Leu Leu Gln Thr Phe Arg Val Lys Asp Gly Val
1130 1135 1140
Lys Asn Met Gly Ala Ala Gly Ala Gly Ser Ala Val Cys Ile Pro
1145 1150 1155
Gly Gln Pro Thr Thr Trp Pro Asp Cys Leu Leu Pro Leu Leu Pro
1160 1165 1170
Leu Lys Leu Leu Gln Leu Asp Ala Ala Ala Leu Leu Ala Asn Arg
1175 1180 1185
Arg Leu Tyr Arg Gln Leu Pro Trp Ser Glu Gln Gln Ala Gln Phe
1190 1195 1200
Leu Trp Lys Lys Met Gln Val Pro Thr Asn Leu Ser Leu Arg Asn
1205 1210 1215
Leu Gln Ala Leu Gly Asn Leu Ala Gly Gly Met Thr Cys Glu Phe
1220 1225 1230
Leu Gln Gln Ile Ser Ser Met Val Asp Phe Leu Asp Val Val His
1235 1240 1245
Met Leu Tyr Gln Leu Pro Thr Gly Val Arg Glu Ser Leu Arg Ala
1250 1255 1260
Cys Ile Trp Thr Glu Leu Gln Arg Arg Met Thr Met Pro Glu Pro
1265 1270 1275
Glu Leu Thr Thr Leu Gly Pro Glu Leu Ser Glu Leu Asp Thr Lys
1280 1285 1290
Leu Leu Leu Asp Leu Pro Ile Gln Leu Met Asp Arg Leu Ser Asn
1295 1300 1305
Asp Ser Ile Met Leu Val Val Glu Met Val Gln Gly Ala Pro Glu
1310 1315 1320
Gln Leu Leu Ala Leu Thr Pro Leu His Gln Thr Ala Leu Ala Glu
1325 1330 1335
Arg Ala Leu Lys Asn Leu Ala Pro Lys Glu Thr Pro Ile Ser Lys
1340 1345 1350
Glu Val Leu Glu Thr Leu Gly Pro Leu Val Gly Phe Leu Gly Ile
1355 1360 1365
Glu Ser Thr Arg Arg Ile Pro Leu Pro Ile Leu Leu Ser His Leu
1370 1375 1380
Ser Gln Leu Gln Gly Phe Cys Leu Gly Glu Thr Phe Ala Thr Glu
1385 1390 1395
Leu Gly Trp Leu Leu Leu Gln Glu Pro Val Leu Gly Lys Pro Glu
1400 1405 1410
Leu Trp Ser Gln Asp Glu Ile Glu Gln Ala Gly Arg Leu Val Phe
1415 1420 1425
Thr Leu Ser Ala Glu Ala Ile Ser Ser Ile Pro Arg Glu Ala Leu
1430 1435 1440
Gly Pro Glu Thr Leu Glu Arg Leu Leu Gly Lys His Gln Ser Trp
1445 1450 1455
Glu Gln Ser Arg Val Gly His Leu Cys Gly Glu Ser Gln Leu Ala
1460 1465 1470
His Lys Lys Ala Ala Leu Val Ala Gly Ile Val His Pro Ala Ala
1475 1480 1485
Glu Gly Leu Gln Glu Pro Val Pro Asn Cys Ala Asp Ile Arg Gly
1490 1495 1500
Thr Phe Pro Ala Ala Trp Ser Ala Thr Gln Ile Ser Glu Met Glu
1505 1510 1515
Leu Ser Asp Phe Glu Asp Cys Leu Ser Leu Phe Ala Gly Asp Pro
1520 1525 1530
Gly Leu Gly Pro Glu Glu Leu Arg Ala Ala Met Gly Lys Ala Lys
1535 1540 1545
Gln Leu Trp Gly Pro Pro Arg Gly Phe Arg Pro Glu Gln Ile Leu
1550 1555 1560
Gln Leu Gly Arg Leu Leu Ile Gly Leu Gly Glu Arg Glu Leu Gln
1565 1570 1575
Glu Leu Thr Leu Val Asp Trp Gly Val Leu Ser Ser Leu Gly Gln
1580 1585 1590
Ile Asp Gly Trp Ser Ser Met Gln Leu Arg Ala Val Val Ser Ser
1595 1600 1605
Phe Leu Arg Gln Ser Gly Arg His Val Ser His Leu Asp Phe Ile
1610 1615 1620
Tyr Leu Thr Ala Leu Gly Tyr Thr Leu Cys Gly Leu Arg Pro Glu
1625 1630 1635
Glu Leu Gln His Ile Ser Ser Trp Glu Phe Ser Gln Ala Ala Leu
1640 1645 1650
Phe Leu Gly Ser Leu His Leu Pro Cys Ser Glu Glu Gln Leu Glu
1655 1660 1665
Val Leu Ala Tyr Leu Leu Val Leu Pro Gly Gly Phe Gly Pro Val
1670 1675 1680
Ser Asn Trp Gly Pro Glu Ile Phe Thr Glu Ile Gly Thr Ile Ala
1685 1690 1695
Ala Gly Ile Pro Asp Leu Ala Leu Ser Ala Leu Leu Arg Gly Gln
1700 1705 1710
Ile Gln Gly Leu Thr Pro Leu Ala Ile Ser Val Ile Pro Ala Pro
1715 1720 1725
Lys Phe Ala Val Val Phe Asn Pro Ile Gln Leu Ser Ser Leu Thr
1730 1735 1740
Arg Gly Gln Ala Val Ala Val Thr Pro Glu Gln Leu Ala Tyr Leu
1745 1750 1755
Ser Pro Glu Gln Arg Arg Ala Val Ala Trp Ala Gln His Glu Gly
1760 1765 1770
Lys Glu Ile Pro Glu Gln Leu Gly Arg Asn Ser Ala Trp Gly Leu
1775 1780 1785
Tyr Asp Trp Phe Gln Ala Ser Trp Ala Leu Ala Leu Pro Val Ser
1790 1795 1800
Ile Phe Gly His Leu Leu
1805
<210> 9
<211> 1767
<212> PRT
<213> 家犬(Canis lupus familiaris)
<400> 9
Met Ala Leu Ser Leu Trp Pro Val Leu Leu Leu Leu Thr Cys Ala Ala
1 5 10 15
Thr Leu Val Ser Ser Gly Ile Gln Ser Leu Asp Pro Asp Leu Ser Leu
20 25 30
Leu Lys Ser Leu Leu Ser Thr Met Asp Gln Ala Pro Gln Gly Ser Leu
35 40 45
Ser Arg Ser Gln Phe Ser Ala Phe Leu Ala Asn Ile Ser Ser Ser Phe
50 55 60
Glu Ser Gly Arg Met Gly Glu Gly Pro Val Gly Glu Pro Pro Pro Leu
65 70 75 80
Gln Ser Pro Ala Leu Arg Leu His Asp Phe Leu Val Thr Leu Arg Gly
85 90 95
Ser Pro Asp Trp Glu Pro Met Leu Gly Leu Leu Gly Asp Val Leu Ala
100 105 110
Leu Leu Gly Gln Glu Gln Thr Pro Arg Asp Phe Leu Gly His Gln Ala
115 120 125
Gly Val Leu Gly Gly Leu Ala Glu Val Leu Leu Gly Ala Leu Val Pro
130 135 140
Ile Gly Pro Pro Thr Pro Thr Arg Pro Pro Cys Ile Arg Asp Gly Pro
145 150 155 160
Ser Asp Cys Val Leu Val Ala Asp Trp Leu Pro Ser Leu Leu Leu Leu
165 170 175
Leu Glu Gly Thr Arg Trp Gln Ala Leu Val Gln Val Gln Pro Ser Val
180 185 190
Asp Pro Thr Asn Ala Thr Gly Leu Asp Gly Arg Glu Pro Ala Pro His
195 200 205
Phe Leu Gln Gly Leu Leu Gly Leu Leu Thr Pro Val Gly Glu Leu Gly
210 215 220
Ser Glu Glu Ala Leu Trp Gly Gly Leu Leu Arg Thr Val Gly Ala Pro
225 230 235 240
Leu Tyr Ala Ala Phe Gln Glu Gly Leu Leu Arg Val Thr Asp Ser Leu
245 250 255
Arg Asn Glu Val Phe Ser Ile Leu Gly Gln Pro Glu Pro Asp Ala Asn
260 265 270
Gly Gln Cys Gln Gly Gly Asn Leu Arg Gln Leu Leu Leu Trp Gly Ile
275 280 285
Arg His Asn Leu Ser Trp Asp Val Gln Ala Leu Gly Phe Leu Ser Gly
290 295 300
Ser Pro Pro Pro Pro Pro Ala Leu Leu His Cys Leu Ser Thr Gly Val
305 310 315 320
Pro Leu Pro Arg Ala Ser Gln Pro Ser Ala His Ile Asn Pro Arg Gln
325 330 335
Arg Arg Ala Ile Ser Val Glu Ala Leu Cys Glu Asn His Ser Gly Pro
340 345 350
Ala Pro Pro Tyr Ser Ile Ser Asn Phe Ser Ile His Leu Leu Cys Gln
355 360 365
His Ala Gln Pro Ala Thr Pro Gln Pro Pro Pro Ser Thr Ala Ala Val
370 375 380
Cys Gln Thr Ala Met Trp Tyr Ala Val Ser Trp Ala Pro Gly Ala Gln
385 390 395 400
Gly Trp Leu Gln Ala Cys His Asp Gln Phe Pro Asp Gln Phe Leu Glu
405 410 415
Ala Ile Cys Ser Asn Leu Ser Phe Ser Ala Leu Ser Gly Pro Asn Arg
420 425 430
Arg Leu Val Lys Gln Leu Cys Ala Gly Leu Leu Pro Pro Pro Thr Asn
435 440 445
Cys Pro Glu Gly Leu Pro Pro Ala Pro Leu Thr Pro Glu Val Phe Trp
450 455 460
Gly Cys Phe Leu Glu Asn Glu Thr Leu Trp Ala Glu Arg Leu Cys Gly
465 470 475 480
Glu Ala Gly Leu Gln Ala Val Pro Pro Ser Asn Gln Ala Trp Val Gln
485 490 495
His Val Cys Gln Gly Pro Thr Pro Asp Val Thr Ala Phe Pro Pro Cys
500 505 510
His Val Gly Pro Cys Gly Glu Arg Cys Pro Asp Gly Gly Ser Phe Leu
515 520 525
Met Met Val Cys Ala Asn Asp Thr Met Tyr Glu Ala Leu Val Pro Phe
530 535 540
Trp Pro Trp Leu Ala Gly Gln Cys Arg Ile Ser Arg Gly Gly Asn Asp
545 550 555 560
Thr Cys Phe Leu Glu Gly Leu Leu Gly Pro Leu Leu Pro Ser Leu Pro
565 570 575
Pro Leu Gly Pro Ser Pro Leu Cys Leu Ala Pro Ala Pro Phe Leu Leu
580 585 590
Gly Met Leu Ser Gln Leu Pro Arg Cys Gln Ser Ser Val Pro Ala Leu
595 600 605
Ala His Ser Thr Arg Leu His Tyr Leu Leu Arg Leu Leu Thr Phe Leu
610 615 620
Leu Gly Pro Gly Ala Gly Gly Thr Glu Ala Gln Gly Met Leu Gly Gln
625 630 635 640
Ala Leu Met Leu Ser Ser Leu Pro Asp Asn Cys Ser Phe Trp Asp Ala
645 650 655
Phe Arg Pro Glu Gly Arg Arg Ser Val Leu Arg Thr Val Gly Glu Tyr
660 665 670
Leu Glu Arg Glu Glu Gln Leu Thr Pro Pro Gly Phe Glu Pro Thr Ala
675 680 685
Ser Pro Ser Ser Gly Ile Thr Lys Met Glu Leu Leu Ala Cys Phe Ser
690 695 700
Pro Val Leu Trp Asp Leu Leu Gln Arg Glu Lys Ser Val Trp Ala Leu
705 710 715 720
Gln Ile Leu Val Gln Ala Tyr Leu His Met Pro Pro Glu Asn Leu Gln
725 730 735
Gln Leu Val Leu Ser Ala Glu Arg Glu Ala Ala Gln Gly Phe Leu Thr
740 745 750
Leu Met His Arg Ser Trp Ala Gln Leu Gln Val Pro Pro Ser Glu Glu
755 760 765
Gln Ala Leu Gly Arg Leu Thr Ala Leu Leu Leu Gln Arg Tyr Pro Arg
770 775 780
Leu Thr Ser Gln Leu Phe Ile Asp Leu Ser Pro Leu Ile Pro Phe Leu
785 790 795 800
Ala Val Ser Asp Leu Met Arg Phe Pro Pro Ser Leu Leu Ala Asn Asp
805 810 815
Ser Val Leu Ala Ala Ile Arg Asp Tyr Ser Pro Gly Met Arg Pro Glu
820 825 830
Gln Lys Glu Ala Leu Ala Lys Arg Leu Leu Ala Pro Glu Leu Phe Gly
835 840 845
Glu Val Pro Ala Trp Ser Gln Glu Leu Leu Trp Ala Val Leu Pro Leu
850 855 860
Leu Pro His Leu Pro Leu Glu Asn Phe Leu Gln Leu Ser Pro His Gln
865 870 875 880
Ile Gln Ala Leu Glu Asp Ser Trp Pro Ala Ala Gly Leu Gly Pro Gly
885 890 895
His Ala Arg His Val Leu Arg Ser Leu Val Asn Gln Ser Val Gln Asp
900 905 910
Gly Glu Glu Gln Val Arg Arg Leu Gly Pro Leu Ala Cys Phe Leu Ser
915 920 925
Pro Glu Glu Leu Gln Ser Leu Val Pro Leu Ser Asp Pro Met Gly Pro
930 935 940
Val Glu Arg Gly Leu Leu Glu Cys Ala Ala Asn Gly Thr Leu Ser Pro
945 950 955 960
Gln Gly Arg Val Ala Tyr Glu Leu Leu Gly Val Leu Arg Ser Ser Gly
965 970 975
Gly Ala Val Leu Ser Pro Leu Glu Leu Arg Val Trp Ala Pro Leu Phe
980 985 990
Pro Gln Leu Gly Leu Arg Phe Leu Gln Glu Leu Ser Glu Pro Gln Leu
995 1000 1005
Arg Ala Met Leu Pro Ala Leu Gln Gly Thr Ser Val Thr Pro Ala
1010 1015 1020
Gln Ala Val Leu Leu Leu Gly Arg Leu Leu Pro Arg His Asp Leu
1025 1030 1035
Ser Leu Glu Glu Leu Cys Ser Leu His Pro Leu Leu Pro Gly Leu
1040 1045 1050
Ser Ser Gln Thr Leu Gln Ala Ile Pro Arg Arg Val Leu Ile Gly
1055 1060 1065
Ala Cys Ser Cys Leu Ala Pro Glu Leu Ser Arg Leu Ser Ala Cys
1070 1075 1080
Gln Thr Ala Ala Leu Leu Gln Thr Phe Arg Val Lys Asp Gly Val
1085 1090 1095
Lys Asn Ile Gly Thr Thr Gly Ala Ser Ala Ala Val Cys Ile Pro
1100 1105 1110
Gly Gln Gln Pro Ile Pro Thr Thr Trp Pro Asp Cys Leu Leu Pro
1115 1120 1125
Leu Leu Pro Leu Lys Leu Leu Gln Leu Asp Ser Ala Ala Leu Leu
1130 1135 1140
Ala Asn Arg Arg Arg Tyr Arg Asp Leu Pro Trp Ser Glu Gln Gln
1145 1150 1155
Ala Gln Phe Leu Trp Lys Lys Met Gln Val Pro Thr Asn Leu Thr
1160 1165 1170
Leu Arg Asn Leu Gln Ala Leu Gly Thr Leu Ala Gly Gly Met Ser
1175 1180 1185
Cys Glu Phe Leu Gln Gln Ile Asn Leu Met Ala Asp Phe Leu Glu
1190 1195 1200
Val Val His Met Ile Tyr Gln Leu Pro Thr Gly Val Arg Gly Ser
1205 1210 1215
Leu Arg Ala Cys Ile Trp Ala Glu Leu Gln Arg Lys Met Thr Met
1220 1225 1230
Pro Glu Pro Glu Leu Ala Thr Leu Gly Ser Glu Leu Ser Gly Leu
1235 1240 1245
Asp Thr Lys Leu Leu Leu Asp Ser Pro Ile Tyr Leu Met Asp Arg
1250 1255 1260
Leu Ser Asn Glu Ser Ile Met Leu Met Val Glu Leu Val Arg Arg
1265 1270 1275
Ala Pro Glu Gln Leu Leu Ala Leu Thr Pro Leu His Arg Val Ala
1280 1285 1290
Leu Ala Glu Arg Ala Leu Gln Asn Leu Ala Pro Lys Glu Thr Thr
1295 1300 1305
Val Ser Arg Glu Val Leu Glu Thr Leu Gly Pro Leu Val Gly Phe
1310 1315 1320
Leu Gly Ile Glu Ser Thr Arg Arg Ile Pro Leu Pro Ile Leu Leu
1325 1330 1335
Ala His Leu Asn Gln Leu Gln Gly Phe Cys Leu Gly Glu Pro Phe
1340 1345 1350
Ala Thr Glu Leu Gly Trp Leu Leu Ser Gln Glu Pro Ile Leu Gly
1355 1360 1365
Lys Pro Glu Leu Trp Ser Glu Gly Glu Val Glu Gln Ala Gly Arg
1370 1375 1380
Leu Val Leu Thr Leu Ser Thr Glu Ala Ile Ser Leu Ile Pro Arg
1385 1390 1395
Glu Ala Leu Gly Pro Glu Thr Leu Glu Arg Leu Leu Glu Lys Gln
1400 1405 1410
Gln Ser Trp Glu Gln Ser Arg Val Gly Gln Leu Cys Gly Thr Pro
1415 1420 1425
Gln Leu Ala Pro Lys Lys Ala Ala Leu Val Ala Gly Val Val Arg
1430 1435 1440
Pro Thr Ala Glu Asp Leu Ser Glu Pro Val Pro Asn Cys Ala Asp
1445 1450 1455
Val Arg Gly Thr Phe Pro Ala Ala Trp Ser Ala Thr Gln Ile Ala
1460 1465 1470
Glu Met Glu Leu Ser Asp Phe Glu Asp Cys Leu Ala Leu Phe Ala
1475 1480 1485
Gly Asp Pro Gly Leu Gly Pro Glu Glu Leu Arg Ala Ala Met Gly
1490 1495 1500
Lys Ala Lys Gln Leu Trp Gly Pro Pro Arg Gly Phe Arg Pro Glu
1505 1510 1515
Gln Ile Leu Gln Leu Ser Arg Leu Leu Ile Gly Leu Gly Glu Arg
1520 1525 1530
Glu Leu Gln Glu Leu Ile Leu Val Asp Trp Gly Val Leu Ser Thr
1535 1540 1545
Leu Gly Gln Ile Asp Gly Trp Ser Ser Ile Gln Leu Arg Val Val
1550 1555 1560
Val Ser Ser Phe Leu Arg Gln Ser Gly Arg His Val Ser His Leu
1565 1570 1575
Asp Phe Leu His Leu Thr Ala Leu Gly Tyr Thr Leu Cys Gly Leu
1580 1585 1590
Arg Pro Glu Glu Leu Gln His Ile Ser Ser Trp Glu Phe Ser Gln
1595 1600 1605
Ala Ala Leu Phe Leu Gly Asn Leu His Leu Gln Cys Ser Glu Glu
1610 1615 1620
Gln Leu Glu Val Leu Ala Gln Leu Leu Val Leu Pro Gly Gly Phe
1625 1630 1635
Gly Pro Val Ser Asn Trp Gly Pro Glu Ile Phe Thr Glu Ile Gly
1640 1645 1650
Thr Ile Ala Ala Gly Ile Pro Asp Leu Ala Leu Ser Ala Leu Leu
1655 1660 1665
Gln Glu Gln Ile Gln Gly Leu Thr Pro Leu Ala Ile Ser Val Ile
1670 1675 1680
Pro Ala Pro Lys Phe Ala Val Val Phe Ser Pro Thr Gln Leu Ser
1685 1690 1695
Ser Leu Thr Ser Val Gln Ala Met Ala Val Thr Pro Glu Gln Met
1700 1705 1710
Ala Phe Leu Ser Pro Glu Gln Arg Arg Ala Val Val Trp Ala Gln
1715 1720 1725
His Glu Gly Lys Glu Ser Pro Glu Gln Gln Gly Arg Ser Thr Ala
1730 1735 1740
Trp Gly Leu Gln Asp Trp Ser Gln Pro Ser Trp Ala Met Ala Leu
1745 1750 1755
Thr Ile Cys Phe Leu Gly Asn Leu Ile
1760 1765
<210> 10
<211> 22
<212> PRT
<213> 智人(Homo sapiens)
<400> 10
Met Ala Leu Ser Leu Trp Pro Leu Leu Leu Leu Leu Leu Leu Leu Leu
1 5 10 15
Leu Leu Ser Phe Ala Val
20
<210> 11
<211> 1775
<212> PRT
<213> 智人(Homo sapiens)
<400> 11
Met Ala Leu Ser Leu Trp Pro Leu Leu Leu Leu Leu Leu Leu Leu Leu
1 5 10 15
Leu Leu Ser Phe Ala Val Thr Leu Ala Pro Thr Gly Pro His Ser Leu
20 25 30
Asp Pro Gly Leu Ser Phe Leu Lys Ser Leu Leu Ser Thr Leu Asp Gln
35 40 45
Ala Pro Gln Gly Ser Leu Ser Arg Ser Arg Phe Phe Thr Phe Leu Ala
50 55 60
Asn Ile Ser Ser Ser Phe Glu Pro Gly Arg Met Gly Glu Gly Pro Val
65 70 75 80
Gly Glu Pro Pro Pro Leu Gln Pro Pro Ala Leu Arg Leu His Asp Phe
85 90 95
Leu Val Thr Leu Arg Gly Ser Pro Asp Trp Glu Pro Met Leu Gly Leu
100 105 110
Leu Gly Asp Met Leu Ala Leu Leu Gly Gln Glu Gln Thr Pro Arg Asp
115 120 125
Phe Leu Val His Gln Ala Gly Val Leu Gly Gly Leu Val Glu Val Leu
130 135 140
Leu Gly Ala Leu Val Pro Gly Gly Pro Pro Thr Pro Thr Arg Pro Pro
145 150 155 160
Cys Thr Arg Asp Gly Pro Ser Asp Cys Val Leu Ala Ala Asp Trp Leu
165 170 175
Pro Ser Leu Leu Leu Leu Leu Glu Gly Thr Arg Trp Gln Ala Leu Val
180 185 190
Gln Val Gln Pro Ser Val Asp Pro Thr Asn Ala Thr Gly Leu Asp Gly
195 200 205
Arg Glu Ala Ala Pro His Phe Leu Gln Gly Leu Leu Gly Leu Leu Thr
210 215 220
Pro Thr Gly Glu Leu Gly Ser Lys Glu Ala Leu Trp Gly Gly Leu Leu
225 230 235 240
Arg Thr Val Gly Ala Pro Leu Tyr Ala Ala Phe Gln Glu Gly Leu Leu
245 250 255
Arg Val Thr His Ser Leu Gln Asp Glu Val Phe Ser Ile Leu Gly Gln
260 265 270
Pro Glu Pro Asp Thr Asn Gly Gln Cys Gln Gly Gly Asn Leu Gln Gln
275 280 285
Leu Leu Leu Trp Gly Val Arg His Asn Leu Ser Trp Asp Val Gln Ala
290 295 300
Leu Gly Phe Leu Ser Gly Ser Pro Pro Pro Pro Pro Ala Leu Leu His
305 310 315 320
Cys Leu Ser Thr Gly Val Pro Leu Pro Arg Ala Ser Gln Pro Ser Ala
325 330 335
His Ile Ser Pro Arg Gln Arg Arg Ala Ile Thr Val Glu Ala Leu Cys
340 345 350
Glu Asn His Leu Gly Pro Ala Pro Pro Tyr Ser Ile Ser Asn Phe Ser
355 360 365
Ile His Leu Leu Cys Gln His Thr Lys Pro Ala Thr Pro Gln Pro His
370 375 380
Pro Ser Thr Thr Ala Ile Cys Gln Thr Ala Val Trp Tyr Ala Val Ser
385 390 395 400
Trp Ala Pro Gly Ala Gln Gly Trp Leu Gln Ala Cys His Asp Gln Phe
405 410 415
Pro Asp Glu Phe Leu Asp Ala Ile Cys Ser Asn Leu Ser Phe Ser Ala
420 425 430
Leu Ser Gly Ser Asn Arg Arg Leu Val Lys Arg Leu Cys Ala Gly Leu
435 440 445
Leu Pro Pro Pro Thr Ser Cys Pro Glu Gly Leu Pro Pro Val Pro Leu
450 455 460
Thr Pro Asp Ile Phe Trp Gly Cys Phe Leu Glu Asn Glu Thr Leu Trp
465 470 475 480
Ala Glu Arg Leu Cys Gly Glu Ala Ser Leu Gln Ala Val Pro Pro Ser
485 490 495
Asn Gln Ala Trp Val Gln His Val Cys Gln Gly Pro Thr Pro Asp Val
500 505 510
Thr Ala Ser Pro Pro Cys His Ile Gly Pro Cys Gly Glu Arg Cys Pro
515 520 525
Asp Gly Gly Ser Phe Leu Val Met Val Cys Ala Asn Asp Thr Met Tyr
530 535 540
Glu Val Leu Val Pro Phe Trp Pro Trp Leu Ala Gly Gln Cys Arg Ile
545 550 555 560
Ser Arg Gly Gly Asn Asp Thr Cys Phe Leu Glu Gly Leu Leu Gly Pro
565 570 575
Leu Leu Pro Ser Leu Pro Pro Leu Gly Pro Ser Pro Leu Cys Leu Thr
580 585 590
Pro Gly Pro Phe Leu Leu Gly Met Leu Ser Gln Leu Pro Arg Cys Gln
595 600 605
Ser Ser Val Pro Ala Leu Ala His Pro Thr Arg Leu His Tyr Leu Leu
610 615 620
Arg Leu Leu Thr Phe Leu Leu Gly Pro Gly Ala Gly Gly Ala Glu Ala
625 630 635 640
Gln Gly Met Leu Gly Arg Ala Leu Leu Leu Ser Ser Leu Pro Asp Asn
645 650 655
Cys Ser Phe Trp Asp Ala Phe Arg Pro Glu Gly Arg Arg Ser Val Leu
660 665 670
Arg Thr Ile Gly Glu Tyr Leu Glu Gln Asp Glu Glu Gln Pro Thr Pro
675 680 685
Ser Gly Phe Glu Pro Thr Val Asn Pro Ser Ser Gly Ile Ser Lys Met
690 695 700
Glu Leu Leu Ala Cys Phe Ser Pro Val Leu Trp Asp Leu Leu Gln Arg
705 710 715 720
Glu Lys Ser Val Trp Ala Leu Gln Ile Leu Val Gln Ala Tyr Leu His
725 730 735
Met Pro Pro Glu Asn Leu Gln Gln Leu Val Leu Ser Ala Glu Arg Glu
740 745 750
Ala Ala Gln Gly Phe Leu Thr Leu Met Leu Gln Gly Lys Leu Gln Gly
755 760 765
Lys Leu Gln Val Pro Pro Ser Glu Glu Gln Ala Leu Gly Arg Leu Thr
770 775 780
Ala Leu Leu Leu Gln Arg Tyr Pro Arg Leu Thr Ser Gln Leu Phe Ile
785 790 795 800
Asp Leu Ser Pro Leu Ile Pro Phe Leu Ala Val Ser Asp Leu Met Arg
805 810 815
Phe Pro Pro Ser Leu Leu Ala Asn Asp Ser Val Leu Ala Ala Ile Arg
820 825 830
Asp Tyr Ser Pro Gly Met Arg Pro Glu Gln Lys Glu Ala Leu Ala Lys
835 840 845
Arg Leu Leu Ala Pro Glu Leu Phe Gly Glu Val Pro Ala Trp Pro Gln
850 855 860
Glu Leu Leu Trp Ala Val Leu Pro Leu Leu Pro His Leu Pro Leu Glu
865 870 875 880
Asn Phe Leu Gln Leu Ser Pro His Gln Ile Gln Ala Leu Glu Asp Ser
885 890 895
Trp Pro Ala Ala Gly Leu Gly Pro Gly His Ala Arg His Val Leu Arg
900 905 910
Ser Leu Val Asn Gln Ser Val Gln Asp Gly Glu Glu Gln Val Arg Arg
915 920 925
Leu Gly Pro Leu Ala Cys Phe Leu Ser Pro Glu Glu Leu Gln Ser Leu
930 935 940
Val Pro Leu Ser Asp Pro Thr Gly Pro Val Glu Arg Gly Leu Leu Glu
945 950 955 960
Cys Ala Ala Asn Gly Thr Leu Ser Pro Glu Gly Arg Val Ala Tyr Glu
965 970 975
Leu Leu Gly Val Leu Arg Ser Ser Gly Gly Ala Val Leu Ser Pro Arg
980 985 990
Glu Leu Arg Val Trp Ala Pro Leu Phe Ser Gln Leu Gly Leu Arg Phe
995 1000 1005
Leu Gln Glu Leu Ser Glu Pro Gln Leu Arg Ala Met Leu Pro Val
1010 1015 1020
Leu Gln Gly Thr Ser Val Thr Pro Ala Gln Ala Val Leu Leu Leu
1025 1030 1035
Gly Arg Leu Leu Pro Arg His Asp Leu Ser Leu Glu Glu Leu Cys
1040 1045 1050
Ser Leu His Leu Leu Leu Pro Gly Leu Ser Pro Gln Thr Leu Gln
1055 1060 1065
Ala Ile Pro Arg Arg Val Leu Val Gly Ala Cys Ser Cys Leu Ala
1070 1075 1080
Pro Glu Leu Ser Arg Leu Ser Ala Cys Gln Thr Ala Ala Leu Leu
1085 1090 1095
Gln Thr Phe Arg Val Lys Asp Gly Val Lys Asn Met Gly Thr Thr
1100 1105 1110
Gly Ala Gly Pro Ala Val Cys Ile Pro Gly Gln Pro Ile Pro Thr
1115 1120 1125
Thr Trp Pro Asp Cys Leu Leu Pro Leu Leu Pro Leu Lys Leu Leu
1130 1135 1140
Gln Leu Asp Ser Leu Ala Leu Leu Ala Asn Arg Arg Arg Tyr Trp
1145 1150 1155
Glu Leu Pro Trp Ser Glu Gln Gln Ala Gln Phe Leu Trp Lys Lys
1160 1165 1170
Met Gln Val Pro Thr Asn Leu Thr Leu Arg Asn Leu Gln Ala Leu
1175 1180 1185
Gly Thr Leu Ala Gly Gly Met Ser Cys Glu Phe Leu Gln Gln Ile
1190 1195 1200
Asn Ser Met Val Asp Phe Leu Glu Val Val His Met Ile Tyr Gln
1205 1210 1215
Leu Pro Thr Arg Val Arg Gly Ser Leu Arg Ala Cys Ile Trp Ala
1220 1225 1230
Glu Leu Gln Arg Arg Met Ala Met Pro Glu Pro Glu Trp Thr Thr
1235 1240 1245
Val Gly Pro Glu Leu Asn Gly Leu Asp Ser Lys Leu Leu Leu Asp
1250 1255 1260
Leu Pro Ile Gln Leu Met Asp Arg Leu Ser Asn Glu Ser Ile Met
1265 1270 1275
Leu Val Val Glu Leu Val Gln Arg Ala Pro Glu Gln Leu Leu Ala
1280 1285 1290
Leu Thr Pro Leu His Gln Ala Ala Leu Ala Glu Arg Ala Leu Gln
1295 1300 1305
Asn Leu Ala Pro Lys Glu Thr Pro Val Ser Gly Glu Val Leu Glu
1310 1315 1320
Thr Leu Gly Pro Leu Val Gly Phe Leu Gly Thr Glu Ser Thr Arg
1325 1330 1335
Gln Ile Pro Leu Gln Ile Leu Leu Ser His Leu Ser Gln Leu Gln
1340 1345 1350
Gly Phe Cys Leu Gly Glu Thr Phe Ala Thr Glu Leu Gly Trp Leu
1355 1360 1365
Leu Leu Gln Glu Ser Val Leu Gly Lys Pro Glu Leu Trp Ser Gln
1370 1375 1380
Asp Glu Val Glu Gln Ala Gly Arg Leu Val Phe Thr Leu Ser Thr
1385 1390 1395
Glu Ala Ile Ser Leu Ile Pro Arg Glu Ala Leu Gly Pro Glu Thr
1400 1405 1410
Leu Glu Arg Leu Leu Glu Lys Gln Gln Ser Trp Glu Gln Ser Arg
1415 1420 1425
Val Gly Gln Leu Cys Arg Glu Pro Gln Leu Ala Ala Lys Lys Ala
1430 1435 1440
Ala Leu Val Ala Gly Val Val Arg Pro Ala Ala Glu Asp Leu Pro
1445 1450 1455
Glu Pro Val Pro Asn Cys Ala Asp Val Arg Gly Thr Phe Pro Ala
1460 1465 1470
Ala Trp Ser Ala Thr Gln Ile Ala Glu Met Glu Leu Ser Asp Phe
1475 1480 1485
Glu Asp Cys Leu Thr Leu Phe Ala Gly Asp Pro Gly Leu Gly Pro
1490 1495 1500
Glu Glu Leu Arg Ala Ala Met Gly Lys Ala Lys Gln Leu Trp Gly
1505 1510 1515
Pro Pro Arg Gly Phe Arg Pro Glu Gln Ile Leu Gln Leu Gly Arg
1520 1525 1530
Leu Leu Ile Gly Leu Gly Asp Arg Glu Leu Gln Glu Leu Ile Leu
1535 1540 1545
Val Asp Trp Gly Val Leu Ser Thr Leu Gly Gln Ile Asp Gly Trp
1550 1555 1560
Ser Thr Thr Gln Leu Arg Ile Val Val Ser Ser Phe Leu Arg Gln
1565 1570 1575
Ser Gly Arg His Val Ser His Leu Asp Phe Val His Leu Thr Ala
1580 1585 1590
Leu Gly Tyr Thr Leu Cys Gly Leu Arg Pro Glu Glu Leu Gln His
1595 1600 1605
Ile Ser Ser Trp Glu Phe Ser Gln Ala Ala Leu Phe Leu Gly Thr
1610 1615 1620
Leu His Leu Gln Cys Ser Glu Glu Gln Leu Glu Val Leu Ala His
1625 1630 1635
Leu Leu Val Leu Pro Gly Gly Phe Gly Pro Ile Ser Asn Trp Gly
1640 1645 1650
Pro Glu Ile Phe Thr Glu Ile Gly Thr Ile Ala Ala Gly Ile Pro
1655 1660 1665
Asp Leu Ala Leu Ser Ala Leu Leu Arg Gly Gln Ile Gln Gly Val
1670 1675 1680
Thr Pro Leu Ala Ile Ser Val Ile Pro Pro Pro Lys Phe Ala Val
1685 1690 1695
Val Phe Ser Pro Ile Gln Leu Ser Ser Leu Thr Ser Ala Gln Ala
1700 1705 1710
Val Ala Val Thr Pro Glu Gln Met Ala Phe Leu Ser Pro Glu Gln
1715 1720 1725
Arg Arg Ala Val Ala Trp Ala Gln His Glu Gly Lys Glu Ser Pro
1730 1735 1740
Glu Gln Gln Gly Arg Ser Thr Ala Trp Gly Leu Gln Asp Trp Ser
1745 1750 1755
Arg Pro Ser Trp Ser Leu Val Leu Thr Ile Ser Phe Leu Gly His
1760 1765 1770
Leu Leu
1775
<210> 12
<211> 4324
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-201
<400> 12
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtagactt gcccaaaaac tctggcaaag ttgaattgct 180
tccaaaagtt caactttatc agaaggacct attccctacg gaaactagct gaaggtctcc 240
tggcactctg gatctcgtgg aagggagcct tcttcaggga acagagggag cgattaagtg 300
gtgaaaagca aacagacctg gaaaagttcc ctttctgaga gtagcaacag aaagctctgc 360
aaagactccc tccaagctat tggatcctct tgcttgggat aaccacttga gtactcagat 420
accaaaagaa gagtggaaat cccaagagaa gtcaccagaa aaaacagctt ttaagaaaaa 480
ggatacactt ttgtccctga acgcttgtga aagcaatctg acaatagcag caattgaaaa 540
gggacaaaat aagcccgaaa tagaagtcac ctgggcaaag caaggtagga ctgaaaggct 600
gtgctctcaa aacccaccag tcttgaaacg cactcaacgg gtgaaagtag taggaaaggg 660
tgaatttaca aaggacgtag gactcaaaga gtgagttttt ccaagcagca gaaacctatt 720
tcttactaac ttggataatt tactgaaaaa taatacacac aatcaagaaa aaaaaattca 780
ggaagaaata gaaaagaagg aaaacttaat ccaagagtga atagttttgc ctcagataac 840
tacagtgact ggcactaaga atttctgaaa gaaccttttc ttactgagca ctaggctgaa 900
aatagaaggt tacttgaacg gggacttgac tccagtactt caagatttta ggtactttga 960
aaattcaaca aatagaacaa agaaacacac agctactttc tcaaaaaaag gggaggaaga 1020
aaacttggaa ggcttgggaa atcaaaccaa gcaaattgta gagaaattga ctgacaccac 1080
aaggatatct cctaatacaa gccagcagaa ttttgtcacg caacgtagta agagagcttt 1140
gaaactagat cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 1200
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 1260
cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact 1320
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 1380
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 1440
acatctacgt attagtcatc gctattacca tggtgatgcg gttttggtga tgcggttttg 1500
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 1560
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 1620
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 1680
aagcagagct cgtttagtga accgtcaccg gtggtgccct gccctcacct ggctatccca 1740
cacaggtgag aataaccaga actcacctcc ggtaccagtg ttcacttggc caccatggct 1800
ctcagcctct ggcccctgct gctgctgctg ctgctgctgc tgctgctgtc ctttgcagtg 1860
actctggccc ctactgggcc tcattccctg gaccctggtc tctccttcct gaagtcattg 1920
ctctccactc tggaccaggc tccccagggc tccctgagcc gctcacggtt ctttacattc 1980
ctggccaaca tttcttcttc ctttgagcct gggagaatgg gggaaggacc agtaggagag 2040
cccccacctc tccagccgcc tgctctgcgg ctccatgatt ttctagtgac actgagaggt 2100
agccccgact gggagccaat gctagggctg ctaggggata tgctggcact gctgggacag 2160
gagcagactc cccgagattt cctggtgcac caggcagggg tgctgggtgg acttgtggag 2220
gtgctgctgg gagccttagt tcctgggggc ccccctaccc caactcggcc cccatgcacc 2280
cgtgatgggc cgtctgactg tgtcctggct gctgactggt tgccttctct gctgctgttg 2340
ttagagggca cacgctggca agctctggtg caggtgcagc ccagtgtgga ccccaccaat 2400
gccacaggcc tcgatgggag ggaggcagct cctcactttt tgcagggtct gttgggtttg 2460
cttaccccaa caggggagct aggctccaag gaggctcttt ggggcggtct gctacgcaca 2520
gtgggggccc ccctctatgc tgcctttcag gaggggctgc tccgtgtcac tcactccttg 2580
caggatgagg tcttctccat tttggggcag ccagagcctg ataccaatgg gcagtgccag 2640
ggaggtaacc ttcaacagct gctcttatgg ggcgtccggc acaacctttc ctgggatgtc 2700
caggcgctgg gctttctgtc tggatcacca cccccacccc ctgccctcct tcactgcctg 2760
agcacgggcg tgcctctgcc cagagcttct cagccgtcag cccacatcag cccacgccaa 2820
cggcgagcca tcactgtgga ggccctctgt gagaaccact taggcccagc accaccctac 2880
agcatttcca acttctccat ccacttgctc tgccagcaca ccaagcctgc cactccacag 2940
ccccatccca gcaccactgc catctgccag acagctgtgt ggtatgcagt gtcctgggca 3000
ccaggtgccc aaggctggct acaggcctgc cacgaccagt ttcctgatga gtttttggat 3060
gcgatctgca gtaacctctc cttttcagcc ctgtctggct ccaaccgccg cctggtgaag 3120
cggctctgtg ctggcctgct cccaccccct accagctgcc ctgaaggcct gccccctgtt 3180
cccctcaccc cagacatctt ttggggctgc ttcttggaga atgagactct gtgggctgag 3240
cgactgtgtg gggaggcaag tctacaggct gtgcccccca gcaaccaggc ttgggtccag 3300
catgtgtgcc agggccccac cccagatgtc actgcctccc caccatgcca cattggaccc 3360
tgtggggaac gctgcccgga tgggggcagc ttcctggtga tggtctgtgc caatgacacc 3420
atgtatgagg tcctggtgcc cttctggcct tggctagcag gccaatgcag gataagtcgt 3480
gggggcaatg acacttgctt cctagaaggg ctgctgggcc cccttctgcc ctctctgcca 3540
ccactgggac catccccact ctgtctgacc cctggcccct tcctccttgg catgctatcc 3600
cagttgccac gctgtcagtc ctctgtccca gctcttgctc accccacacg cctacactat 3660
ctcctccgcc tgctgacctt cctcttgggt ccaggggctg ggggcgctga ggcccagggg 3720
atgctgggtc gggccctact gctctccagt ctcccagaca actgctcctt ctgggatgcc 3780
tttcgcccag agggccggcg cagtgtgcta cggacgattg gggaatacct ggaacaagat 3840
gaggagcagc caaccccatc aggctttgaa cccactgtca accccagctc tggtataagc 3900
aagatggagc tgctggcctg ctttagtcct gtgctgtggg atctgctcca gagggaaaag 3960
agtgtttggg ccctgcagat tctagtgcag gtaagtatca aggttacaag acaggtttaa 4020
ggagaccaat agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgggatttt 4080
gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt 4140
taacaaaata agcttgaatt cagctgacgt gcctcggacc gctaggaacc cctagtgatg 4200
gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4260
gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg 4320
cagg 4324
<210> 13
<211> 4434
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-202
<400> 13
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgggatt ttgccgattt cggcctattg gttaaaaaat 180
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tgataggcac ctattggtct 240
tactgacatc cactttgcct ttctctccac aggcgtacct gcatatgccc ccagaaaacc 300
tccagcagct ggtgctttca gcagagaggg aggctgcaca gggcttcctg acactcatgc 360
tgcaggggaa gctgcagggg aagctgcagg taccaccatc cgaggagcag gccctgggtc 420
gcctgacagc cctgctgctc cagcggtacc cacgcctcac ctcccagctc ttcattgacc 480
tgtcaccact catccctttc ttggctgtct ctgacctgat gcgcttccca ccatccctgt 540
tagccaacga cagtgtcctg gctgccatcc gggattacag cccaggaatg aggcctgaac 600
agaaggaggc tctggcaaag cgactgctgg cccctgaact gtttggggaa gtgcctgcct 660
ggccccagga gctgctgtgg gcagtgctgc ccctgctccc ccacctccct ctggagaact 720
ttttgcagct cagccctcac cagatccagg ccctggagga tagctggcca gcagcaggtc 780
tggggccagg gcatgcccgc catgtgctgc gcagcctggt aaaccagagt gtccaggatg 840
gtgaggagca ggtacgcagg cttgggcccc tcgcctgttt cctgagccct gaggagctgc 900
agagcctagt gcccctgagt gatccaacgg ggccagtaga acgggggctg ctggaatgtg 960
cagccaatgg gaccctcagc ccagaaggac gggtggcata tgaacttctg ggtgtgttgc 1020
gctcatctgg aggagcggtg ctgagccccc gggagctgcg ggtctgggcc cctctcttct 1080
ctcagctggg cctccgcttc cttcaggagc tgtcagagcc ccagcttaga gccatgcttc 1140
ctgtcctcca gggaactagt gttacacctg ctcaggctgt cctgctgctt ggacggctcc 1200
ttcctaggca cgatctatcc ctggaggaac tctgctcctt gcaccttctg ctaccaggcc 1260
tcagccccca gacactccag gccatcccta ggcgagtcct ggtcggggct tgttcctgcc 1320
tggcccctga actgtcacgc ctctcagcct gccagaccgc agcactgctg cagacctttc 1380
gggttaaaga tggtgttaaa aatatgggta caacaggtgc tggtccagct gtgtgtatcc 1440
ctggtcagcc tattcccacc acctggccag actgcctgct tcccctgctc ccattaaagc 1500
tgctacaact ggattccttg gctcttctgg caaatcgaag acgctactgg gagctgccct 1560
ggtctgagca gcaggcacag tttctctgga agaagatgca agtacccacc aaccttaccc 1620
tcaggaatct gcaggctctg ggcaccctgg caggaggcat gtcctgtgag tttctgcagc 1680
agatcaactc catggtagac ttccttgaag tggtgcacat gatctatcag ctgcccacta 1740
gagttcgagg gagcctgagg gcctgtatct gggcagagct acagcggagg atggcaatgc 1800
cagaaccaga atggacaact gtagggccag aactgaacgg gctggatagc aagctactcc 1860
tggacttacc gatccagttg atggacagac tatccaatga atccattatg ttggtggtgg 1920
agctggtgca aagagctcca gagcagctgc tggcactgac ccccctccac caggcagccc 1980
tggcagagag ggcactacaa aacctggctc caaaggagac tccagtctca ggggaagtgc 2040
tggagacctt aggccctttg gttggattcc tggggacaga gagcacacga cagatccccc 2100
tacagatcct gctgtcccat ctcagtcagc tgcaaggctt ctgcctagga gagacatttg 2160
ccacagagct gggatggctg ctattgcagg agtctgttct tgggaaacca gagttgtgga 2220
gccaggatga agtagagcaa gctggacgcc tagtattcac tctgtctact gaggcaattt 2280
ccttgatccc cagggaggcc ttgggtccag agaccctgga gcggcttcta gaaaagcagc 2340
agagctggga gcagagcaga gttggacagc tgtgtaggga gccacagctt gctgccaaga 2400
aagcagccct ggtagcaggg gtggtgcgac cagctgctga ggatcttcca gaacctgtgc 2460
caaattgtgc agatgtacga gggacattcc cagcagcctg gtctgcaacc cagattgcag 2520
agatggagct ctcagacttt gaggactgcc tgacattatt tgcaggagac ccaggacttg 2580
ggcctgagga actgcgggca gccatgggca aagcaaaaca gttgtggggt cccccccggg 2640
gatttcgtcc tgagcagatc ctgcagcttg gtaggctctt aataggtcta ggagatcggg 2700
aactacagga gctgatccta gtggactggg gagtgctgag caccctgggg cagatagatg 2760
gctggagcac cactcagctc cgcattgtgg tctccagttt cctacggcag agtggtcggc 2820
atgtgagcca cctggacttc gttcatctga cagcgctggg ttatactctc tgtggactgc 2880
ggccagagga gctccagcac atcagcagtt gggagttcag ccaagcagct ctcttcctcg 2940
gcaccctgca tctccagtgc tctgaggaac aactggaggt tctggcccac ctacttgtac 3000
tgcctggtgg gtttggccca atcagtaact gggggcctga gatcttcact gaaattggca 3060
ccatagcagc tgggatccca gacctggctc tttcagcact gctgcgggga cagatccagg 3120
gcgttactcc tcttgccatt tctgtcatcc ctcctcctaa atttgctgtg gtgtttagtc 3180
ccatccaact atctagtctc accagtgctc aggctgtggc tgtcactcct gagcaaatgg 3240
cctttctgag tcctgagcag cgacgagcag ttgcatgggc ccaacatgag ggaaaggaga 3300
gcccagaaca gcaaggtcga agtacagcct ggggcctcca ggactggtca cgaccttcct 3360
ggtccctggt attgactatc agcttccttg gccacctgct atgagcctgt ctctacagta 3420
gaaggagatt gtggggagag aaatcttaag tcataatgaa taaagtgcaa acagaagtgc 3480
atcctgatta ttttcagaag ctgatgagga ataactagtg ctgatcagcc tcgactgtgc 3540
cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag 3600
gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta 3660
ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag 3720
acaatagcag gcatgctggg gatgcggtgg gctctatggc aattcagact cccactagaa 3780
gaaacagaac ttgaaaaaag gataattgtg gtgaacacct caacccagtg gtccaaaaac 3840
tgaaaaactt tgaccccgag caccctcaca cagatagact actgaaagaa ggagaaaggg 3900
gcacttactc agtctccctt atcagattgc cttacgagga gtactagact ccctcaagca 3960
aatagatctc acttaccact tgcaaaggta tactactttc actctattag acctatatat 4020
ctgaccaggg tcctattcca agacaactct tctactcttc cagcagactc ttatagaaag 4080
aaagattctg gggtccaaga aagcagtact ttcttacaag gagccaaaaa aaataacctt 4140
tctttagcac ttctaacctt ggagtgaact ggtgatcaaa gagaggttgg ctccctgggg 4200
acaagtgcca caaattcagt caactacaag aaagttgaga acactgttct cccgaaacca 4260
agcttgaatt cagctgacgt gcctcggacc gctaggaacc cctagtgatg gagttggcca 4320
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4380
cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg cagg 4434
<210> 14
<211> 4693
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-202GFP
<400> 14
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgggatt ttgccgattt cggcctattg gttaaaaaat 180
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tgataggcac ctattggtct 240
tactgacatc cactttgcct ttctctccac aggcgtacct gcatatgccc ccagaaaacc 300
tccagcagct ggtgctttca gcagagaggg aggctgcaca gggcttcctg acactcatgc 360
tgcaggggaa gctgcagggg aagctgcagg taccaccatc cgaggagcag gccctgggtc 420
gcctgacagc cctgctgctc cagcggtacc cacgcctcac ctcccagctc ttcattgacc 480
tgtcaccact catccctttc ttggctgtct ctgacctgat gcgcttccca ccatccctgt 540
tagccaacga cagtgtcctg gctgccatcc gggattacag cccaggaatg aggcctgaac 600
agaaggaggc tctggcaaag cgactgctgg cccctgaact gtttggggaa gtgcctgcct 660
ggccccagga gctgctgtgg gcagtgctgc ccctgctccc ccacctccct ctggagaact 720
ttttgcagct cagccctcac cagatccagg ccctggagga tagctggcca gcagcaggtc 780
tggggccagg gcatgcccgc catgtgctgc gcagcctggt aaaccagagt gtccaggatg 840
gtgaggagca ggtacgcagg cttgggcccc tcgcctgttt cctgagccct gaggagctgc 900
agagcctagt gcccctgagt gatccaacgg ggccagtaga acgggggctg ctggaatgtg 960
cagccaatgg gaccctcagc ccagaaggac gggtggcata tgaacttctg ggtgtgttgc 1020
gctcatctgg aggagcggtg ctgagccccc gggagctgcg ggtctgggcc cctctcttct 1080
ctcagctggg cctccgcttc cttcaggagc tgtcagagcc ccagcttaga gccatgcttc 1140
ctgtcctcca gggaactagt gttacacctg ctcaggctgt cctgctgctt ggacggctcc 1200
ttcctaggca cgatctatcc ctggaggaac tctgctcctt gcaccttctg ctaccaggcc 1260
tcagccccca gacactccag gccatcccta ggcgagtcct ggtcggggct tgttcctgcc 1320
tggcccctga actgtcacgc ctctcagcct gccagaccgc agcactgctg cagacctttc 1380
gggttaaaga tggtgttaaa aatatgggta caacaggtgc tggtccagct gtgtgtatcc 1440
ctggtcagcc tattcccacc acctggccag actgcctgct tcccctgctc ccattaaagc 1500
tgctacaact ggattccttg gctcttctgg caaatcgaag acgctactgg gagctgccct 1560
ggtctgagca gcaggcacag tttctctgga agaagatgca agtacccacc aaccttaccc 1620
tcaggaatct gcaggctctg ggcaccctgg caggaggcat gtcctgtgag tttctgcagc 1680
agatcaactc catggtagac ttccttgaag tggtgcacat gatctatcag ctgcccacta 1740
gagttcgagg gagcctgagg gcctgtatct gggcagagct acagcggagg atggcaatgc 1800
cagaaccaga atggacaact gtagggccag aactgaacgg gctggatagc aagctactcc 1860
tggacttacc gatccagttg atggacagac tatccaatga atccattatg ttggtggtgg 1920
agctggtgca aagagctcca gagcagctgc tggcactgac ccccctccac caggcagccc 1980
tggcagagag ggcactacaa aacctggctc caaaggagac tccagtctca ggggaagtgc 2040
tggagacctt aggccctttg gttggattcc tggggacaga gagcacacga cagatccccc 2100
tacagatcct gctgtcccat ctcagtcagc tgcaaggctt ctgcctagga gagacatttg 2160
ccacagagct gggatggctg ctattgcagg agtctgttct tgggaaacca gagttgtgga 2220
gccaggatga agtagagcaa gctggacgcc tagtattcac tctgtctact gaggcaattt 2280
ccttgatccc cagggaggcc ttgggtccag agaccctgga gcggcttcta gaaaagcagc 2340
agagctggga gcagagcaga gttggacagc tgtgtaggga gccacagctt gctgccaaga 2400
aagcagccct ggtagcaggg gtggtgcgac cagctgctga ggatcttcca gaacctgtgc 2460
caaattgtgc agatgtacga gggacattcc cagcagcctg gtctgcaacc cagattgcag 2520
agatggagct ctcagacttt gaggactgcc tgacattatt tgcaggagac ccaggacttg 2580
ggcctgagga actgcgggca gccatgggca aagcaaaaca gttgtggggt cccccccggg 2640
gatttcgtcc tgagcagatc ctgcagcttg gtaggctctt aataggtcta ggagatcggg 2700
aactacagga gctgatccta gtggactggg gagtgctgag caccctgggg cagatagatg 2760
gctggagcac cactcagctc cgcattgtgg tctccagttt cctacggcag agtggtcggc 2820
atgtgagcca cctggacttc gttcatctga cagcgctggg ttatactctc tgtggactgc 2880
ggccagagga gctccagcac atcagcagtt gggagttcag ccaagcagct ctcttcctcg 2940
gcaccctgca tctccagtgc tctgaggaac aactggaggt tctggcccac ctacttgtac 3000
tgcctggtgg gtttggccca atcagtaact gggggcctga gatcttcact gaaattggca 3060
ccatagcagc tgggatccca gacctggctc tttcagcact gctgcgggga cagatccagg 3120
gcgttactcc tcttgccatt tctgtcatcc ctcctcctaa atttgctgtg gtgtttagtc 3180
ccatccaact atctagtctc accagtgctc aggctgtggc tgtcactcct gagcaaatgg 3240
cctttctgag tcctgagcag cgacgagcag ttgcatgggc ccaacatgag ggaaaggaga 3300
gcccagaaca gcaaggtcga agtacagcct ggggcctcca ggactggtca cgaccttcct 3360
ggtccctggt attgactatc agcttccttg gccacctgct aggctccgga gagggcagag 3420
gaagtctgct aacatgcggt gacgtcgagg agaatcctgg cccaatggag agcgacgaga 3480
gcggcctgcc cgccatggag atcgagtgcc gcatcaccgg caccctgaac ggcgtggagt 3540
tcgagctggt gggcggcgga gagggcaccc ccgagcaggg ccgcatgacc aacaagatga 3600
agagcaccaa aggcgccctg accttcagcc cctacctgct gagccacgtg atgggctacg 3660
gcttctacca cttcggcacc taccccagcg gctacgagaa ccccttcctg cacgccatca 3720
acaacggcgg ctacaccaac acccgcatcg agaagtacga ggacggcggc gtgctgcacg 3780
tgagcttcag ctaccgctac gaggccggcc gcgtgatcgg cgacttcaag gtgatgggca 3840
ccggcttccc cgaggacagc gtgatcttca ccgacaagat catccgcagc aacgccaccg 3900
tggagcacct gcaccccatg ggcgataacg atctggatgg cagcttcacc cgcaccttca 3960
gcctgcgcga cggcggctac tacagctccg tggtggacag ccacatgcac ttcaagagcg 4020
ccatccaccc cagcatcctg cagaacgggg gccccatgtt cgccttccgc cgcgtggagg 4080
aggatcacag caacaccgag ctgggcatcg tggagtacca gcacgccttc aagaccccgg 4140
atgcagatgc cggtgaagaa taagcctgtc tctacagtag aaggagattg tggggagaga 4200
aatcttaagt cataatgaat aaagtgcaaa cagaagtgca tcctgattat tttcagaagc 4260
tgatgaggaa taactagtgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg 4320
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 4380
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 4440
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 4500
atgcggtggg ctctatggaa gcttgaattc agctgacgtg cctcggaccg ctaggaaccc 4560
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 4620
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 4680
agctgcctgc agg 4693
<210> 15
<211> 4619
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-203
<400> 15
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtagactt gcccaaaaac tctggcaaag ttgaattgct 180
tccaaaagtt caactttatc agaaggacct attccctacg gaaactagct gaaggtctcc 240
tggcactctg gatctcgtgg aagggagcct tcttcaggga acagagggag cgattaagtg 300
gtgaaaagca aacagacctg gaaaagttcc ctttctgaga gtagcaacag aaagctctgc 360
aaagactccc tccaagctat tggatcctct tgcttgggat aaccacttga gtactcagat 420
accaaaagaa gagtggaaat cccaagagaa gtcaccagaa aaaacagctt ttaagaaaaa 480
ggatacactt ttgtccctga acgcttgtga aagcaatctg acaatagcag caattgaaaa 540
gggacaaaat aagcccgaaa tagaagtcac ctgggcaaag caaggtagga ctgaaaggct 600
gtgctctcaa aacccaccag tcttgaaacg cactcaacgg gtgactagat cccatatatg 660
gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc 720
cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat 780
tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat 840
catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat 900
gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc 960
gctattacca tggtgatgcg gttttggtga tgcggttttg gcagtacatc aatgggcgtg 1020
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 1080
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 1140
cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 1200
accgtcaccg gtggtgccct gccctcacct ggctatccca cacaggtgag aataaccaga 1260
actcacctcc ggtaccagtg ttcacttggc caccatggct ctcagcctct ggcccctgct 1320
gctgctgctg ctgctgctgc tgctgctgtc ctttgcagtg actctggccc ctactgggcc 1380
tcattccctg gaccctggtc tctccttcct gaagtcattg ctctccactc tggaccaggc 1440
tccccagggc tccctgagcc gctcacggtt ctttacattc ctggccaaca tttcttcttc 1500
ctttgagcct gggagaatgg gggaaggacc agtaggagag cccccacctc tccagccgcc 1560
tgctctgcgg ctccatgatt ttctagtgac actgagaggt agccccgact gggagccaat 1620
gctagggctg ctaggggata tgctggcact gctgggacag gagcagactc cccgagattt 1680
cctggtgcac caggcagggg tgctgggtgg acttgtggag gtgctgctgg gagccttagt 1740
tcctgggggc ccccctaccc caactcggcc cccatgcacc cgtgatgggc cgtctgactg 1800
tgtcctggct gctgactggt tgccttctct gctgctgttg ttagagggca cacgctggca 1860
agctctggtg caggtgcagc ccagtgtgga ccccaccaat gccacaggcc tcgatgggag 1920
ggaggcagct cctcactttt tgcagggtct gttgggtttg cttaccccaa caggggagct 1980
aggctccaag gaggctcttt ggggcggtct gctacgcaca gtgggggccc ccctctatgc 2040
tgcctttcag gaggggctgc tccgtgtcac tcactccttg caggatgagg tcttctccat 2100
tttggggcag ccagagcctg ataccaatgg gcagtgccag ggaggtaacc ttcaacagct 2160
gctcttatgg ggcgtccggc acaacctttc ctgggatgtc caggcgctgg gctttctgtc 2220
tggatcacca cccccacccc ctgccctcct tcactgcctg agcacgggcg tgcctctgcc 2280
cagagcttct cagccgtcag cccacatcag cccacgccaa cggcgagcca tcactgtgga 2340
ggccctctgt gagaaccact taggcccagc accaccctac agcatttcca acttctccat 2400
ccacttgctc tgccagcaca ccaagcctgc cactccacag ccccatccca gcaccactgc 2460
catctgccag acagctgtgt ggtatgcagt gtcctgggca ccaggtgccc aaggctggct 2520
acaggcctgc cacgaccagt ttcctgatga gtttttggat gcgatctgca gtaacctctc 2580
cttttcagcc ctgtctggct ccaaccgccg cctggtgaag cggctctgtg ctggcctgct 2640
cccaccccct accagctgcc ctgaaggcct gccccctgtt cccctcaccc cagacatctt 2700
ttggggctgc ttcttggaga atgagactct gtgggctgag cgactgtgtg gggaggcaag 2760
tctacaggct gtgcccccca gcaaccaggc ttgggtccag catgtgtgcc agggccccac 2820
cccagatgtc actgcctccc caccatgcca cattggaccc tgtggggaac gctgcccgga 2880
tgggggcagc ttcctggtga tggtctgtgc caatgacacc atgtatgagg tcctggtgcc 2940
cttctggcct tggctagcag gccaatgcag gataagtcgt gggggcaatg acacttgctt 3000
cctagaaggg ctgctgggcc cccttctgcc ctctctgcca ccactgggac catccccact 3060
ctgtctgacc cctggcccct tcctccttgg catgctatcc cagttgccac gctgtcagtc 3120
ctctgtccca gctcttgctc accccacacg cctacactat ctcctccgcc tgctgacctt 3180
cctcttgggt ccaggggctg ggggcgctga ggcccagggg atgctgggtc gggccctact 3240
gctctccagt ctcccagaca actgctcctt ctgggatgcc tttcgcccag agggccggcg 3300
cagtgtgcta cggacgattg gggaatacct ggaacaagat gaggagcagc caaccccatc 3360
aggctttgaa cccactgtca accccagctc tggtataagc aagatggagc tgctggcctg 3420
ctttagtcct gtgctgtggg atctgctcca gagggaaaag agtgtttggg ccctgcagat 3480
tctagtgcag gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg 3540
cttgtcgaga cagagaagac tcttgcgttt ctctaggtgg aggccgaaag tacatgtttc 3600
gcatgggaac cccagaccct gagtacccag atgactacag ccaaggtggg accaggctgg 3660
acgggaagaa tctggtgcag gaatggctgg cgaagcgcca gggtgcccgg tatgtgtgga 3720
accgcactga gctcatgcag gcttccctgg acccgtctgt gacccatctc atgggtctct 3780
ttgagcctgg agacatgaaa tacgagatcc accgagactc cacactggac ccctccctga 3840
tggagatgac agaggctgcc ctgcgcctgc tgagcaggaa cccccgcggc ttcttcctct 3900
tcgtggaggg tggtcgcatc gaccatggtc atcatgaaag cagggcttac cgggcactga 3960
ctgagacgat catgttcgac gacgccattg agagggcggg ccagctcacc agcgaggagg 4020
acacgctgag cctcgtcact gccgaccact cccacgtctt ctccttcgga ggctaccccc 4080
tgcgagggag ctccatcttc gggctggccc ctggcaaggc ccgggacagg aaggcctaca 4140
cggtcctcct atacggaaac ggtccaggct atgtgctcaa ggacggcgcc cggccggatg 4200
ttaccgagag cgagagcggg agccccgagt atcggcagca gtcagcagtg cccctggacg 4260
aagagaccca cgcaggcgag gacgtggcgg tgttcgcgcg cggcccgcag gcgcacctgg 4320
ttcacggcgt gcaggagcag accttcatag cgcacgtcat ggccttcgcc gcctgcctgg 4380
agccctacac cgcctgcgac ctggcgcccc ccgccggcac caccgacgcc gcgcacccgg 4440
ggcgaagctt gaattcagct gacgtgcctc ggaccgctag gaacccctag tgatggagtt 4500
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4560
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcagg 4619
<210> 16
<211> 4729
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-204
<400> 16
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtctaggt ggaggccgaa agtacatgtt tcgcatggga 180
accccagacc ctgagtaccc agatgactac agccaaggtg ggaccaggct ggacgggaag 240
aatctggtgc aggaatggct ggcgaagcgc cagggtgccc ggtatgtgtg gaaccgcact 300
gagctcatgc aggcttccct ggacccgtct gtgacccatc tcatgggtct ctttgagcct 360
ggagacatga aatacgagat ccaccgagac tccacactgg acccctccct gatggagatg 420
acagaggctg ccctgcgcct gctgagcagg aacccccgcg gcttcttcct cttcgtggag 480
ggtggtcgca tcgaccatgg tcatcatgaa agcagggctt accgggcact gactgagacg 540
atcatgttcg acgacgccat tgagagggcg ggccagctca ccagcgagga ggacacgctg 600
agcctcgtca ctgccgacca ctcccacgtc ttctccttcg gaggctaccc cctgcgaggg 660
agctccatct tcgggctggc ccctggcaag gcccgggaca ggaaggccta cacggtcctc 720
ctatacggaa acggtccagg ctatgtgctc aaggacggcg cccggccgga tgttaccgag 780
agcgagagcg ggagccccga gtatcggcag cagtcagcag tgcccctgga cgaagagacc 840
cacgcaggcg aggacgtggc ggtgttcgcg cgcggcccgc aggcgcacct ggttcacggc 900
gtgcaggagc agaccttcat agcgcacgtc atggccttcg ccgcctgcct ggagccctac 960
accgcctgcg acctggcgcc ccccgccggc accaccgacg ccgcgcaccc ggggcggata 1020
ggcacctatt ggtcttactg acatccactt tgcctttctc tccacaggcg tacctgcata 1080
tgcccccaga aaacctccag cagctggtgc tttcagcaga gagggaggct gcacagggct 1140
tcctgacact catgctgcag gggaagctgc aggggaagct gcaggtacca ccatccgagg 1200
agcaggccct gggtcgcctg acagccctgc tgctccagcg gtacccacgc ctcacctccc 1260
agctcttcat tgacctgtca ccactcatcc ctttcttggc tgtctctgac ctgatgcgct 1320
tcccaccatc cctgttagcc aacgacagtg tcctggctgc catccgggat tacagcccag 1380
gaatgaggcc tgaacagaag gaggctctgg caaagcgact gctggcccct gaactgtttg 1440
gggaagtgcc tgcctggccc caggagctgc tgtgggcagt gctgcccctg ctcccccacc 1500
tccctctgga gaactttttg cagctcagcc ctcaccagat ccaggccctg gaggatagct 1560
ggccagcagc aggtctgggg ccagggcatg cccgccatgt gctgcgcagc ctggtaaacc 1620
agagtgtcca ggatggtgag gagcaggtac gcaggcttgg gcccctcgcc tgtttcctga 1680
gccctgagga gctgcagagc ctagtgcccc tgagtgatcc aacggggcca gtagaacggg 1740
ggctgctgga atgtgcagcc aatgggaccc tcagcccaga aggacgggtg gcatatgaac 1800
ttctgggtgt gttgcgctca tctggaggag cggtgctgag cccccgggag ctgcgggtct 1860
gggcccctct cttctctcag ctgggcctcc gcttccttca ggagctgtca gagccccagc 1920
ttagagccat gcttcctgtc ctccagggaa ctagtgttac acctgctcag gctgtcctgc 1980
tgcttggacg gctccttcct aggcacgatc tatccctgga ggaactctgc tccttgcacc 2040
ttctgctacc aggcctcagc ccccagacac tccaggccat ccctaggcga gtcctggtcg 2100
gggcttgttc ctgcctggcc cctgaactgt cacgcctctc agcctgccag accgcagcac 2160
tgctgcagac ctttcgggtt aaagatggtg ttaaaaatat gggtacaaca ggtgctggtc 2220
cagctgtgtg tatccctggt cagcctattc ccaccacctg gccagactgc ctgcttcccc 2280
tgctcccatt aaagctgcta caactggatt ccttggctct tctggcaaat cgaagacgct 2340
actgggagct gccctggtct gagcagcagg cacagtttct ctggaagaag atgcaagtac 2400
ccaccaacct taccctcagg aatctgcagg ctctgggcac cctggcagga ggcatgtcct 2460
gtgagtttct gcagcagatc aactccatgg tagacttcct tgaagtggtg cacatgatct 2520
atcagctgcc cactagagtt cgagggagcc tgagggcctg tatctgggca gagctacagc 2580
ggaggatggc aatgccagaa ccagaatgga caactgtagg gccagaactg aacgggctgg 2640
atagcaagct actcctggac ttaccgatcc agttgatgga cagactatcc aatgaatcca 2700
ttatgttggt ggtggagctg gtgcaaagag ctccagagca gctgctggca ctgacccccc 2760
tccaccaggc agccctggca gagagggcac tacaaaacct ggctccaaag gagactccag 2820
tctcagggga agtgctggag accttaggcc ctttggttgg attcctgggg acagagagca 2880
cacgacagat ccccctacag atcctgctgt cccatctcag tcagctgcaa ggcttctgcc 2940
taggagagac atttgccaca gagctgggat ggctgctatt gcaggagtct gttcttggga 3000
aaccagagtt gtggagccag gatgaagtag agcaagctgg acgcctagta ttcactctgt 3060
ctactgaggc aatttccttg atccccaggg aggccttggg tccagagacc ctggagcggc 3120
ttctagaaaa gcagcagagc tgggagcaga gcagagttgg acagctgtgt agggagccac 3180
agcttgctgc caagaaagca gccctggtag caggggtggt gcgaccagct gctgaggatc 3240
ttccagaacc tgtgccaaat tgtgcagatg tacgagggac attcccagca gcctggtctg 3300
caacccagat tgcagagatg gagctctcag actttgagga ctgcctgaca ttatttgcag 3360
gagacccagg acttgggcct gaggaactgc gggcagccat gggcaaagca aaacagttgt 3420
ggggtccccc ccggggattt cgtcctgagc agatcctgca gcttggtagg ctcttaatag 3480
gtctaggaga tcgggaacta caggagctga tcctagtgga ctggggagtg ctgagcaccc 3540
tggggcagat agatggctgg agcaccactc agctccgcat tgtggtctcc agtttcctac 3600
ggcagagtgg tcggcatgtg agccacctgg acttcgttca tctgacagcg ctgggttata 3660
ctctctgtgg actgcggcca gaggagctcc agcacatcag cagttgggag ttcagccaag 3720
cagctctctt cctcggcacc ctgcatctcc agtgctctga ggaacaactg gaggttctgg 3780
cccacctact tgtactgcct ggtgggtttg gcccaatcag taactggggg cctgagatct 3840
tcactgaaat tggcaccata gcagctggga tcccagacct ggctctttca gcactgctgc 3900
ggggacagat ccagggcgtt actcctcttg ccatttctgt catccctcct cctaaatttg 3960
ctgtggtgtt tagtcccatc caactatcta gtctcaccag tgctcaggct gtggctgtca 4020
ctcctgagca aatggccttt ctgagtcctg agcagcgacg agcagttgca tgggcccaac 4080
atgagggaaa ggagagccca gaacagcaag gtcgaagtac agcctggggc ctccaggact 4140
ggtcacgacc ttcctggtcc ctggtattga ctatcagctt ccttggccac ctgctatgag 4200
cctgtctcta cagtagaagg agattgtggg gagagaaatc ttaagtcata atgaataaag 4260
tgcaaacaga agtgcatcct gattattttc agaagctgat gaggaataac tagtgctgat 4320
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 4380
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 4440
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 4500
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggaagctt 4560
gaattcagct gacgtgcctc ggaccgctag gaacccctag tgatggagtt ggccactccc 4620
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4680
tttgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcagg 4729
<210> 17
<211> 4460
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pITR-205
<400> 17
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtgacatt gattattgac tagttattaa tagtaatcaa 180
ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 240
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 300
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggac tatttacggt 360
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 420
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 480
ctacttggca gtacatctac gtattagtca tcgctattac catgggtcga ggtgagcccc 540
acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt gtatttattt 600
attttttaat tattttgtgc agcgatgggg gcgggggggg ggggggcgcg cgccaggcgg 660
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 720
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 780
aaagcgaagc gcgcggcggg cgggagtcgc tgcgttgcct tcgccccgtg ccccgctccg 840
cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg 900
gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac ggctcgtttc 960
ttttctgtgg ctgcgtgaaa gccttaaagg gctccgggag ggccctttgt gcggggggga 1020
gcggctcggg gggtgcgtgc gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct 1080
gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc gcgtgtgcgc 1140
gaggggagcg cggccggggg cggtgccccg cggtgcgggg gggctgcgag gggaacaaag 1200
gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1260
tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1320
gggctccgtg cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1380
ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1440
ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1500
taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1560
gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1620
aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1680
cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1740
ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tcatgccttc 1800
ttctttttcc tacagctcct gggcaacgtg ctggttattg tgaccggtgg tgccctgccc 1860
tcacctggct atcccacaca ggtgagaata accagaactc acctccggta ccagtgttca 1920
cttggccacc atggctctca gcctctggcc cctgctgctg ctgctgctgc tgctgctgct 1980
gctgtccttt gcagtgactc tggcccctac tgggcctcat tccctggacc ctggtctctc 2040
cttcctgaag tcattgctct ccactctgga ccaggctccc cagggctccc tgagccgctc 2100
acggttcttt acattcctgg ccaacatttc ttcttccttt gagcctggga gaatggggga 2160
aggaccagta ggagagcccc cacctctcca gccgcctgct ctgcggctcc atgattttct 2220
agtgacactg agaggtagcc ccgactggga gccaatgcta gggctgctag gggatatgct 2280
ggcactgctg ggacaggagc agactccccg agatttcctg gtgcaccagg caggggtgct 2340
gggtggactt gtggaggtgc tgctgggagc cttagttcct gggggccccc ctaccccaac 2400
tcggccccca tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg actggttgcc 2460
ttctctgctg ctgttgttag agggcacacg ctggcaagct ctggtgcagg tgcagcccag 2520
tgtggacccc accaatgcca caggcctcga tgggagggag gcagctcctc actttttgca 2580
gggtctgttg ggtttgctta ccccaacagg ggagctaggc tccaaggagg ctctttgggg 2640
cggtctgcta cgcacagtgg gggcccccct ctatgctgcc tttcaggagg ggctgctccg 2700
tgtcactcac tccttgcagg atgaggtctt ctccattttg gggcagccag agcctgatac 2760
caatgggcag tgccagggag gtaaccttca acagctgctc ttatggggcg tccggcacaa 2820
cctttcctgg gatgtccagg cgctgggctt tctgtctgga tcaccacccc caccccctgc 2880
cctccttcac tgcctgagca cgggcgtgcc tctgcccaga gcttctcagc cgtcagccca 2940
catcagccca cgccaacggc gagccatcac tgtggaggcc ctctgtgaga accacttagg 3000
cccagcacca ccctacagca tttccaactt ctccatccac ttgctctgcc agcacaccaa 3060
gcctgccact ccacagcccc atcccagcac cactgccatc tgccagacag ctgtgtggta 3120
tgcagtgtcc tgggcaccag gtgcccaagg ctggctacag gcctgccacg accagtttcc 3180
tgatgagttt ttggatgcga tctgcagtaa cctctccttt tcagccctgt ctggctccaa 3240
ccgccgcctg gtgaagcggc tctgtgctgg cctgctccca ccccctacca gctgccctga 3300
aggcctgccc cctgttcccc tcaccccaga catcttttgg ggctgcttct tggagaatga 3360
gactctgtgg gctgagcgac tgtgtgggga ggcaagtcta caggctgtgc cccccagcaa 3420
ccaggcttgg gtccagcatg tgtgccaggg ccccacccca gatgtcactg cctccccacc 3480
atgccacatt ggaccctgtg gggaacgctg cccggatggg ggcagcttcc tggtgatggt 3540
ctgtgccaat gacaccatgt atgaggtcct ggtgcccttc tggccttggc tagcaggcca 3600
atgcaggata agtcgtgggg gcaatgacac ttgcttccta gaagggctgc tgggccccct 3660
tctgccctct ctgccaccac tgggaccatc cccactctgt ctgacccctg gccccttcct 3720
ccttggcatg ctatcccagt tgccacgctg tcagtcctct gtcccagctc ttgctcaccc 3780
cacacgccta cactatctcc tccgcctgct gaccttcctc ttgggtccag gggctggggg 3840
cgctgaggcc caggggatgc tgggtcgggc cctactgctc tccagtctcc cagacaactg 3900
ctccttctgg gatgcctttc gcccagaggg ccggcgcagt gtgctacgga cgattgggga 3960
atacctggaa caagatgagg agcagccaac cccatcaggc tttgaaccca ctgtcaaccc 4020
cagctctggt ataagcaaga tggagctgct ggcctgcttt agtcctgtgc tgtgggatct 4080
gctccagagg gaaaagagtg tttgggccct gcagattcta gtgcaggtaa gtatcaaggt 4140
tacaagacag gtttaaggag accaatagaa actgggcttg tcgagacaga gaagactctt 4200
gcgtttctgg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4260
aatttaacgc gaattttaac aaaataagct tgaattcagc tgacgtgcct cggaccgcta 4320
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4380
cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4440
agcgcgcagc tgcctgcagg 4460
<210> 18
<211> 130
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' ITR
<400> 18
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 19
<211> 1000
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' FVIII填充序列_1000
<400> 19
agacttgccc aaaaactctg gcaaagttga attgcttcca aaagttcaac tttatcagaa 60
ggacctattc cctacggaaa ctagctgaag gtctcctggc actctggatc tcgtggaagg 120
gagccttctt cagggaacag agggagcgat taagtggtga aaagcaaaca gacctggaaa 180
agttcccttt ctgagagtag caacagaaag ctctgcaaag actccctcca agctattgga 240
tcctcttgct tgggataacc acttgagtac tcagatacca aaagaagagt ggaaatccca 300
agagaagtca ccagaaaaaa cagcttttaa gaaaaaggat acacttttgt ccctgaacgc 360
ttgtgaaagc aatctgacaa tagcagcaat tgaaaaggga caaaataagc ccgaaataga 420
agtcacctgg gcaaagcaag gtaggactga aaggctgtgc tctcaaaacc caccagtctt 480
gaaacgcact caacgggtga aagtagtagg aaagggtgaa tttacaaagg acgtaggact 540
caaagagtga gtttttccaa gcagcagaaa cctatttctt actaacttgg ataatttact 600
gaaaaataat acacacaatc aagaaaaaaa aattcaggaa gaaatagaaa agaaggaaaa 660
cttaatccaa gagtgaatag ttttgcctca gataactaca gtgactggca ctaagaattt 720
ctgaaagaac cttttcttac tgagcactag gctgaaaata gaaggttact tgaacgggga 780
cttgactcca gtacttcaag attttaggta ctttgaaaat tcaacaaata gaacaaagaa 840
acacacagct actttctcaa aaaaagggga ggaagaaaac ttggaaggct tgggaaatca 900
aaccaagcaa attgtagaga aattgactga caccacaagg atatctccta atacaagcca 960
gcagaatttt gtcacgcaac gtagtaagag agctttgaaa 1000
<210> 20
<211> 342
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CMV增强子
<400> 20
ctagatccca tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg 60
accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc 120
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 180
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 240
gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat 300
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tg 342
<210> 21
<211> 219
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CMV启动子
<400> 21
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180
tgggaggtct atataagcag agctcgttta gtgaaccgt 219
<210> 22
<211> 276
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CBA启动子
<400> 22
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg 180
gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 240
cggcggccct ataaaaagcg aagcgcgcgg cgggcg 276
<210> 23
<211> 1013
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 嵌合内含子
<400> 23
ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120
ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 180
cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240
gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc 300
gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg gccgggggcg 360
gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt 420
gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc 480
ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg gggcgtggcg 540
cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc 600
cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc gccggcggct 660
gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 720
gacttccttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct 780
ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc 840
ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc tgtccgcggg 900
gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg cgtgtgaccg 960
gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta cag 1013
<210> 24
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' UTR
<400> 24
gccctgccct cacctggcta tcccacacag gtgagaataa ccagaactca cctccggtac 60
cagtgttcac ttg 73
<210> 25
<211> 2196
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' STRC
<400> 25
atggctctca gcctctggcc cctgctgctg ctgctgctgc tgctgctgct gctgtccttt 60
gcagtgactc tggcccctac tgggcctcat tccctggacc ctggtctctc cttcctgaag 120
tcattgctct ccactctgga ccaggctccc cagggctccc tgagccgctc acggttcttt 180
acattcctgg ccaacatttc ttcttccttt gagcctggga gaatggggga aggaccagta 240
ggagagcccc cacctctcca gccgcctgct ctgcggctcc atgattttct agtgacactg 300
agaggtagcc ccgactggga gccaatgcta gggctgctag gggatatgct ggcactgctg 360
ggacaggagc agactccccg agatttcctg gtgcaccagg caggggtgct gggtggactt 420
gtggaggtgc tgctgggagc cttagttcct gggggccccc ctaccccaac tcggccccca 480
tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg actggttgcc ttctctgctg 540
ctgttgttag agggcacacg ctggcaagct ctggtgcagg tgcagcccag tgtggacccc 600
accaatgcca caggcctcga tgggagggag gcagctcctc actttttgca gggtctgttg 660
ggtttgctta ccccaacagg ggagctaggc tccaaggagg ctctttgggg cggtctgcta 720
cgcacagtgg gggcccccct ctatgctgcc tttcaggagg ggctgctccg tgtcactcac 780
tccttgcagg atgaggtctt ctccattttg gggcagccag agcctgatac caatgggcag 840
tgccagggag gtaaccttca acagctgctc ttatggggcg tccggcacaa cctttcctgg 900
gatgtccagg cgctgggctt tctgtctgga tcaccacccc caccccctgc cctccttcac 960
tgcctgagca cgggcgtgcc tctgcccaga gcttctcagc cgtcagccca catcagccca 1020
cgccaacggc gagccatcac tgtggaggcc ctctgtgaga accacttagg cccagcacca 1080
ccctacagca tttccaactt ctccatccac ttgctctgcc agcacaccaa gcctgccact 1140
ccacagcccc atcccagcac cactgccatc tgccagacag ctgtgtggta tgcagtgtcc 1200
tgggcaccag gtgcccaagg ctggctacag gcctgccacg accagtttcc tgatgagttt 1260
ttggatgcga tctgcagtaa cctctccttt tcagccctgt ctggctccaa ccgccgcctg 1320
gtgaagcggc tctgtgctgg cctgctccca ccccctacca gctgccctga aggcctgccc 1380
cctgttcccc tcaccccaga catcttttgg ggctgcttct tggagaatga gactctgtgg 1440
gctgagcgac tgtgtgggga ggcaagtcta caggctgtgc cccccagcaa ccaggcttgg 1500
gtccagcatg tgtgccaggg ccccacccca gatgtcactg cctccccacc atgccacatt 1560
ggaccctgtg gggaacgctg cccggatggg ggcagcttcc tggtgatggt ctgtgccaat 1620
gacaccatgt atgaggtcct ggtgcccttc tggccttggc tagcaggcca atgcaggata 1680
agtcgtgggg gcaatgacac ttgcttccta gaagggctgc tgggccccct tctgccctct 1740
ctgccaccac tgggaccatc cccactctgt ctgacccctg gccccttcct ccttggcatg 1800
ctatcccagt tgccacgctg tcagtcctct gtcccagctc ttgctcaccc cacacgccta 1860
cactatctcc tccgcctgct gaccttcctc ttgggtccag gggctggggg cgctgaggcc 1920
caggggatgc tgggtcgggc cctactgctc tccagtctcc cagacaactg ctccttctgg 1980
gatgcctttc gcccagaggg ccggcgcagt gtgctacgga cgattgggga atacctggaa 2040
caagatgagg agcagccaac cccatcaggc tttgaaccca ctgtcaaccc cagctctggt 2100
ataagcaaga tggagctgct ggcctgcttt agtcctgtgc tgtgggatct gctccagagg 2160
gaaaagagtg tttgggccct gcagattcta gtgcag 2196
<210> 26
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AK序列
<400> 26
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 27
<211> 872
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AP序列
<400> 27
ctaggtggag gccgaaagta catgtttcgc atgggaaccc cagaccctga gtacccagat 60
gactacagcc aaggtgggac caggctggac gggaagaatc tggtgcagga atggctggcg 120
aagcgccagg gtgcccggta tgtgtggaac cgcactgagc tcatgcaggc ttccctggac 180
ccgtctgtga cccatctcat gggtctcttt gagcctggag acatgaaata cgagatccac 240
cgagactcca cactggaccc ctccctgatg gagatgacag aggctgccct gcgcctgctg 300
agcaggaacc cccgcggctt cttcctcttc gtggagggtg gtcgcatcga ccatggtcat 360
catgaaagca gggcttaccg ggcactgact gagacgatca tgttcgacga cgccattgag 420
agggcgggcc agctcaccag cgaggaggac acgctgagcc tcgtcactgc cgaccactcc 480
cacgtcttct ccttcggagg ctaccccctg cgagggagct ccatcttcgg gctggcccct 540
ggcaaggccc gggacaggaa ggcctacacg gtcctcctat acggaaacgg tccaggctat 600
gtgctcaagg acggcgcccg gccggatgtt accgagagcg agagcgggag ccccgagtat 660
cggcagcagt cagcagtgcc cctggacgaa gagacccacg caggcgagga cgtggcggtg 720
ttcgcgcgcg gcccgcaggc gcacctggtt cacggcgtgc aggagcagac cttcatagcg 780
cacgtcatgg ccttcgccgc ctgcctggag ccctacaccg cctgcgacct ggcgcccccc 840
gccggcacca ccgacgccgc gcacccgggg cg 872
<210> 28
<211> 3129
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3' STRC
<400> 28
gcgtacctgc atatgccccc agaaaacctc cagcagctgg tgctttcagc agagagggag 60
gctgcacagg gcttcctgac actcatgctg caggggaagc tgcaggggaa gctgcaggta 120
ccaccatccg aggagcaggc cctgggtcgc ctgacagccc tgctgctcca gcggtaccca 180
cgcctcacct cccagctctt cattgacctg tcaccactca tccctttctt ggctgtctct 240
gacctgatgc gcttcccacc atccctgtta gccaacgaca gtgtcctggc tgccatccgg 300
gattacagcc caggaatgag gcctgaacag aaggaggctc tggcaaagcg actgctggcc 360
cctgaactgt ttggggaagt gcctgcctgg ccccaggagc tgctgtgggc agtgctgccc 420
ctgctccccc acctccctct ggagaacttt ttgcagctca gccctcacca gatccaggcc 480
ctggaggata gctggccagc agcaggtctg gggccagggc atgcccgcca tgtgctgcgc 540
agcctggtaa accagagtgt ccaggatggt gaggagcagg tacgcaggct tgggcccctc 600
gcctgtttcc tgagccctga ggagctgcag agcctagtgc ccctgagtga tccaacgggg 660
ccagtagaac gggggctgct ggaatgtgca gccaatggga ccctcagccc agaaggacgg 720
gtggcatatg aacttctggg tgtgttgcgc tcatctggag gagcggtgct gagcccccgg 780
gagctgcggg tctgggcccc tctcttctct cagctgggcc tccgcttcct tcaggagctg 840
tcagagcccc agcttagagc catgcttcct gtcctccagg gaactagtgt tacacctgct 900
caggctgtcc tgctgcttgg acggctcctt cctaggcacg atctatccct ggaggaactc 960
tgctccttgc accttctgct accaggcctc agcccccaga cactccaggc catccctagg 1020
cgagtcctgg tcggggcttg ttcctgcctg gcccctgaac tgtcacgcct ctcagcctgc 1080
cagaccgcag cactgctgca gacctttcgg gttaaagatg gtgttaaaaa tatgggtaca 1140
acaggtgctg gtccagctgt gtgtatccct ggtcagccta ttcccaccac ctggccagac 1200
tgcctgcttc ccctgctccc attaaagctg ctacaactgg attccttggc tcttctggca 1260
aatcgaagac gctactggga gctgccctgg tctgagcagc aggcacagtt tctctggaag 1320
aagatgcaag tacccaccaa ccttaccctc aggaatctgc aggctctggg caccctggca 1380
ggaggcatgt cctgtgagtt tctgcagcag atcaactcca tggtagactt ccttgaagtg 1440
gtgcacatga tctatcagct gcccactaga gttcgaggga gcctgagggc ctgtatctgg 1500
gcagagctac agcggaggat ggcaatgcca gaaccagaat ggacaactgt agggccagaa 1560
ctgaacgggc tggatagcaa gctactcctg gacttaccga tccagttgat ggacagacta 1620
tccaatgaat ccattatgtt ggtggtggag ctggtgcaaa gagctccaga gcagctgctg 1680
gcactgaccc ccctccacca ggcagccctg gcagagaggg cactacaaaa cctggctcca 1740
aaggagactc cagtctcagg ggaagtgctg gagaccttag gccctttggt tggattcctg 1800
gggacagaga gcacacgaca gatcccccta cagatcctgc tgtcccatct cagtcagctg 1860
caaggcttct gcctaggaga gacatttgcc acagagctgg gatggctgct attgcaggag 1920
tctgttcttg ggaaaccaga gttgtggagc caggatgaag tagagcaagc tggacgccta 1980
gtattcactc tgtctactga ggcaatttcc ttgatcccca gggaggcctt gggtccagag 2040
accctggagc ggcttctaga aaagcagcag agctgggagc agagcagagt tggacagctg 2100
tgtagggagc cacagcttgc tgccaagaaa gcagccctgg tagcaggggt ggtgcgacca 2160
gctgctgagg atcttccaga acctgtgcca aattgtgcag atgtacgagg gacattccca 2220
gcagcctggt ctgcaaccca gattgcagag atggagctct cagactttga ggactgcctg 2280
acattatttg caggagaccc aggacttggg cctgaggaac tgcgggcagc catgggcaaa 2340
gcaaaacagt tgtggggtcc cccccgggga tttcgtcctg agcagatcct gcagcttggt 2400
aggctcttaa taggtctagg agatcgggaa ctacaggagc tgatcctagt ggactgggga 2460
gtgctgagca ccctggggca gatagatggc tggagcacca ctcagctccg cattgtggtc 2520
tccagtttcc tacggcagag tggtcggcat gtgagccacc tggacttcgt tcatctgaca 2580
gcgctgggtt atactctctg tggactgcgg ccagaggagc tccagcacat cagcagttgg 2640
gagttcagcc aagcagctct cttcctcggc accctgcatc tccagtgctc tgaggaacaa 2700
ctggaggttc tggcccacct acttgtactg cctggtgggt ttggcccaat cagtaactgg 2760
gggcctgaga tcttcactga aattggcacc atagcagctg ggatcccaga cctggctctt 2820
tcagcactgc tgcggggaca gatccagggc gttactcctc ttgccatttc tgtcatccct 2880
cctcctaaat ttgctgtggt gtttagtccc atccaactat ctagtctcac cagtgctcag 2940
gctgtggctg tcactcctga gcaaatggcc tttctgagtc ctgagcagcg acgagcagtt 3000
gcatgggccc aacatgaggg aaaggagagc ccagaacagc aaggtcgaag tacagcctgg 3060
ggcctccagg actggtcacg accttcctgg tccctggtat tgactatcag cttccttggc 3120
cacctgcta 3129
<210> 29
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> T2A序列
<400> 29
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg ccca 54
<210> 30
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> T2A序列
<400> 30
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 31
<211> 696
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> tGFP
<400> 31
atggagagcg acgagagcgg cctgcccgcc atggagatcg agtgccgcat caccggcacc 60
ctgaacggcg tggagttcga gctggtgggc ggcggagagg gcacccccga gcagggccgc 120
atgaccaaca agatgaagag caccaaaggc gccctgacct tcagccccta cctgctgagc 180
cacgtgatgg gctacggctt ctaccacttc ggcacctacc ccagcggcta cgagaacccc 240
ttcctgcacg ccatcaacaa cggcggctac accaacaccc gcatcgagaa gtacgaggac 300
ggcggcgtgc tgcacgtgag cttcagctac cgctacgagg ccggccgcgt gatcggcgac 360
ttcaaggtga tgggcaccgg cttccccgag gacagcgtga tcttcaccga caagatcatc 420
cgcagcaacg ccaccgtgga gcacctgcac cccatgggcg ataacgatct ggatggcagc 480
ttcacccgca ccttcagcct gcgcgacggc ggctactaca gctccgtggt ggacagccac 540
atgcacttca agagcgccat ccaccccagc atcctgcaga acgggggccc catgttcgcc 600
ttccgccgcg tggaggagga tcacagcaac accgagctgg gcatcgtgga gtaccagcac 660
gccttcaaga ccccggatgc agatgccggt gaagaa 696
<210> 32
<211> 232
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> tGFP
<400> 32
Met Glu Ser Asp Glu Ser Gly Leu Pro Ala Met Glu Ile Glu Cys Arg
1 5 10 15
Ile Thr Gly Thr Leu Asn Gly Val Glu Phe Glu Leu Val Gly Gly Gly
20 25 30
Glu Gly Thr Pro Glu Gln Gly Arg Met Thr Asn Lys Met Lys Ser Thr
35 40 45
Lys Gly Ala Leu Thr Phe Ser Pro Tyr Leu Leu Ser His Val Met Gly
50 55 60
Tyr Gly Phe Tyr His Phe Gly Thr Tyr Pro Ser Gly Tyr Glu Asn Pro
65 70 75 80
Phe Leu His Ala Ile Asn Asn Gly Gly Tyr Thr Asn Thr Arg Ile Glu
85 90 95
Lys Tyr Glu Asp Gly Gly Val Leu His Val Ser Phe Ser Tyr Arg Tyr
100 105 110
Glu Ala Gly Arg Val Ile Gly Asp Phe Lys Val Met Gly Thr Gly Phe
115 120 125
Pro Glu Asp Ser Val Ile Phe Thr Asp Lys Ile Ile Arg Ser Asn Ala
130 135 140
Thr Val Glu His Leu His Pro Met Gly Asp Asn Asp Leu Asp Gly Ser
145 150 155 160
Phe Thr Arg Thr Phe Ser Leu Arg Asp Gly Gly Tyr Tyr Ser Ser Val
165 170 175
Val Asp Ser His Met His Phe Lys Ser Ala Ile His Pro Ser Ile Leu
180 185 190
Gln Asn Gly Gly Pro Met Phe Ala Phe Arg Arg Val Glu Glu Asp His
195 200 205
Ser Asn Thr Glu Leu Gly Ile Val Glu Tyr Gln His Ala Phe Lys Thr
210 215 220
Pro Asp Ala Asp Ala Gly Glu Glu
225 230
<210> 33
<211> 109
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3' UTR
<400> 33
gcctgtctct acagtagaag gagattgtgg ggagagaaat cttaagtcat aatgaataaa 60
gtgcaaacag aagtgcatcc tgattatttt cagaagctga tgaggaata 109
<210> 34
<211> 240
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> bGHpA
<400> 34
gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 60
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 120
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 180
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 240
<210> 35
<211> 500
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3' FVIII填充序列
<400> 35
caattcagac tcccactaga agaaacagaa cttgaaaaaa ggataattgt ggtgaacacc 60
tcaacccagt ggtccaaaaa ctgaaaaact ttgaccccga gcaccctcac acagatagac 120
tactgaaaga aggagaaagg ggcacttact cagtctccct tatcagattg ccttacgagg 180
agtactagac tccctcaagc aaatagatct cacttaccac ttgcaaaggt atactacttt 240
cactctatta gacctatata tctgaccagg gtcctattcc aagacaactc ttctactctt 300
ccagcagact cttatagaaa gaaagattct ggggtccaag aaagcagtac tttcttacaa 360
ggagccaaaa aaaataacct ttctttagca cttctaacct tggagtgaac tggtgatcaa 420
agagaggttg gctccctggg gacaagtgcc acaaattcag tcaactacaa gaaagttgag 480
aacactgttc tcccgaaacc 500
<210> 36
<211> 141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3' ITR
<400> 36
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141
<210> 37
<211> 500
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5' FVIII填充序列_500
<400> 37
agacttgccc aaaaactctg gcaaagttga attgcttcca aaagttcaac tttatcagaa 60
ggacctattc cctacggaaa ctagctgaag gtctcctggc actctggatc tcgtggaagg 120
gagccttctt cagggaacag agggagcgat taagtggtga aaagcaaaca gacctggaaa 180
agttcccttt ctgagagtag caacagaaag ctctgcaaag actccctcca agctattgga 240
tcctcttgct tgggataacc acttgagtac tcagatacca aaagaagagt ggaaatccca 300
agagaagtca ccagaaaaaa cagcttttaa gaaaaaggat acacttttgt ccctgaacgc 360
ttgtgaaagc aatctgacaa tagcagcaat tgaaaaggga caaaataagc ccgaaataga 420
agtcacctgg gcaaagcaag gtaggactga aaggctgtgc tctcaaaacc caccagtctt 480
gaaacgcact caacgggtga 500
<210> 38
<211> 17
<212> DNA
<213> 黑猩猩(Pan troglodytes)
<400> 38
aaataaaata cgaaatg 17

Claims (66)

1.一种组合物,所述组合物包含至少两种不同核酸载体,其中:
所述至少两种不同载体中的每一者包含编码硬纤毛蛋白的不同部分的编码序列,所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列可任选地与所编码部分中的不同者的氨基酸序列部分重叠;
所述至少两种不同载体中没有单一载体编码全长硬纤毛蛋白;
所述编码序列中的至少一者包含跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列;并且
当引入哺乳动物细胞中时,所述至少两种不同载体经受彼此同源性重组,由此形成编码全长硬纤毛蛋白的重组核酸。
2.如权利要求1所述的组合物,其中所述至少两种不同载体中的每一者是质粒、转座子、粘粒、人工染色体或病毒载体。
3.如权利要求1所述的组合物,其中所述至少两种不同载体中的每一者是人类人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)、或P1源性人工染色体(PAC)。
4.如权利要求1所述的组合物,其中所述至少两种不同载体中的每一者是选自腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体的病毒载体。
5.如权利要求4所述的组合物,其中所述病毒载体是AAV载体。
6.如权利要求1-5中任一项所述的组合物,其中所编码部分中没有一者的氨基酸序列与所编码部分中的不同者的氨基酸序列重叠。
7.如权利要求7所述的组合物,其中所编码部分中的每一者的氨基酸序列与所编码部分中的不同者的氨基酸序列部分重叠。
8.如权利要求7所述的组合物,其中重叠氨基酸序列的长度在约30个氨基酸残基至约1000个氨基酸残基之间。
9.如权利要求1-5中任一项所述的组合物,其中所述载体包括两种不同载体,其中每一者包含内含子的不同区段,其中所述内含子包含存在于硬纤毛蛋白基因组DNA中的内含子的核苷酸序列,并且其中两个不同区段在序列方面重叠至少100个核苷酸。
10.如权利要求9所述的组合物,其中两个不同区段在序列方面重叠约100个核苷酸至约800个核苷酸。
11.如权利要求1-10中任一项所述的组合物,其中所述至少两种不同载体中的每一者的核苷酸序列的长度在约500个核苷酸至约10,000个核苷酸之间。
12.如权利要求11所述的组合物,其中所述至少两种不同载体中的每一者的核苷酸序列的长度在500个核苷酸至5,000个核苷酸之间。
13.如权利要求1-12中任一项所述的组合物,其中所述组合物中不同载体的种数是两种。
14.如权利要求13所述的组合物,其中所述两种不同载体中的第一载体包含编码所述硬纤毛蛋白的N末端部分的编码序列。
15.如权利要求14所述的组合物,其中所述硬纤毛蛋白的所述N末端部分的长度在30个氨基酸至1600个氨基酸之间。
16.如权利要求15所述的组合物,其中所述硬纤毛蛋白的所述N末端部分的长度在200个氨基酸至1500个氨基酸之间。
17.如权利要求14-16中任一项所述的组合物,其中所述第一载体还包含启动子和Kozak序列中的一者或两者。
18.如权利要求17所述的组合物,其中所述第一载体包含是诱导型启动子、组成型启动子、或组织特异性启动子的启动子。
19.如权利要求14-18中任一项所述的组合物,其中所述两种不同载体中的第二者包含编码所述硬纤毛蛋白的C末端部分的编码序列。
20.如权利要求19所述的组合物,其中所述硬纤毛蛋白的所述C末端部分的长度在30个氨基酸至1600个氨基酸之间。
21.如权利要求20所述的组合物,其中所述硬纤毛蛋白的所述C末端部分的长度在200个氨基酸至1500个氨基酸之间。
22.如权利要求19-21中任一项所述的组合物,其中所述第二载体还包含多聚(dA)序列。
23.如权利要求1-22中任一项所述的组合物,所述组合物还包含药学上可接受的赋形剂。
24.一种药盒,所述药盒包括权利要求1-23中任一项所述的组合物。
25.如权利要求24所述的药盒,所述药盒还包括包含所述组合物的预装载注射器。
26.一种方法,所述方法包括:
向哺乳动物的耳蜗中引入治疗有效量的权利要求1-23中任一项所述的组合物。
27.如权利要求26所述的方法,其中所述哺乳动物是人。
28.如权利要求26或27所述的方法,其中所述哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
29.一种使哺乳动物细胞中全长硬纤毛蛋白的表达增加的方法,所述方法包括将权利要求1-23中任一项所述的组合物引入所述哺乳动物细胞中。
30.如权利要求29所述的方法,其中所述哺乳动物细胞是耳蜗外毛细胞。
31.如权利要求29或30所述的方法,其中所述哺乳动物细胞是人细胞。
32.如权利要求29-31中任一项所述的方法,其中所述哺乳动物细胞先前已被确定为具有缺陷性硬纤毛蛋白基因。
33.一种使哺乳动物的耳蜗中的外毛细胞中的全长硬纤毛蛋白的表达增加的方法,所述方法包括:
向所述哺乳动物的所述耳蜗中引入治疗有效量的权利要求1-23中任一项所述的组合物。
34.如权利要求33所述的方法,其中所述哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
35.如权利要求33或34所述的方法,其中所述哺乳动物是人。
36.一种治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者的非症状性感觉神经性听力损失的方法,所述方法包括:
向所述受试者的耳蜗中施用治疗有效量的权利要求1-23中任一项所述的组合物。
37.如权利要求36所述的方法,其中所述受试者是人。
38.如权利要求36或37所述的方法,所述方法还包括在施用步骤之前确定所述受试者具有缺陷性硬纤毛蛋白基因。
39.一种组合物,所述组合物包含两种不同核酸载体,其中:
所述两种不同核酸载体中的第一核酸载体包含启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、以及位于所述第一编码序列的3’末端的剪接供体信号序列;并且
所述两种不同核酸载体中的第二核酸载体包含剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及在所述第二编码序列的3’末端的多腺苷酸化序列;
其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且
当引入哺乳动物细胞中时,在所述剪接供体信号序列与所述剪接接受体信号序列之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。
40.如权利要求39所述的组合物,其中所述编码序列中的至少一者包含跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。
41.一种组合物,所述组合物包含两种不同核酸载体,其中:
所述两种不同核酸载体中的第一核酸载体包含启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的第一可检测标记基因;并且
所述两种不同核酸载体中的第二核酸载体包含第二可检测标记基因、位于所述第二可检测标记基因的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及位于所述第二编码序列的3’末端的多腺苷酸化序列;
其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且
当引入哺乳动物细胞中时,在所述剪接供体信号与所述剪接接受体信号之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。
42.如权利要求41所述的组合物,其中所述编码序列中的至少一者包含跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。
43.如权利要求42所述的组合物,其中所述第一可检测标记基因或所述第二可检测标记基因是碱性磷酸酶。
44.如权利要求41或43所述的组合物,其中所述第一可检测标记基因和所述第二可检测标记基因是相同的。
45.一种组合物,所述组合物包含两种不同核酸载体,其中:
所述两种不同核酸载体中的第一核酸载体包含启动子、位于所述启动子的3’的编码硬纤毛蛋白的N末端部分的第一编码序列、位于所述第一编码序列的3’末端的剪接供体信号序列、以及位于所述剪接供体信号序列的3’的F1噬菌体致重组区域;并且
所述两种不同核酸载体中的第二核酸载体包含F1噬菌体致重组区域、位于所述F1噬菌体致重组区域的3’的剪接接受体信号序列、位于所述剪接接受体信号序列的3’末端的编码硬纤毛蛋白的C末端部分的第二编码序列、以及位于所述第二编码序列的3’末端的多腺苷酸化序列;
其中所编码部分中的每一者的长度是至少30个氨基酸残基,其中所编码部分中的每一者的氨基酸序列不重叠;其中所述两种不同载体中没有单一载体编码全长硬纤毛蛋白;并且
当引入哺乳动物细胞中时,在所述剪接供体信号与所述剪接接受体信号之间发生剪接,由此形成编码全长硬纤毛蛋白的重组核酸。
46.如权利要求45所述的组合物,其中所述编码序列中的至少一者包含跨越硬纤毛蛋白基因组DNA的两个连续外显子的核苷酸序列,并且缺乏所述两个连续外显子之间的内含子序列。
47.一种组合物,所述组合物包含:
Cas9核酸酶;
引导RNA,所述引导RNA在其5’末端包括由互补于SEQ ID NO:5的位置13955-14151内的20个连续核苷酸的20个核苷酸组成的互补性区域,所述引导RNA能够在CRISPR/Cas9 RNA引导的基因组编辑中用于在SEQ ID NO:5的内源性硬纤毛蛋白假基因序列中的预定位点处移除无义突变;并且
当引入哺乳动物细胞中时,编码全长硬纤毛蛋白的核酸在所述硬纤毛蛋白假基因的基因座处得以重构。
48.一种包含至少一种核酸载体的组合物,其中所述至少一种核酸载体包括腺相关病毒(AAV)载体,所述腺相关病毒载体包含至少80%互补于SEQ ID NO:5的在位置13955-14151处的连续核苷酸序列的反义寡核苷酸,
其中所述反义寡核苷酸的长度在15-30个核苷酸之间;并且
当引入哺乳动物细胞中时,在硬纤毛蛋白假基因的基因座处产生编码全长硬纤毛蛋白的核酸。
49.一种药盒,所述药盒包括权利要求39-48中任一项所述的组合物。
50.如权利要求49所述的药盒,所述药盒还包括包含所述组合物的预装载注射器。
51.一种方法,所述方法包括:
向哺乳动物的耳蜗中引入治疗有效量的权利要求39-48中任一项所述的组合物。
52.如权利要求51所述的方法,其中所述哺乳动物是人。
53.如权利要求51或52所述的方法,其中所述哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
54.一种使哺乳动物细胞中全长硬纤毛蛋白的表达增加的方法,所述方法包括将权利要求39-48中任一项所述的组合物引入所述哺乳动物细胞中。
55.如权利要求54所述的方法,其中所述哺乳动物细胞是耳蜗外毛细胞。
56.如权利要求54或55所述的方法,其中所述哺乳动物细胞是人细胞。
57.如权利要求54-56中任一项所述的方法,其中所述哺乳动物细胞先前已被确定为具有缺陷性硬纤毛蛋白基因。
58.一种使哺乳动物的耳蜗中的外毛细胞中的全长硬纤毛蛋白的表达增加的方法,所述方法包括:
向所述哺乳动物的所述耳蜗中引入治疗有效量的权利要求39-48中任一项所述的组合物。
59.如权利要求58所述的方法,其中所述哺乳动物先前已被鉴定为具有缺陷性硬纤毛蛋白基因。
60.如权利要求58或59所述的方法,其中所述哺乳动物是人。
61.一种治疗被鉴定为具有缺陷性硬纤毛蛋白基因的受试者的非症状性感觉神经性听力损失的方法,所述方法包括:
向所述受试者的耳蜗中施用治疗有效量的权利要求39-48中任一项所述的组合物。
62.如权利要求61所述的方法,其中所述受试者是人。
63.如权利要求61或62所述的方法,所述方法还包括在施用步骤之前确定所述受试者具有缺陷性硬纤毛蛋白基因。
64.如权利要求13所述的组合物,其中所述两种载体中的一者包含SEQ ID NO:13,并且所述两种载体中的第二者包含SEQ ID NO:17。
65.如权利要求1所述的组合物,其中所述至少两种不同载体中的一者包含编码硬纤毛蛋白的序列。
66.如权利要求65所述的组合物,其中编码硬纤毛蛋白的所述序列与SEQ ID NO:11具有至少90%同一性。
CN201980057626.7A 2018-07-13 2019-07-12 治疗非综合征性感觉神经性听力损失的方法 Pending CN112639108A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862697652P 2018-07-13 2018-07-13
US62/697,652 2018-07-13
PCT/US2019/041625 WO2020014625A1 (en) 2018-07-13 2019-07-12 Methods of treating non-syndromic sensorineural hearing loss

Publications (1)

Publication Number Publication Date
CN112639108A true CN112639108A (zh) 2021-04-09

Family

ID=69142651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980057626.7A Pending CN112639108A (zh) 2018-07-13 2019-07-12 治疗非综合征性感觉神经性听力损失的方法

Country Status (7)

Country Link
US (1) US20210330814A1 (zh)
EP (1) EP3821019A4 (zh)
JP (1) JP2021530227A (zh)
CN (1) CN112639108A (zh)
AU (1) AU2019300045A1 (zh)
CA (1) CA3106261A1 (zh)
WO (1) WO2020014625A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022026516A1 (en) * 2020-07-29 2022-02-03 The Board Of Regents Of The University Of Texas System Transgene cassettes, aav vectors, and aav viral vectors for expression of human codon-optimized cstb
CN117750983A (zh) * 2021-05-05 2024-03-22 分贝治疗公司 用于使用硬纤毛蛋白双重载体***治疗感觉神经性听力损失的组合物和方法
WO2022241302A2 (en) * 2021-05-14 2022-11-17 Rescue Hearing Inc. Gene therapy constructs and methods for treatment of hearing loss
AU2022364798A1 (en) * 2021-10-12 2024-05-02 Decibel Therapeutics, Inc. Stereocilin promoters and uses thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018039375A1 (en) * 2016-08-23 2018-03-01 Akouos, Inc. Compositions and methods for treating non-age-associated hearing impairment in a human subject

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014255665B2 (en) * 2013-04-18 2018-08-02 Fondazione Telethon Effective delivery of large genes by dual AAV vectors
WO2015048577A2 (en) * 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
CN116236591A (zh) * 2015-12-11 2023-06-09 马萨诸塞眼科耳科诊所 用于将核酸递送至耳蜗和前庭细胞的材料和方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018039375A1 (en) * 2016-08-23 2018-03-01 Akouos, Inc. Compositions and methods for treating non-age-associated hearing impairment in a human subject

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FRANCEY, L.J. ET AL.: "Homo sapiens stereocilin(STRC), mRNA,NM_153700.2", GENBANK DATABASE *

Also Published As

Publication number Publication date
EP3821019A4 (en) 2022-10-05
EP3821019A1 (en) 2021-05-19
WO2020014625A1 (en) 2020-01-16
US20210330814A1 (en) 2021-10-28
JP2021530227A (ja) 2021-11-11
CA3106261A1 (en) 2020-01-16
AU2019300045A1 (en) 2021-01-07

Similar Documents

Publication Publication Date Title
RU2759335C2 (ru) Генное редактирование глубоких интронных мутаций
KR20200044793A (ko) Aav의 전달을 위한 조성물 및 방법
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
KR20210102882A (ko) 핵산 구조체 및 사용 방법
JP2021513863A (ja) ヒト対象において非加齢性聴力障害を治療するための組成物及び方法
KR20210068068A (ko) 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법
KR20210133993A (ko) Rho-연관 상염색체-우성 망막색소변성증(adrp)을 치료하기 위한 crispr/rna-가이드 뉴클레아제-관련 방법 및 조성물
KR20220066225A (ko) 선택적 유전자 조절을 위한 조성물 및 방법
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략
KR20220112262A (ko) Nadh 탈수소효소 단백질을 이용한 레버 유전성 시신경병증 치료용 조성물 및 방법
KR20210049833A (ko) Mma의 치료를 위한 비-붕괴적 유전자 요법
KR20200127170A (ko) Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
KR20230003477A (ko) 비-바이러스성 dna 벡터 및 인자 ix 치료제 발현을 위한 이의 용도
CN116685329A (zh) 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途
KR20230023641A (ko) Gjb2-연관 난청을 치료하기 위한 조성물 및 방법
JP2023153320A (ja) Clrn1に関連する聴力喪失及び/または視力喪失を治療する方法
KR20220007601A (ko) 치료제 투여를 위한 조성물 및 방법
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
KR20230003478A (ko) 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도
KR20230041965A (ko) Slc26a4-연관 청력손실을 치료하기 위한 조성물 및 방법
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
RU2811724C2 (ru) РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
EA046157B1 (ru) Композиции и способы селективной регуляции экспрессии генов
KR20230066453A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: E.J. Simmons

Inventor after: R.Huang

Inventor before: E.J. Simmons

Inventor before: Enge Ryan