CN115698332A - 在单细胞水平上评估载体转导效率和/或特异性的方法 - Google Patents

在单细胞水平上评估载体转导效率和/或特异性的方法 Download PDF

Info

Publication number
CN115698332A
CN115698332A CN202180042704.3A CN202180042704A CN115698332A CN 115698332 A CN115698332 A CN 115698332A CN 202180042704 A CN202180042704 A CN 202180042704A CN 115698332 A CN115698332 A CN 115698332A
Authority
CN
China
Prior art keywords
aav
cells
vector
sequence
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180042704.3A
Other languages
English (en)
Inventor
赵伟良
龚重达
郭柯
林圣�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN115698332A publication Critical patent/CN115698332A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了一种在单细胞水平上评估载体的转导效率和/或特异性的方法,该方法包括:提供多个不同的载体;用该多个不同的载体转导异质细胞群;将该异质细胞群分隔成多个区室,其中每个区室包含来自该异质细胞群的单细胞;对每个分隔的细胞进行核苷酸测序;以及在每个分隔的细胞中检测该不同的载体中的任一者或多者的存在。具体地,该多种不同的载体中的每一者包含一寡核苷酸条形码序列或标记物多核苷酸,其中任意两种不同的载体之间的所述条形码序列或所述标记物多核苷酸不同。在一个具体的实施方案中,所述载体是腺相关病毒(AAV)载体。

Description

在单细胞水平上评估载体转导效率和/或特异性的方法
相关申请的交叉引用
本申请要求于2020年6月12日提交的新加坡专利申请第10202005599R号的优先权的权益,出于所有目的,其内容通过引用方式整体并入本文。
技术领域
本发明大体上涉及分子生物学和基因组学。具体地,本发明涉及一种评估载体转导的方法。
背景技术
自发现允许对细胞进行基因修饰的方法以来,基因治疗一直被认为是最有前景的疾病治疗模式之一。基因治疗涉及改变受试者细胞中的基因,通常是缺陷或异常基因,以治疗或预防疾病。这通常通过将正常基因引入细胞中来完成。正常基因的引入可通过使用递送载体来完成,其中递送载体的转导效率和转导特异性是提高基因治疗成功率的重要特征。
尽管不同的基因治疗方法已被广泛研究,但目前在针对高通量研究或筛选递送载体(诸如天然存在的或重组的腺相关病毒(AAV)血清型)文库或组以评估这些载体中的每一种载体递送至单个细胞类型的效率和特异性或嗜性(tropism)的技术方面仍存在缺口。当细胞组合物是包含(例如人组织中或人体的多个器官内的)许多不同细胞类型的异质组合物时,这就变得更加不切实际或更加不可能。
鉴于上述情况,由于器官和组织通常是异质的,并且感染效率在器官/组织内的生态位(niche)之间可能会有显著的差异,因此需要提供一种以更高分辨率,例如在单细胞水平上评估病毒载体的转导效率和/或转导特异性的方法。
发明内容
在一个方面,提供了一种在单细胞水平上评估载体的转导效率和/或特异性的方法,该方法包括:
a)提供多个不同的载体;
b)用该多个不同的载体转导异质细胞群;
c)将该异质细胞群分隔成多个区室,其中每个区室包含来自该异质细胞群的单细胞;
d)对每个分隔的细胞进行核苷酸测序;
e)在每个分隔的细胞中检测该不同的载体中的任一者或多者的存在。
附图说明
当结合非限制性实例和附图考虑时,通过参考具体实施方式将更好地理解本发明。
图1是本公开的示例性示意图:(A)腺相关病毒(AAV)变体的第一示例,其中腺相关病毒(AAV)血清型变体各自包装有唯一可识别的基因组,每个基因组含有唯一的核苷酸条形码。(B)腺相关病毒(AAV)变体的第二示例,其中各自含有唯一的衣壳编码核苷酸序列的基因组位于两侧腺相关病毒(AAV)反向末端重复序列(ITR)之间。(C)腺相关病毒(AAV)变体的第三示例,其中各自在两侧AAV ITR之间含有唯一的衣壳编码核苷酸序列的基因组基于AAV生物学中已知的衣壳:基因型连锁(也称为基因组:表型连锁)进行多重包装。(D)来自(A)至(C)中任一者的AAV变体的由多个衣壳血清型组成的文库,每种衣壳血清型可通过其被包封的且唯一可区分的核苷酸序列来鉴定。(E)将AAV变体的文库转导到异质细胞群(例如器官、组织、类器官、混合物)中。(F)在单细胞测序中,将每个细胞内的核酸(其可包括RNA、DNA)加上唯一的细胞特异性单细胞测序核苷酸标签,然后进行测序。每个细胞通过其RNA转录组和/或DNA基因组来鉴定。由于位于每个细胞内的AAV基因组的子集都加上了细胞特异性单细胞测序核苷酸标签,因此它们可通过不同方法鉴定。例如,转导到每个细胞中的来自(A)的AAV变体的子集通过短读测序或长读测序以它们的唯一的条形码鉴定。转导到每个细胞中的来自(B)或(C)的AAV变体的子集通过使用长读测序诸如纳米孔测序或单分子测序,经由唯一的衣壳编码核苷酸序列鉴定。(G)由特定AAV血清型转导的细胞身份的矩阵可经由细胞特异性单细胞测序核苷酸标签通过使AAV变体与它们各自的转导细胞进行匹配来建立。
图2A示出了培养6周的发育中的人脑和眼类器官的总体形态的低放大倍数明视野图像。类器官包括眼类器官(白色实心箭头)和实体脑类器官(白色虚线箭头)的流体填充腔。图2B示出了用于细胞类型表征的细胞标记物染色的眼类器官的组织学切片的图像。S100β—神经嵴和发育的眼;PAX6—眼上皮或内皮细胞;CHX10—感觉视网膜的规范和形态发生;RAX—发育中的眼和视网膜细胞的初始规范;CD31—施莱姆管内皮;aSMA-小梁网和基质;DAPI(49,6-二脒基-2-苯基吲哚)细胞核染色;Neg—阴性对照。图2C示出了用于细胞类型表征的细胞标记物染色的脑类器官切片的组织学切片的图像。MAP2—所有神经细胞中呈阳性;NeuN—神经元标记物;S100β—检测脑蛋白并在神经元细胞中表达;DAPI—细胞核染色。因此,图2说明了眼类器官和脑类器官的培养和表征。
图3A示出了用AAV血清型库感染的脑类器官和眼类器官的总体形态的低放大倍数显微图像,通过在大部分区域内的细胞中的GFP阳性信号鉴定。使用表达eGFP的条形码化GFP-AAV-库(1×1010载体基因组(vg)/血清型)转导脑类器官和眼类器官7天。空白表示未转导的类器官的阴性对照。图3B示出了AAV感染的眼类器官的横切面图像,其中AAV感染通过不同类器官区域中的GFP表达来鉴定。图插标记表示具有主要细胞类型的区域:1:角膜细胞类型;2:视网膜细胞类型;3:神经元细胞类型。图3C示出了用于鉴定由AAV血清型库转导的细胞类型的细胞标记物和GFP蛋白的免疫荧光染色图像。PAX6—眼上皮或内皮细胞;CHX10—感觉视网膜的规范和形态发生;ZO-1—角膜内皮标记物。MAP2—神经元标记物;DAPI—细胞核染色。因此,图3说明了汇集的眼类器官和脑类器官AAV感染的表征,以及汇集的AAV血清型的高转导效率的指征。
图4A示出了本文所述载体的一般设计的示意图。图4B示出了用于血清型条形码捕获和分析的AAV基因组货物(AAV genomic cargo)的示例性设计的示意图。图4C示出了具有编码AAV病毒衣壳蛋白的转基因的AAV的其他示例性设计的示意图,该AAV病毒衣壳蛋白进而包封其自身编码转基因。图4D示出了用于血清型条形码捕获和分析的示例性AAV基因组货物的设计的示意图。选择哺乳动物启动子用于在人类器官细胞中表达非宿主蛋白。带有条形码的eGFP转基因被表达,并可与宿主基因转录物区分开来。在终止密码子之后和聚腺苷酸尾之前***唯一的8碱基对条形码,其被设计为位于距捕获的尾98个碱基以内以进行Cell Ranger分析。***聚腺苷酸尾序列以将RNA转录物捕获到10×珠子上的探针。图4E示出了对10×Cell Ranger流水线(10×Cell Ranger pipeline)的修改,以***用于高通量嗜性分析的捕获的AAV血清型条形码。SEQ ID NO:17-28中的划线序列表示示例性条形码序列。因此,图4说明了例如用于血清型条形码编码和RNA转录物捕获的AAV基因组货物序列的示例性载体设计,以及用于AAV嗜性的高通量单细胞分析的10×Cell Ranger流水线的修改。
图5示出了一张图像、一张热图和一张表格。图5A示出了将衍生自H1人ES细胞的人眼类器官的5849个细胞的t-随机近邻嵌入(t-Stochastic Neighbor Embedding,t-SNE)图按K-均值分成10个不同的簇。将具有低细胞数目的簇9和10从随后的AAV嗜性分析中移除。测序的FASTQ文件通过修改后的Cell Ranger流水线进行处理,并在Cell Loupe软件上可视化,每个细胞的平均读段数为122688,每个细胞的中值基因数为1022。图5B示出了用于t-SNE图中的细胞生态位鉴定的每个细胞簇的前10个高表达基因的代表性列表。因此,图5说明了针对眼类器官的单细胞RNA转录组分析和生态位标记物鉴定的应用。
图6示出了九张图像、两张环形图、2张柱形图和1张热图。图6A示出了九张t-SNE图,其示出了用不同AAV血清型(AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV-DJ和AAV-Anc80)转导的单个细胞,其中每种血清型由一张图表示。每张图包括眼类器官的10个簇。由深灰色点表示的区域代表由特定的AAV血清型成功转导的单细胞,如通过细胞内的条形码计数所确定。图6B示出了显示在MiSeq测序仪上通过扩增子测序对转导的眼类器官进行批量分析的图。来自批量测序分析的感染前和感染后AAV的结果与用Cell Ranger流水线处理的单细胞分析图一致,表明该测定实现了以单细胞分辨率对AAV嗜性的准确测量,超越了传统的批量测序方法。图6C示出了在每个簇中用每种AAV血清型转导的细胞的计数的图。数据示出了每种AAV血清型在人眼类器官内在不同细胞簇中的唯一的转导水平。图6D示出了转导的人眼类器官中的AAV细胞簇嗜性的图。结果表明每种AAV血清型的嗜性在不同的细胞簇中存在差异,并且与其他AAV血清型不同。图6E示出了每种AAV血清型对每个细胞簇的转导效率在热图中可视化为转导的细胞的百分比。使用该方法,实现了(i)对每个细胞簇最有效的AAV血清型的鉴定;和(ii)对所选靶细胞类型最具特异性的AAV血清型(即其他非期望细胞类型具有最低的转导)的鉴定。因此,图6说明了针对人眼类器官的高通量AAV嗜性测量和分析的应用。
图7示出了一张图像、一张热图和一张表格。图7A示出了将衍生自H1人胚胎干细胞的人脑类器官的15466个细胞的t-随机近邻嵌入(t-SNE)图按K-均值分成10个不同的簇。测序的FASTQ文件通过修改后的Cell Ranger流水线进行处理,并在Cell Loupe软件上可视化,每个细胞的平均读段数为23315,每个细胞的中值基因数为902。图7B示出了用于t-SNE图中的细胞生态位鉴定的每个细胞簇的前10个高表达基因的代表性列表。因此,图7说明了针对人脑类器官的单细胞RNA转录组分析和细胞生态位标记物鉴定的应用。
图8示出了九张图像、两张环形图、2张柱形图和1张热图。图8A示出了九张t-SNE图,其示出了用不同AAV血清型(AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV-DJ和AAV-Anc80)转导的单个细胞,其中每种血清型由一张图表示。每张图包括脑类器官的10个簇。由深灰色点表示的区域代表由特定的AAV血清型成功转导的单细胞,如通过细胞内的条形码计数所确定。在MiSeq测序仪上通过扩增子测序对转导的脑类器官进行批量分析。图8B示出了显示使用定制Python脚本进行的批量测序分析的图与用Cell Ranger流水线处理的单细胞分析图一致,表明本发明实现了以单细胞分辨率对AAV嗜性的准确测量,超越了传统的批量测序方法。图8C示出了在每个簇中用每种AAV血清型转导的细胞的计数的图。数据示出了每种AAV血清型在人脑类器官内在不同细胞簇中的唯一的转导水平。图8D示出了转导的人脑类器官中的AAV细胞簇嗜性的图。结果表明每种AAV血清型的嗜性在不同的细胞簇中不同,并且与其他AAV血清型不同。图8E示出了每种AAV血清型对每个细胞簇的转导效率在热图中可视化为转导的细胞的百分比。使用该方法,实现了(i)对每个细胞簇最有效的AAV血清型的鉴定;和(ii)对所选靶细胞类型最具特异性的AAV血清型(即其他非期望细胞类型具有最低的转导)的鉴定。因此,图8说明了针对人脑类器官的高通量AAV嗜性测量和分析的应用。
具体实施方式
随着科学和医学的发现,人们一直在寻求不同疾病的治疗方法。尽管上个世纪科学和医学发展迅速,但仍有许多疾病无法治疗。这些疾病通常属于一组被称为遗传性疾病的疾病,其中以镰状细胞病和亨廷顿氏病为代表。
基因治疗作为一种有前景的疾病治疗模式被引入,包括对遗传性疾病的治疗。基因治疗的一种常见方法是通过递送载体将正常基因引入受试者中以允许产生正常蛋白,从而治愈疾病或预防疾病的发作。对于治疗性递送载体,存在两种提高基因治疗成功率的关键性质:首先是转导效率,或者说载体将治疗性物质递送至期望靶细胞的程度;其次是转导特异性,或者说载体避免脱靶递送至体内其他细胞的程度。传统上,将载体(诸如单个腺相关病毒(AAV)血清型)单独施用给细胞/组织/动物,然后对整个组织进行批量采样以确定该单个AAV是否进入组织。
腺相关病毒(AAV)是医学上和商业上有吸引力的基因递送载体,原因是FDA和EMA最近成功批准了基于AAV的基因疗法,例如用于治疗脂蛋白脂肪酶缺乏的Glybera、用于治疗遗传性视网膜疾病的Luxturna和用于治疗儿科脊髓性肌营养不良的Zolgensma。AAV的治疗应用范围从靶向眼中的小组织直至在肌肉以及难及性***(诸如神经***和脉管***)中的全身分布。由于能够操纵AAV蛋白衣壳序列,进而改变血清型并且赋予针对期望组织的优先嗜性,这种多功能性得以实现。如本文所用,术语“嗜性”或“病毒嗜性”是指给定病毒感染细胞类型、组织或物种的能力和特异性。虽然在鉴定用于成功治疗的最佳衣壳蛋白方面已经付出了相当大的努力,但比较不同AAV血清型的性能的早期研究往往通量低且成本高昂。
第一个限制是每种细胞系或动物通常仅由单一AAV血清型转导,因此要评估多种不同的血清型,将需要增加类似的独立重复;部分原因是用于转导效率测定的读出往往不可复用(non-multiplexable),诸如通过免疫组织学或荧光报告指标进行定量,这意味着每个样品只能通过单一载体测试候选物进行处理。第二个限制是转导测定的灵敏度往往需要许多细胞和载体拷贝的聚集,因此分辨率限于组织水平而不是通常所需的细胞水平。此类单重(single-plex)方法将比较限制于数量相似的少量靶细胞或组织中的仅少数AAV血清型。近年来,通过利用测序作为转导效率的读数,设计出了更高通量的转导测定,即把带有核苷酸条形码的AAV的多重文库施用给靶细胞或组织,并通过对这些核苷酸条形码测序来鉴定性能最好的AAV血清型。然而,迄今为止所用的技术限于大块组织,其不能提供分析每种AAV血清型如何有效或特异性转导复杂组织群内的特定细胞子集所需的分辨率。
如果期望的靶标是例如复杂组织内与组织内的其他细胞类型相对的某一细胞生态位,则这种组织水平的分析是不够的。该靶标的结果将是不准确的,因为读数将稀释在组织内的其他细胞类型的读数中。此外,由于传统方法难以放大,仅有少数血清型会被评估,其中每个“测试”包括每个样品单独施用单个血清型、单独组织切片染色和单独血清型报告基因检测测定,这既费力又耗时。通过免疫组织化学鉴定组织内不同细胞生态位/类型的常用方法也受到细胞类型特异性抗体标记物的可用性的限制。其中存在以下问题:可能没有选择更有效的载体用于治疗用途;载体特异性是未知的;无法测试很多的现有载体;当靶细胞未被转导但临近细胞在大块组织中时,出现假阳性;以及当靶细胞被转导但邻近细胞不在大块组织中时,出现假阴性。
鉴于上述问题,需要提供一种能够对转导效率和/或转导特异性进行多重测量的新方法。特别地,该方法可以测量递送载体(例如但不限于腺相关病毒(AAV)及其变体)的文库如何递送到多种细胞类型(例如但不限于类器官培养物中的人细胞)的文库中。在一种示例性方法中,证明了将AAV身份生物分布的高通量测量与高分辨率单细胞RNA转录组学测序相结合,能够以前所未有的方式描绘天然和工程化AAV变体如何转导脑类器官和眼类器官内的人细胞。本文公开的方法还可应用于确定治疗性递送载体的安全性和效力,从而使治疗方式成功得到批准和商业化。
本公开的发明人已经发现了一种在单细胞水平上评估病毒载体的转导效率和/或特异性的方法,该方法包括:
a)提供多个不同的病毒载体,
b)用该多个不同的病毒载体转导异质细胞群;
c)将该异质细胞群分隔成多个区室,其中每个区室包含来自该异质细胞群的单细胞;
d)对每个分隔的细胞进行核苷酸测序;
e)在每个分隔的细胞中检测该不同的病毒载体中的任一者或多者的存在。
如本文所用,术语“转导”是指多核苷酸或核酸可被引入宿主细胞的过程。多核苷酸或核酸可以是但不限于载体、DNA、RNA或质粒。因此,如本文所用,术语“转导效率”是指多核苷酸或核酸可通过载体引入宿主细胞的能力。在一个示例中,特定载体对特定细胞类型的转导效率通过该特定细胞类型的已被检测出对于该特定载体的存在呈阳性的细胞的百分比来确定。在另一个示例中,特定载体对特定细胞类型的转导效率通过将在该特定细胞类型的细胞中检测到该特定载体存在的频率与在该特定细胞类型的细胞中检测到另一种载体存在的频率进行比较来评估。
如本文所用,术语“转导特异性”是指载体转导靶细胞的能力,或载体避免脱靶递送至体内其他细胞的程度。在一个示例中,特定载体对特定细胞类型相对于另一细胞类型的转导特异性通过将在该特定细胞类型的细胞中检测到该特定载体存在的频率与在另一特定细胞类型的细胞中检测到该特定载体存在的频率进行比较来评估。
如本文所用,术语“载体”是指大分子或大分子的结合物,其包含多核苷酸或与多核苷酸结合,并且其可用于介导多核苷酸向细胞的递送。示例性载体包括但不限于质粒、病毒载体(病毒或其病毒基因组)、假病毒载体、病毒样颗粒、脂质体、外泌体、纳米颗粒和其他基因递送载体。在一个示例中,载体选自由以下项组成的组:病毒载体、假病毒载体、病毒样颗粒载体、脂质体载体、外泌体载体、纳米颗粒及其组合;其中这些载体包含DNA、RNA、修饰的RNA,修饰的DNA或其组合。
在一个示例中,载体包括病毒载体,其中该病毒载体选自由以下项组成的组:腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、冠状病毒载体、肠病毒载体、逆转录病毒载体或其组合。在另一个示例中,多种不同的病毒载体包括不同科的病毒载体、不同属的病毒载体、不同种的病毒载体、不同血清型的病毒载体、携带不同突变的病毒载体或其组合。在一个优选的示例中,病毒载体是AAV载体。在另一个示例中,病毒载体选自由以下项组成的组:AAV 1型(AAV-1)、AAV 2型(AAV-2)、AAV 3型(AAV-3)、AAV 4型(AAV-4)、AAV 5型(AAV-5)、AAV 6型(AAV-6)、AAV 7型(AAV-7)、AAV 8型(AAV-8)、AAV 9型(AAV9)、AAV 10型(AAV10)、AAV 11型(AAV11)、AAV 12型(AAV12)、AAV 13型(AAV13)、rh10、AAVDJ、AAVAnc80、AAV-PHP.S、AAV-PHP.eB、AAV-LK03、AAV2-7m8、其AAV变体及其组合。术语“AAV变体”包括含有AAV衣壳蛋白变体或突变体的AAV病毒粒子。变体AAV衣壳蛋白的示例包括相对于相应亲本AAV(或AAV血清型)的衣壳蛋白包含至少一个氨基酸差异(例如,氨基酸取代、氨基酸***、氨基酸缺失)的AAV衣壳蛋白。
在本文公开的方法中,多个不同的载体中的每一者包含寡核苷酸条形码序列,其中任意两个不同载体的条形码序列不同。如本文所用,术语“条形码”通常是指可为分析物的一部分以传达关于该分析物的信息的标记或标识。条形码可以是附接于分析物(例如核酸分子)的标签或该标签与该分析物的内源特征(例如分析物的大小或末端序列)的组合。在一个示例中,条形码是唯一的。条形码可以具有多种不同的格式,例如,条形码可以包括但不限于:多核苷酸条形码;随机核酸和/或氨基酸序列;以及合成的核酸和/或氨基酸序列。条形码可以可逆或不可逆的方式附接于分析物。可例如在样品测序之前、期间和/或之后将条形码添加至脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。在一个示例中,条形码序列位于载体中的表达盒上,其中该盒的表达使得产生包含条形码序列的RNA分子,其中该RNA分子还包含聚腺苷酸尾。
在另一个示例中,条形码序列位于RNA分子的允许对条码序列进行测序的区域上。允许对条形码序列进行测序的RNA分子的区域可以靠近聚腺苷酸尾,也可以远离聚腺苷酸尾。如本文所用,术语“聚腺苷酸尾”指仅具有腺嘌呤碱基的一段RNA。条形码序列可在距聚腺苷酸尾1至100个核苷酸的距离内。在一个示例中,条形码序列可在距聚腺苷酸尾1至10个核苷酸、11至20个核苷酸、21至30个核苷酸、31至40个核苷酸、41至50个核苷酸、51至60个核苷酸、61至70个核苷酸、71至80个核苷酸、81至90个核苷酸或91至100个核苷酸的距离内。在一个示例中,条形码序列可在距聚腺苷酸尾91个、92个、93个、94个、95个、96个、97个、98个、99个或100个核苷酸的距离内。在一个优选的示例中,条形码序列在距聚腺苷酸尾98个核苷酸的距离内。
条形码序列的长度可在1至100个核苷酸的范围内。在一个示例中,条形码序列的长度可为1至10个核苷酸、11至20个核苷酸、21至30个核苷酸、31至40个核苷酸、41至50个核苷酸、51至60个核苷酸、61至70个核苷酸、71至80个核苷酸、81至90个核苷酸或91至100个核苷酸。在另一个示例中,条形码序列的长度为5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸。在一个优选的示例中,条形码序列的长度为8个核苷酸。
为了帮助检测条形码序列,可在条形码序列旁边或紧邻条形码序列处***标签序列。在一个示例中,标签序列在条形码序列的上游。在另一个示例中,标签序列在条形码序列的下游。标签序列可存在于距条形码1至10个核苷酸、11至20个核苷酸或21至30个核苷酸的距离内。在一个示例中,标签序列可存在于距条形码9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的距离内。在一个优选的示例中,标签序列可存在于距条形码15个核苷酸的距离内。
标签序列编码可检测标记以用于检测条形码的目的。这种标签序列的非详尽示例可编码荧光蛋白、表位或任何亲和标签。在一个示例中,标签序列编码但不限于绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、蓝色荧光蛋白(BFP)、FLAG、HA、链霉亲和素或谷胱甘肽S-转移酶(GST)。在另一个示例中,标签序列编码绿色荧光蛋白(GFP)。在另一个示例中,标签序列为SEQ ID NO:9。
在本文公开的方法中,多个载体还可包含标记物多核苷酸。在一个示例中,多个不同的载体中的每一者包含标记物多核苷酸,其中任意两个不同载体的标记物多核苷酸不同;并且其中该标记物多核苷酸编码一种或多种蛋白质,该一种或多种蛋白质在表达时形成包封该标记物多核苷酸的蛋白质包膜,使得在转染该载体后,每种标记物多核苷酸被该标记物多核苷酸编码的该一种或多种蛋白质包封。在一个示例中,标记物多核苷酸位于载体中的表达盒上,其中该表达盒的表达使得产生包含标记物多核苷酸的RNA分子,其中该RNA分子还包含聚腺苷酸尾。标记物多核苷酸可以是但不限于编码病毒的一部分的基因。该病毒部分可包括病毒衣壳编码基因和/或病毒复制基因,其中由标记物多核苷酸表达的衣壳包封标记物多核苷酸。在另一个示例中,标记物多核苷酸是病毒衣壳编码基因,其中由标记物多核苷酸表达的衣壳包封标记物多核苷酸。编码包封其自身的病毒衣壳蛋白的标记物多核苷酸称为基因型:表型连锁,也称为衣壳-基因型连锁。当多个AAV衣壳转基因变体被引入宿主细胞,从而使得大量AAV衣壳蛋白产生时,基因型:表型连锁在该病毒产生过程中发生。然后,各AAV衣壳的变体(或血清型)包封编码了这些特定衣壳的特定衣壳转基因。该多个AAV衣壳变体可能不同,但转基因序列在翻译时与它们各自的包封衣壳蛋白序列在很大程度上匹配。在另一个示例中,标记物多核苷酸包括SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15或SEQ ID NO:16。在一个示例中,病毒衣壳编码基因具体是AAV衣壳编码基因。在另一个示例中,病毒衣壳编码基因是SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16。
本文所述的载体还可包含启动子序列。启动子序列允许RNA聚合酶与转录因子结合,从而控制靶基因的表达。启动子序列可包括但不限于P5、CASI或巨细胞病毒(CMV)启动子序列。在一个示例中,启动子序列是P5启动子序列。在另一个示例中,启动子序列是CASI启动子序列。在另一个示例中,启动子序列是SEQ ID NO:8或SEQ ID NO:11。
本文所述的载体还可包含一条或多条反向末端重复序列(ITR)。反向末端重复序列(ITR)含有复制起点,其为复制在此起始的核苷酸序列。在一个示例中,一条或多条反向末端重复序列(ITR)选自由SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7组成的组。
本文所述的载体用于转导异质细胞群。如本文所用,术语“异质细胞群”是指遗传上、表型上或形态上不相似的一群细胞。异质细胞群可包括来自不同生物体的不同细胞类型。在一个示例中,异质细胞群包括植物细胞、动物细胞、真菌细胞或其组合。动物细胞可以是但不限于哺乳动物细胞、爬行动物细胞、昆虫细胞或禽类细胞。在一个示例中,异质细胞群包括哺乳动物细胞。“哺乳动物细胞”包括来自人以及家畜(诸如实验动物和家庭宠物(例如猫、狗、猪、牛、绵羊、山羊、马、兔))和非家畜(诸如野生动物、飞禽、鸟类等)的细胞。在一个优选的示例中,异质细胞群包括人细胞。异质细胞群还可包括相同或不同组织、器官或类器官内的不同细胞类型。异质细胞群可包括但不限于内胚层细胞、中胚层细胞、外胚层细胞或可由其衍生的任何细胞类型。在另一个示例中,异质细胞群是培养的细胞。在另一个示例中,异质细胞群获自一种或多种培养的类器官。术语“类器官”是指被认为是在体外三维产生的小型化和简化形式的器官的细胞簇或聚集体。通常,类器官显示类似器官或器官的一部分的逼真的显微解剖结构,并具有与该特定器官相关的细胞类型。在另一个示例中,一种或多种培养的类器官选自由眼类器官、脑类器官、上皮类器官、肾类器官、肺类器官、胰腺类器官、心脏类器官和肝类器官组成的组。在一个优选的示例中,一种或多种培养的类器官是眼类器官或脑类器官。
本文所述的方法可在体内、体外或离体应用。在一个示例中,异质细胞群在被转导时包含在动物或人受试者中。
本文所述的方法可包括另外的步骤。在一个示例中,该方法还包括:
f)基于使用步骤d)中获得的测序结果确定的每个分隔的细胞的基因表达模式和/或表观遗传特征,将该每个分隔的细胞分类为特定的细胞类型。
如本文所用,术语“表观遗传(的)”描述了关于功能改变而核苷酸序列没有改变的DNA状态或状况。可以是天然存在的或修饰结果的表观遗传特征的示例包括但不限于DNA甲基化、组蛋白修饰、染色质可及性、核小体和无核小体区域的位点等。表观遗传特征可导致基因表达的变化。
本文所述的方法可包括步骤a)至f)中的任一步骤内的进一步细节。在一个示例中,步骤e)包括检测对每个不同的载体具有特异性的一条或多条标记物序列的存在;其中当每个载体包含唯一的条形码序列时,该一条或多条标记物序列包含该条形码序列;其中当每个载体包含唯一的标记物多核苷酸时,该一条或多条标记物序列包含该标记物多核苷酸。在另一个示例中,步骤e)包括将步骤d)中获得的序列读段与参考数据集进行匹配的步骤。该参考数据集包含多个不同的病毒载体的基因组和/或转录组,和/或包含在该多个不同的病毒载体中的条形码,和/或包含在该多个不同的病毒载体中的标记物多核苷酸。
为了实现将异质细胞群分隔成不同的区室,可以使用不同的方法。如本文所用,术语“分隔”或“分隔的”是指将细胞分隔在不同的部分或区室中。在一个优选的示例中,区室是油滴。
如本文方法中所述的核苷酸测序可以是本领域通常已知的任何测序方法。在一个示例中,核苷酸测序是RNA测序。在另一个示例中,核苷酸测序是DNA测序。
可以使用多种方法在每个分隔的细胞中检测不同的病毒载体中的任一者或多者的存在。在一个示例中,在每个分隔的细胞中检测不同的病毒载体中的任一者或多者的存在的方法包括但不限于测序、多重qPCR、原位测序或原位杂交。在一个优选的示例中,在每个分隔的细胞中检测不同的病毒载体中的任一者或多者的存在的方法是测序。
本公开提供了一种允许在异质和/或复杂细胞群内以单细胞分辨率高通量鉴定递送载体的效率、生物分布和细胞/组织类型特异性的方法,这些递送载体例如但不限于多种重组腺相关病毒(rAAV)、核酸、病毒、纳米颗粒、脂质体或纯化的生物分子。异质和/或复杂细胞群的示例可以是但不限于人类器官、人肿瘤、人活检组织、人组织、人器官、人细胞混合物、植物组织、动物组织或细胞混合物。本文所述的方法能够在包括多重(即在同一实验/样品中同时进行多个测试)设置的条件下、在单细胞分辨率下、在无需任何预富集的复杂组织内、或在任何目的细胞类型内高通量地确定载体效率和特异性。本文所述的方法还提供了对用于将核酸靶向递送至目的单细胞或单细胞生态位簇的最有效的递送载体组合物的鉴定。这通过对比地鉴定和分析在每个细胞或细胞生态位簇中发现的各自的组合物序列的频率来实现。本文所述的方法还可提供对不同AAV血清型对人组织中的各单细胞或单细胞生态位的特异性和效率的测定。
总之,本公开提供了以下内容:
A.一种对在复杂细胞群中在单细胞水平上同时鉴定多个AAV的嗜性(特异性)的单细胞测序的示范。
B.一种经由唯一序列(索引)索引单个AAV并将该索引的捕获过程和测序集成到实验和生物信息学工作流中以用于可确定细胞类型的单细胞转录谱分析的方法。该唯一序列可以是例如每个血清型的8个碱基的DNA或衣壳编码DNA序列。这种方法允许识别每个独特的细胞类型中的多个或单个AAV的频率。
C.一种在异质细胞群中进行AAV转导效率和特异性比较的方法。
本文公开的方法允许特异性地与多种非宿主AAV血清型序列进行序列比对,并基于它们的RNA表达谱将它们分配至单细胞生态位。目前,通常使用的普遍存在的单细胞技术被设计成仅与人RNA转录组比对以获得组织的RNA表达谱。本文所述的方法还可通过在载体中掺入通常不存在于病毒蛋白中的聚腺苷酸尾来实现。聚腺苷酸尾的掺入使得能够捕获表达的蛋白。在一个示例中,聚腺苷酸尾序列是SEQ ID NO:10。此外,在与人RNA转录组一起捕获后,在序列区域内掺入针对每种AAV血清型的唯一条形码。该方法还包括修改参考数据集以及修改比对命令,从而允许提取最终数据并分析其转导效率和转导特异性。
如本申请中所用,除非上下文另有明确说明,否则无数量词修饰的名词包括多个所指代的名词。例如,术语“遗传标记物”包括多个遗传标记物,该多个遗传标记物包括它们的混合物和组合。
如本文所用,术语“增加”和“减少”是指群体的子集中所选性状或特征与存在于整个群体中的相同性状或特征相比的相对改变。因此,增加表示正刻度上的变化,而减少表示负刻度上的变化。如本文所用,术语“变化”也指分离的群体子集的所选性状或特征与整个群体中的相同性状或特征之间的差异。然而,该术语没有对所观察到的差异进行评估。
如本文所用,在物质浓度、物质大小、时间长度或其他所述值的上下文中,术语“约”是指所述值的+/-5%,或所述值的+/-4%,或所述值的+/-3%,或所述值的+/-2%,或所述值的+/-1%,或所述值的+/-0.5%。
在本公开全文中,某些实施方式可以范围形式公开。应当理解,范围形式的描述仅仅是为了方便和简洁,而不应当被理解为对所公开范围的硬性限制。因此,对范围的描述应被认为已经具体公开了所有可能的子范围以及该范围内的各个数值。例如,对范围诸如1至6的描述应被认为已经具体公开了诸如1至3、1至4、1至5、2至4、2至6、3至6等的子范围,以及该范围内的各个数值,诸如1、2、3、4、5和6。无论范围有多广,这一点都适用。
本文中示例性描述的发明可在不存在本文未具体公开的任何一个或多个要素要素、一个或多个限制的情况下适当地实施。因此,例如,术语“包含”、“包括”、“含有”等应作广义和不受限制的理解。另外,本文所采用的术语和表达被用作描述性术语而非限制性术语,并且在使用这些术语和表达时,无意排除所示和所述特征或其部分的任何等同形式,但是应当认识到,在所要求保护的本发明的范围内可进行各种修改。因此,应当理解,尽管本发明已通过优选实施方案和任选特征而被具体公开,但是本领域技术人员可对本文公开的所实施的发明进行修改和改变,并且此类修改和改变被认为是在本发明的范围内。
本发明已在本文中作了广泛和一般性的描述。属于一般公开范围的较狭义的种类和亚属分组也构成本发明的一部分。这包括从属中去除任何主题的附带条件或否定限制的本发明的一般描述,而不论所删除的材料是否在本文中具体叙述。
其他实施例在以下权利要求和非限制性示例内。另外,当本发明的特征或方面根据马库什群组(Markush groups)进行描述时,本领域技术人员将认识到本发明也凭此根据马库什群组的任何单独成员或成员的亚组进行描述。
实验部分
材料和方法
类器官培养和条件
简言之,将脑类器官和眼类器官置于mTeSR1培养基(Stem Cell Technologies,目录号:85850)中培养。用accutase处理人ES细胞(H1 WA01和H9 WA09)以产生单细胞。将细胞接板于含有低浓度的碱性成纤维细胞生长因子(bFGF 4ng/mL)和20μM/mL Rho相关蛋白激酶(ROCK)抑制剂(Y27632 Stem Cell)的96孔V型底板(Sematec Pte Ltd代码:1009985)中,共计4000个细胞/孔。为了培养脑类器官,在24小时后将胚胎体(EB)转移至含有hESC培养基(400mL DMEM-F12、100mL KOSR、15mL ESC级胎牛血清(FBS)、5mL GlutaMAX、5mL MEM-NEAA和3.5μL 2-巯基乙醇)的低附着96孔U型底板。为了培养眼类器官,在24小时后将胚胎体(EB)转移至含有分化培养基DM(DMEM/F12,4%knockout血清替代物(KOSR),4% ESC级胎牛血清(FBS),1×非必需氨基酸(NEAA),1×Glutamax,1×Pen-Strep;使用真空式0.2μm过滤单元过滤)的低附着96孔U型底板。每隔一天为EB添加一次培养基,持续6天,然后将它们置于用于脑类器官的神经诱导培养基和用于眼类器官的视网膜分化培养基(RDM:DM+2%B27)中培养4天。当EB出现神经外胚层分化时(10天内),将聚集体转移至Matrigel(生长因子减少的Matrigel,Bio-Lab 354230)。Matrigel是用脑类器官分化培养基(CDM)以1:1的稀释比制备的。将50μL Matrigel加入每个孔中,并在培养箱中在37℃下培养30分钟。然后将100μL含有B27(不含维生素A)的脑类器官分化培养基加入到每个孔中并培养48小时。培养2-3天后,将聚集体(类器官)转移至6孔透明平底超低附着板。在用含有B27(不含维生素A)的脑类器官分化培养基静态培养4天后,将包埋的类器官转移至80rpm的定轨摇床,并置于37℃、5% CO2培养箱中,在含有B27(含维生素A)的脑类器官分化培养基中长期培养(1-52周)。
AAV质粒克隆和病毒生产
通过在质粒骨架pZac2.1-CMV-eGFP.rgb中在eGFP转基因终止密码子之后引入短序列TAATAAATCGATCGNNNNNNNN(SEQ ID NO:40)来构建条形码化eGFP质粒。设计具有突出条形码的引物用于第一轮PCR,以产生终止于ITR序列的条形码化eGFP片段。第二轮巢式PCR扩增经限制性内切酶NheI和BamHI消化的条形码化eGFP的较短片段。将消化的片段与用相同的限制性酶NheI和BamHI消化的载体骨架连接。通过桑格测序(Sanger sequencing)检查克隆的序列。用于每种AAV血清型的代表性条形码示于表1中。
表1
质粒 条形码 用于条形编码
pZac2.1-CMV-eGFP_A701 ATCACGAC AAV1
PZac2.1-CMV-cGFP_A702 ACAGTGGT AAV2
pZac2.1-CMV-eGFP_A706 AACCCCTC AAV6
PZac2.1-CMV-eGFP_A707 CCCAACCT AAV7
pZac2.1-CMV-eGFP_A708 CACCACAC AAV8
pZac2.1-CMV-eGFP_A709 GAAACCCA AAV9
pZac2.1-CMV-eGFP_A710 TGTGACCA AAV-rh10
pZac2.1-CMV-eGFP_A711 AGGGTCAA AAV-DJ
PZac2.1-CMV-eGFP_A712 AGGAGTGG AAV-Anc80
通过使用Gibson组装(Gibson assembly)将来自不同血清型的Cap基因克隆到pAAV-RepCap骨架中,以构建血清型特异性pAAV-RepCap质粒。将不同血清型Cap基因排序为基因块(IDT),并经由Gibson组装将其克隆到HindIII/PmeI消化的pAAV-RepCap骨架中,以构建具有不同血清型Cap基因的pAAV-RepCap。产生来自不同血清型的AAV病毒,每种病毒都具有其自身的条形码。简言之,经由293AAV细胞系(Cell Biolabs AAV-100)的三重转染包装AAV,该细胞系接板于含有由DMEM、glutaMax、丙酮酸盐、10%FBS(Thermo Fisher)组成,补充有1×MEM非必需氨基酸(Gibco)的生长培养基的HYPERFlask′M′(Corning)中。转染时的汇合度为70%至90%。在转染前将培养基替换成新鲜预温热的生长培养基。对于每个HYPERFlask′M′,将200μg pHelper(Cell Biolabs)、100μg pRepCap[编码用于不同血清型的衣壳蛋白]和100μg pZac-CASI-GFP(条形码化)在5mL DMEM中混合,并加入2mg PEI″MAX″(Polysciences)(40kDa,1mg/mL H2O溶液,pH7.1)使PEI∶DNA质量比为5∶1。将混合物孵育15分钟,并逐滴转移至细胞培养基。转染后第二天,将培养基更换为由DMEM、glutamax、丙酮酸盐和2%FBS组成的培养基。转染后48-72小时,通过用1×磷酸盐缓冲盐水(PBS)(pH7.2)+5mM EDTA进行刮取或使其解离,并以1500g沉淀12分钟来收获细胞。将细胞团重悬于1-5mL裂解缓冲液(Tris HCl pH7.5+2mM MgCl+150mM NaCl)中,并在干冰-乙醇浴和37℃水浴之间冻融3次。经由4000g将细胞碎片澄清5分钟,收集上清液。收集的上清液用50U/mLBenzonase(Sigma-Aldrich)和1U/mL RNase cocktail(Invitrogen)在37℃处理30分钟,以除去未包装的核酸。孵育后,将裂解物上样到29.9mL Optiseal聚丙烯管(Beckman-Coulter)中的不连续密度梯度的顶部,该密度梯度由15%、25%、40%、60%Optiprep(Sigma-Aldrich)各6mL组成。在Type 70Ti转子上,将管在18℃下以54000rpm超速离心1.5小时。提取40%的级分,并使用Amicon Ultra-15(100kDa MWCO)(Millipore)用补充有35mMNaCl的1×PBS(pH7.2)透析。采用ITR序列特异性引物和探针26,以ATCC参考标准物质8(ATCC)为参照,使用实时qPCR测定纯化的AAV载体原液的滴度。
类器官的体外AAV转导
通过以1×1010的载体基因组(vg)汇集每种AAV血清型来建立AAV血清型库,得到9×1010的最终病毒拷贝,用于在24孔板的各孔中转导类器官。使用AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、rh10、DJ和Anc80血清型进行汇集。在转导7-10天后,收获类器官进行测序、荧光成像和组织化学分析。
免疫荧光组织化学
将类器官在4℃下在4%多聚甲醛中固定4小时,随后在PBS中洗涤三次,每次15分钟。使类器官浸没在30%蔗糖中过夜,然后包埋在OCT中并冰冻切片,切片厚度12μm。将切片在0.2% Triton X-100的PBS溶液中透化,并用封闭缓冲液(2%牛血清白蛋白(BSA)和5%胎牛血清)在室温下封闭1小时。随后以1∶100的稀释度,将切片与指定的一抗在封闭缓冲液中在4℃下孵育过夜。使用的二抗是驴Alexa Fluor 488、568和647偶联物(Invitrogen,1∶1000)。用4',6-二脒基-2-苯基吲哚(DAPI)(Sigma-Aldrich)的PBS溶液染色5分钟后,将载玻片置于Vectashield防褪色试剂(Vector Laboratories)中。用Leica TCS SP8 DLS光片显微镜进行共聚焦成像。一抗:PAX6(兔,abcam ab5790)、CHX10(兔,abcam ab133636)、ZO-1(小鼠,Thermofisher ZO1-1A12)、MAP2(鸡,abcam ab5392)。S100β(兔,abcam ab52642)、RAX(兔,abcam ab23340)、CD31(小鼠,abcam ab23340)、aSMA(兔,abcam ab5694)、DAPI(49,6-二脒基-2-苯基吲哚)。NeuN(小鼠,Sigma-Aldrich MAB377)。
AAV序列的设计和产生
选择哺乳动物启动子用于在人类器官细胞中表达非宿主蛋白。带有条形码的eGFP转基因被表达,并可与宿主基因转录物区分开来。在终止密码子之后和聚腺苷酸尾之前***唯一的8碱基对条形码,并且将其设计为位于捕获尾98个碱基以内以进行Cell Ranger分析。***聚腺苷酸尾序列以将RNA转录物捕获到10×珠子上的探针。质粒序列的示例包括SEQ ID NO:1和SEQ ID NO:29-39。
转基因也可设计为编码AAV病毒衣壳蛋白,该衣壳蛋白进而包封编码其自身的转基因。这是通过将AAV Rep和Cap编码序列置于AAV反向末端重复序列(ITR)(例如SEQ IDNO:2或SEQ ID NO:3)之间来实现的。这也可通过将Cap编码序列置于AAV ITR(如SEQ IDNO:4所示)之间来实现。Cap序列编码核苷酸和编码的氨基酸水平上的序列变异,彼此之间有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个变异的差异。
将这种pAAV-Rep-Cap/pAAV-Cap变体质粒的整个库与编码必需的腺病毒辅助蛋白的pHelper质粒一起转染到HEK293细胞中,以产生AAV。从这种汇集形式产生的单独的AAV优先包封它们自身编码性ITR-Rep-Cap-ITR或ITR-Cap-ITR货物。这通过AAV包装中的基因型:表型连锁(也称为衣壳:基因型连锁)实现。基因型:表型连锁用作包装AAV文库的方法,其包装方式使得每个AAV以非随机方式含有其自身的基因组,从而使DNA/RNA测序能够重新鉴定衣壳蛋白的身份。衣壳序列可经由长读测序来鉴定。
扩增子条形码测序和分析
以单细胞形式收获经转导的类器官样品,并通过10×chromium仪器处理以进行转录物的细胞条形码化。经由10×工作流纯化总的互补DNA(cDNA),并等分5μL用于定制的批量测序。剩余的cDNA用于剩余的10×工作流以进行单细胞测序。为含有AAV条形码的靶位点的第一轮20个循环的PCR设计了定制引物,如表1所示。使用胶回收提取靶条带,并使用第二轮15个循环的PCR将P5和P7接头序列加入富集的片段,并通过胶回收清洁最终文库。用于文库构建的引物如表2所示。使用Qubit dsDNA HS试剂盒(Agilent)测定文库浓度。在MiSeq上使用2×75bp PE运行(掺入20%PhiX)进行下一代测序(NGS)。利用内部python脚本从扩增子文库的MiSeq运行产生的MiSeq FASTQ内搜索代表每种血清型的唯一的8核苷酸条形码序列,并将每个样品的每条条形码序列的总计数制成表格。
表2
Figure BDA0003994425050000211
单细胞测序和RNA转录组学分析
如10×Genomics Single Cell 3'v2 Reagent试剂盒用户指南中所示制备样品。单细胞文库按照制造商的方案进行制备,随后在Illumina HiSeq4000流通池上测序。测序数据通过标准Cell Ranger流水线(standard Cell Ranger pipeline),使用修改后的gtf和基因组清单文件进行处理。简言之,将样品在PBS(Life Technologies)+0.04% BSA(Sigma)中洗涤两次,并重悬于相同溶液中。使用台盼蓝(Trypan Blue,Thermo Fisher)在光学显微镜下评估样品活力。在活力计数后,计算出每个样品的适当体积,以达到捕获10,000个细胞的目标,并按照方案指南将其与其他试剂和条形码化珠一起加载到10×Genomics single-cell-A芯片上。然后将芯片加载到10×Chromium仪器上以产生液滴,并将样品转移到预冷的联排管(Eppendorf)上,使用96孔热循环仪(Thermo Fisher)进行逆转录。逆转录后,使用10×Genomics提供的Recovery Agent回收cDNA,然后进行SilaneDynaBead纯化(10×Genomics)。将纯化的eDNA扩增12个循环,再用SPRI-选择珠(Beckman)纯化。将样品用水稀释4倍,并在生物分析仪(Agilent Technologies)上运行以测定cDNA浓度。然后按照Single Cell 3′Reagent试剂盒v2用户指南,基于生物分析仪测定的cDNA浓度,用适当的PCR循环制备cDNA文库。基于使用生物分析仪(Agilent Technologies)和使用KAPA qPCR定量(KAPA)方法在qPCR循环仪(Roche)上测量的单细胞文库的大小来计算该单细胞文库的摩尔浓度。在测序前将样品归一化为10nM。在HiSeq 4000的全流通槽(fulllane)上使用下列运行参数对每个类器官样品进行测序:读段1-26个循环;读段2-98个循环;索引(index)1-8个循环。使用来自每个样品的FASTQ文件,执行标准Cell Ranger Count命令流水线(standard Cell Ranger Count command pipeline)以进行转录物读段比对、UMI计数和聚类(通过Ronin云平台的亚马逊云计算服务(Amazon Web Services))。
编辑基因组参考文件以***用于比对的条形码化eGFP的序列。编辑gtf文件以将条形码化eGFP转录物***到转录组中,用于读段计数和分析。使用标准Cell Ranger转录组学命令,同时使用修改后的基因组参考文件和修改后的gtf文件处理原始数据。最后,在Loupe Browser软件用户界面(10×Genomics)中可视化单细胞簇和转录物计数。
单细胞AAV嗜性分析
为了对单细胞中的AAV条形码以及RNA转录物进行平行测序,对人类基因组参考文件和基因组转录物文件(gtf)进行了修改。简言之,将各AAV血清型的名称和条形码手动***到这两个将用于执行Cell Ranger Count命令流水线的文件中,以将AAV条形码转录物***到读段比对、UMI计数和聚类中。为了将AAV条形码表示(barcode representation)***到基因组参考文件中,每个条形码中***命令行“>GFP1 TAAATCGATCGNNNNNNNN”,其中8个N表示唯一的8核苷酸条形码序列。将命令行“GFP me exon 119-+-gene_id″GFP1″;transcript_id"GFP1"”***到添加到基因组参考文件的每个AAV条形码表示的基因组转录物文件中。
在Loupe Browser中,选择基于K-均值的聚类(K-means based clustering)以定义每种类型的类器官内的生态位细胞群。AAV条形码化转录物可在Gene/FeatureExpression Analysis下可视化。然后使用Cell Loupe软件(Cell Loupe software)可视化每个细胞生态位中由每种血清型转导的细胞数目并计数,并在GraphPad Prism中进行进一步的嗜性分析(图6C至图6E和图8C至图8E)。
为了确定特定病毒载体对特定细胞生态位的转导效率,计算特定细胞生态位的已检测出对于该特定病毒载体的存在呈阳性的细胞的百分比。
为了计算特定病毒载体对特定细胞生态位的转导效率,计算在特定细胞生态位的细胞中检测到该特定病毒载体的存在的频率相对于在同一特定细胞生态位的细胞中检测到另一病毒载体的存在的频率。
为了确定特定病毒载体对特定细胞生态位相对于其他细胞生态位的转导特异性,计算在特定细胞生态位的细胞中检测到该特定病毒载体的存在的频率相对于在其他特定细胞生态位的细胞中检测到同一特定病毒载体的存在的频率。
将衍生自H1人ES细胞的人眼类器官的5849个细胞的t-随机近邻嵌入(t-Stochastic Neighbor Embedding,t-SNE)图按K-均值分成10个不同的簇。测序的FASTQ文件通过修改后的Cell Ranger流水线进行处理,并在Cell Loupe软件上可视化,每个细胞的平均读段数为122688,每个细胞的中值基因数为1022。
将衍生自H1人胚胎干细胞的人脑类器官的15466个细胞的t-随机近邻嵌入(t-SNE)图按K-均值分成10个不同的簇。测序的FASTQ文件通过修改后的Cell Ranger流水线进行处理,并在Cell Loupe软件上可视化,每个细胞的平均读段数为23315,每个细胞的中值基因数为902。
实验结果
研究设计
提供了一种新框架,用于以高通量方式并在单细胞分辨率下评估复杂组织中的多重病毒嗜性。首先,生成AAV血清型组,其中AAV货物彼此可唯一区分。具体地,每种AAV血清型的单个包装载体分别含有由位于3'末端的在聚腺苷酸尾部序列之前的独特的8碱基对(bp)序列条形码化的eGFP转基因(图4D)。从这些条形码化的包装质粒产生AAV,并将汇集的AAV用于转导人眼类器官和脑类器官内的异质细胞群。在感染的细胞内转导和货物表达后,解离类器官用于单细胞测序,以鉴定感染特定细胞的细胞类型和AAV条形码(图1)。对基因组参考文件和基因组转录物文件所做的修改使得AAV条形码化转录物可与RNA转录组学数据进行比对和聚类,以便在Loupe Browser软件中在单细胞分辨率下将每个AAV血清型转录物分配至单个细胞并进行可视化。
条形码化AAV转导人眼类器官和脑类器官中的多种多样的组织亚型
人眼类器官和脑类器官作为代表了包含多种细胞亚型的人组织的复杂性的示例性模型。在培养皿上通过分化H1和H9系人ES细胞来培养类器官6周(图2A)。通过针对常见眼组织细胞标记物S100β、PAX6、CHX10、RAX、CD31和αSMA进行免疫染色来表征眼类器官(图2B),并且通过针对常见神经组织细胞标记物S100β、NeuN和Map2进行免疫染色来表征脑类器官(图2C)。眼类器官和脑类器官在不同的细胞层中表达不同的细胞标记物,这些细胞标记物指示类器官内的异质组织亚型。然后将条形码化的AAV库(1×1010(载体基因组(vg)/血清型)施用于脑类器官和眼类器官。将这些类器官再培养7天,在类器官的大部分区域内的细胞中产生强GFP阳性信号,这表明GFP货物的转导和表达在汇集的AAV中是常见的(图3A-图3B)。eGFP与数种不同的细胞标记物的共定位也证实了汇集的AAV转导人眼类器官和脑类器官内的不同组织亚型(图3C)。
在单细胞分辨率下转导的眼类器官和脑类器官中的AAV条形码化的mRNA转录物的单细胞RNA转录组聚类和分配
在如上所述用AAV文库转导人眼类器官后,将它们用胰蛋白酶消化成单细胞,作为单细胞文库制备和测序的输入,参见材料和方法部分。对于眼类器官,对类器官(测试的样品数=3)内5849个细胞的转录组进行了谱分析,其中每个细胞的平均读段数为122688,并且每个细胞的中值基因数为1022。使用K-均值聚类,我们能够在眼类器官内基于它们的转录组谱定义10个细胞簇(图5A和补充数据II)。每个细胞簇通过其簇内前10个表达基因而被唯一地鉴定(图5B和补充数据II)。图6A示出了每个簇的单个血清型的单个图,这些图表示在单细胞分辨率下所有AAV转录物的分配。为了证明该方法易于应用于不同的复杂组织,还对与眼类器官相比含有不同细胞类型群的人脑类器官进行了相同的单细胞嗜性测定。对于脑类器官,通过单细胞测序对类器官(测试的样品数=3)内15466个细胞的转录组进行了谱分析,其中每个细胞的平均读段数为23315,每个细胞的中值基因数为902。类似地,使用K-均值聚类,我们能够在眼类器官内基于它们的转录组谱定义10个细胞簇(图7A和补充数据III)。每个细胞簇通过其前10个表达基因被唯一地鉴定(图7B和补充数据III)。图8A示出每个簇的单个血清型的单个图,这些图表示在单细胞分辨率下所有AAV转录物的分配。
接着,比较了对GFP条形码进行批量测序的多重嗜性评估技术。这是一种用于检测大块组织中AAV转导的方法。来自眼类器官的批量测序的数据与各细胞聚集的单细胞测序数据一致(表3和图6B),其中AAV-Anc80、AAV6和AAV-DJ是最有效地转导大块或单细胞的聚集形式的眼类器官的前3种AAV血清型。类似地,来自脑类器官的批量测序的数据也与单细胞测序数据一致,其中AAV2、AAV6、AAV-DJ和AAV-Anc80为可最有效地转导脑类器官的前4种AAV血清型(表4和图8B)。
表3—来自眼类器官的批量测序的数据
Figure BDA0003994425050000251
表4—来自脑类器官的批量测序的数据
Figure BDA0003994425050000261
重要的是,通过提取每个细胞簇中不同AAV血清型转录物的读段计数,可以使每种AAV血清型对类器官内的各异质细胞类型的绝对(图6C和8C)和相对(图6D和8D)转导效率可视化。对于眼类器官,当在所有簇中针对GAPDH进行归一化时,AAV-Anc80被鉴定为靶向代表视网膜样细胞类型(RDH5hi、MITFhi)的细胞簇5的最有效血清型,而AAV6和AAVDJ则为转导代表上皮样细胞类型(TP63hi、KRT5hi)细胞簇7和代表神经干细胞样细胞类型(PAX6hi、SOX2hi、MAP2hi)的簇8的最有效血清型(图6E)。类似地,对于脑类器官,当在所有细胞簇中针对GAPDH进行归一化时,AAV2、AAV6和AAV Anc-80被鉴定为可有效转导代表脑膜样细胞(DCNhi、SOX2hi、PAX2hi)的簇6的血清型,而AAV6和AAVDJ则最有效转导代表中脑多巴胺能样细胞(RSPO2hi、SOX2hi、PAX6hi)的簇7。此外,结果表明AAVDJ是对代表星形胶质细胞或许旺细胞样细胞类型(S100Bhi)的簇8最有效的血清型,并且AAV-Anc-80是对代表小神经胶质细胞样细胞(UCP2hi)的簇10最有效的血清型(图8E)。这些结果显示,单细胞AAV嗜性分析鉴定了对眼类器官或脑类器官内的人细胞类型的各子集具有优先嗜性的不同AAV血清型。
迄今为止,大多数已公开的AAV嗜性测定利用低分辨率方法进行若干种AAV血清型之间的相对比较,这种相对比较要么使用同质细胞系在体外进行,要么使用大量组织器官在体内进行。本公开提出了一种实现AAV文库的高通量复用以在单细胞分辨率下进行转导效率的相对比较的流水线(pipeline)。这种流水线还允许以高通量方式评估AAV对单细胞生态位的嗜性,该评估随着单细胞研究鉴定出了更加明确的导致疾病病理的细胞生态位而日益重要。
同时评估了对由天然AAV(AAV1、AAV2、AAV6、AAV7、AAV8、AAV9和AAV rh10)和工程化AAV(AAV DJ和AAV Anc-80)组成的AAV血清型文库的嗜性,以评价它们对相同组织类器官内各不同单细胞生态位的转导效率。存在于每个单细胞中的每个AAV血清型mRNA转录物的高分辨率定量揭示了对单个细胞类型具有优先嗜性的一种或多种AAV血清型。尽管目前所示的数据仅采用了9种血清型变体,但由于条形编码策略允许简单的放大,测定可能支持实质上更多的变体(即,在实施容错编码或纠错编码之前,目前8-nt条形编码可支持65K的唯一条形码和血清型)。该方法还可以应用于除眼类器官或脑类器官以外的体外或体内的任何组织,尤其是当被靶向的细胞亚型已经建立了细胞类型标记物以便于注释时。通过细化AAV血清型的选择以将基因精确递送至患病组织,本方法有潜力用于临床开发。
本公开提出了一种实现对异质群体内每种细胞类型的AAV转导效率和特异性进行多重测量的技术流水线。AAV血清型根据本文公开的新设计原则进行条形码化,并且AAV文库应用于复杂的细胞类型混合物。进行单细胞测序以鉴定每个单细胞含有的细胞类型和AAV条形码两者。将测序获得的数据解卷积成AAV血清型与人细胞类型的矩阵。选择人类器官来测试技术流水线,因为它们概括了例如人脑和眼睛的某些结构和细胞复杂性。该技术流水线鉴定了每种AAV血清型转导存在于类器官内的单个细胞类型的效率和特异性。该技术流水线还使得能够更全面地审视会影响治疗产品的安全性和功效谱的递送载体生物分布。
序列表
<110> 新加坡科技研究局
<120> 评估载体的方法
<130> 71947PCT
<150> SG10202005599R
<151> 2020-06-12
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒 (pZac-CASI-eGFP-条形码-PolyA)
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 1
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 1
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gatcacgaca ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 2
<211> 7911
<212> DNA
<213> 人工序列
<220>
<223> 用于重组衣壳文库的质粒
(pZac-ITR-Rep-rCap-PolyA-ITR)
<220>
<221> misc_feature
<222> (6)..(135)
<223> ITR序列
<220>
<221> 启动子
<222> (201)..(331)
<223> P5启动子序列
<220>
<221> misc_feature
<222> (332)..(2197)
<223> REP基因序列
<220>
<221> misc_feature
<222> (2214)..(4424)
<223> 重组CAP基因序列
<220>
<221> misc_feature
<222> (4219)..(4905)
<223> 聚腺苷酸尾序列
<400> 2
taaggctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60
cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatct acgtagccat 180
gctctaggaa gatcggaatt ggtcctgtat tagaggtcac gtgagtgttt tgcgacattt 240
tgcgacacca tgtggtcacg ctgggtattt aagcccgagt gagcacgcag ggtctccatt 300
ttgaagcggg aggtttgaac gcgcagccgc catgccgggg ttttacgaga ttgtgattaa 360
ggtccccagc gaccttgacg agcatctgcc cggcatttct gacagctttg tgaactgggt 420
ggccgagaag gaatgggagt tgccgccaga ttctgacatg gatctgaatc tgattgagca 480
ggcacccctg accgtggccg agaagctgca gcgcgacttt ctgacggaat ggcgccgtgt 540
gagtaaggcc ccggaggctc ttttctttgt gcaatttgag aagggagaga gctacttcca 600
catgcacgtg ctcgtggaaa ccaccggggt gaaatccatg gttttgggac gtttcctgag 660
tcagattcgc gaaaaactga ttcagagaat ttaccgcggg atcgagccga ctttgccaaa 720
ctggttcgcg gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga 780
gtgctacatc cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac 840
taatatggaa cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc 900
gcagcatctg acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa 960
ttctgatgcg ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg 1020
gctcgtggac aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata 1080
catctccttc aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc 1140
gggaaagatt atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt 1200
ggaggacatt tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca 1260
atatgcggct tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat 1320
ctggctgttt gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac 1380
tgtgcccttc tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt 1440
cgacaagatg gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc 1500
caaagccatt ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca 1560
gatagacccg actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg 1620
gaactcaacg accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact 1680
cacccgccgt ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt 1740
ccggtgggca aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg 1800
agccaagaaa agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga 1860
gtcagttgcg cagccatcga cgtcagacgc ggaagcttcg atcaactacg cggacaggta 1920
ccaaaacaaa tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg 1980
cgagagactg aatcagaatt caaatatctg cttcactcac ggtgtcaaag actgtttaga 2040
gtgctttccc gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact 2100
gtgctacatt catcacatca tgggaaaggt gccagacgct tgcactgctt gcgacctggt 2160
caatgtggac ttggatgact gtgtttctga acaataaatg acttaaacca ggtatggctg 2220
ccgatggtta tcttccagat tggctcgagg acaaccttag tgaaggaatt cgcgagtggt 2280
gggctttgaa acctggagcc cctcaaccca aggcaaatca acaacatcaa gacaacgctc 2340
gaggtcttgt gcttccgggt tacaaatacc ttggacccgg caacggactc gacaaggggg 2400
agccggtcaa cgcagcagac gcggcggccc tcgagcacga caaggcctac gaccagcagc 2460
tcaaggccgg agacaacccg tacctcaagt acaaccacgc cgacgccgag ttccaggagc 2520
ggctcaaaga agatacgtct tttgggggca acctcgggcg agcagtcttc caggccaaaa 2580
agaggcttct tgaacctctt ggtctggttg aggaagcggc taagacggct cctggaaaga 2640
agaggcctgt agagcagtct cctcaggaac cggactcctc cgcgggtatt ggcaaatcgg 2700
gtgcacagcc cgctaaaaag agactcaatt tcggtcagac tggcgacaca gagtcagtcc 2760
cagaccctca accaatcgga gaacctcccg cagccccctc aggtgtggga tctcttacaa 2820
tggcttcagg tggtggcgca ccagtggcag acaataacga aggtgccgat ggagtgggta 2880
gttcctcggg aaattggcat tgcgattccc aatggctggg ggacagagtc atcaccacca 2940
gcacccgaac ctgggccctg cccacctaca acaatcacct ctacaagcaa atctccaaca 3000
gcacatctgg aggatcttca aatgacaacg cctacttcgg ctacagcacc ccctgggggt 3060
attttgactt caacagattc cactgccact tctcaccacg tgactggcag cgactcatca 3120
acaacaactg gggattccgg cctaagcgac tcaacttcaa gctcttcaac attcaggtca 3180
aagaggttac ggacaacaat ggagtcaaga ccatcgccaa taaccttacc agcacggtcc 3240
aggtcttcac ggactcagac tatcagctcc cgtacgtgct cgggtcggct cacgagggct 3300
gcctcccgcc gttcccagcg gacgttttca tgattcctca gtacgggtat ctgacgctta 3360
atgatggaag ccaggccgtg ggtcgttcgt ccttttactg cctggaatat ttcccgtcgc 3420
aaatgctaag aacgggtaac aacttccagt tcagctacga gtttgagaac gtacctttcc 3480
atagcagcta cgctcacagc caaagcctgg accgactaat gaatccactc atcgaccaat 3540
acttgtacta tctctcaaag actattaacg gttctggaca gaatcaacaa acgctaaaat 3600
tcagtgtggc cggacccagc aacatggctg tccagggaag aaactacata cctggaccca 3660
gctaccgaca acaacgtgtc tcaaccactg tgactcaaaa caacaacagc gaatttgctt 3720
ggcctggagc ttcttcttgg gctctcaatg gacgtaatag cttgatgaat cctggacctg 3780
ctatggccag ccacaaagaa ggagaggacc gtttctttcc tttgtctgga tctttaattt 3840
ttggcaaaca aggaactgga agagacaacg tggatgcgga caaagtcatg ataaccaacg 3900
aagaagaaat taaaactact aacccggtag caacggagtc ctatggacaa gtggccacaa 3960
accaccagag tgcccaagca caggcgcaga ccggctgggt tcaaaaccaa ggaatacttc 4020
cgggtatggt ttggcaggac agagatgtgt acctgcaagg acccatttgg gccaaaattc 4080
ctcacacgga cggcaacttt cacccttctc cgctgatggg agggtttgga atgaagcacc 4140
cgcctcctca gatcctcatc aaaaacacac ctgtacctgc ggatcctcca acggccttca 4200
acaaggacaa gctgaactct ttcatcaccc agtattctac tggccaagtc agcgtggaga 4260
tcgagtggga gctgcagaag gaaaacagca agcgctggaa cccggagatc cagtacactt 4320
ccaactatta caagtctaat aatgttgaat ttgctgttaa tactgaaggt gtatatagtg 4380
aaccccgccc cattggcacc agatacctga ctcgtaatct gtaattgctt gttaatcaat 4440
aaaccgttta attcgtttca gttgaacttt ggtctctgcg aagggcgaat tcgtttaaac 4500
ctgcaggact agaccggttg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg 4560
gaattttttg tgtctctcac tcggaaggac atatgggagg gcaaatcatt taaaacatca 4620
gaatgagtat ttggtttaga gtttggcaac atatgcccat atgctggctg ccatgaacaa 4680
aggttggcta taaagaggtc atcagtatat gaaacagccc cctgctgtcc attccttatt 4740
ccatagaaaa gccttgactt gaggttagat tttttttata ttttgttttg tgttattttt 4800
ttctttaaca tccctaaaat tttccttaca tgttttacta gccagatttt tcctcctctc 4860
ctgactactc ccagtcatag ctgtccctct tctcttatgg agatcggatc cgaattcgca 4920
tggctacgta gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat 4980
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 5040
cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagcctaat 5100
taaggcctta attaacctaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 5160
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 5220
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 5280
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 5340
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 5400
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 5460
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 5520
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 5580
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 5640
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 5700
aacgcgaatt ttaacaaaat attaacgttt ataatttcag gtggcatctt tcggggaaat 5760
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5820
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5880
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5940
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 6000
atcgaactgg atctcaatag tggtaagatc cttgagagtt ttcgccccga agaacgtttt 6060
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6120
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 6180
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6240
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6300
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6360
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagtaatg 6420
gtaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6480
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6540
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6600
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6660
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6720
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 6780
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6840
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6900
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6960
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 7020
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 7080
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7140
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 7200
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7260
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7320
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7380
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7440
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7500
gcggcctttt tacggttcct ggccttttgc tgcggttttg ctcacatgtt ctttcctgcg 7560
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7620
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7680
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 7740
cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag 7800
gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga 7860
taacaatttc acacaggaaa cagctatgac catgattacg ccagatttaa t 7911
<210> 3
<211> 8310
<212> DNA
<213> 人工序列
<220>
<223> pSub201
<220>
<221> misc_feature
<222> (7)..(136)
<223> ITR序列
<220>
<221> misc_feature
<222> (320)..(2185)
<223> REP基因序列
<220>
<221> misc_feature
<222> (2202)..(4410)
<223> 重组CAP基因序列
<220>
<221> misc_feature
<222> (4547)..(4674)
<223> ITR序列
<400> 3
cagcagctgc gcgctcgctc gctcactgag gccgcccggg caaagcccgg gcgtcgggcg 60
acctttggtc gcccggcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc 120
atcactaggg gttccttgta gttaatgatt aacccgccat gctacttatc tacgtagcca 180
tgctctagag tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg 240
tggtcacgct gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag 300
gtttgaacgc gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga 360
ccttgacggg catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga 420
atgggagttg ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac 480
cgtggccgag aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc 540
ggaggccctt ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct 600
cgtggaaacc accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga 660
aaaactgatt cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt 720
cacaaagacc agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc 780
caattacttg ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca 840
gtatttaagc gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac 900
gcacgtgtcg cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc 960
ggtgatcaga tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa 1020
ggggattacc tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa 1080
tgcggcctcc aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat 1140
gagcctgact aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc 1200
cagcaatcgg atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc 1260
cgtctttctg ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg 1320
gcctgcaact accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta 1380
cgggtgcgta aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt 1440
gatctggtgg gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct 1500
cggaggaagc aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac 1560
tcccgtgatc gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac 1620
cttcgaacac cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct 1680
ggatcatgac tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa 1740
ggatcacgtg gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag 1800
acccgccccc agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca 1860
gccatcgacg tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg 1920
ttctcgtcac gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa 1980
tcagaattca aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt 2040
gtcagaatct caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca 2100
tcatatcatg ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt 2160
ggatgactgc atctttgaac aataaatgat ttaaatcagg tatggctgcc gatggttatc 2220
ttccagattg gctcgaggac actctctctg aaggaataag acagtggtgg aagctcaaac 2280
ctggcccacc accaccaaag cccgcagagc ggcataagga cgacagcagg ggtcttgtgc 2340
ttcctgggta caagtacctc ggacccttca acggactcga caagggagag ccggtcaacg 2400
aggcagacgc cgcggccctc gagcacgtca aagcctacga ccggcagctc gacagcggag 2460
acaacccgta cctcaagtac aaccacgccg acgcggagtt tcaggagcgc cttaaagaag 2520
atacgtcttt tgggggcaac ctcggacgag cagtcttcca ggcgaaaaag agggttcttg 2580
aacctctggg cctggttgag gaacctgtta agacggctcc gggaaaaaag aggccggtag 2640
agcactctcc tgtggagcca gactcctcct cgggaaccgg aaaggcgggc cagcagcctg 2700
caagaaaaag attgaatttt ggtcagactg gagacgcaga ctcagtacct gacccccagc 2760
ctctcggaca gccaccagca gccccctctg gtctgggaac taatacgatg gctacaggca 2820
gtggcgcacc aatggcagac aataacgagg gcgccgacgg agtgggtaat tcctcgggaa 2880
attggcattg cgattccaca tggatgggcg acagagtcat caccaccagc acccgaacct 2940
gggccctgcc cacctacaac aaccacctct acaaacaaat ttccagccaa tcaggagcct 3000
cgaacgacaa tcactacttt ggctacagca ccccttgggg gtattttgac ttcaacagat 3060
tccactgcca cttttcacca cgtgactggc aaagactcat caacaacaac tggggattcc 3120
gacccaagag actcaacttc aagctcttta acattcaagt caaagaggtc acgcagaatg 3180
acggtacgac gacgattgcc aataacctta ccagcacggt tcaggtgttt actgactcgg 3240
agtaccagct cccgtacgtc ctcggctcgg cgcatcaagg atgcctcccg ccgttcccag 3300
cagacgtctt catggtgcca cagtatggat acctcaccct gaacaacggg agtcaggcag 3360
taggacgctc ttcattttac tgcctggagt actttccttc tcagatgctg cgtaccggaa 3420
acaactttac cttcagctac acttttgagg acgttccttt ccacagcagc tacgctcaca 3480
gccagagtct ggaccgtctc atgaatcctc tcatcgacca gtacctgtat tacttgagca 3540
gaacaaacac tccaagtgga accaccacgc agtcaaggct tcagttttct caggccggag 3600
cgagtgacat tcgggaccag tctaggaact ggcttcctgg accctgttac cgccagcagc 3660
gagtatcaaa gacatctgcg gataacaaca acagtgaata ctcgtggact ggagctacca 3720
agtaccacct caatggcaga gactctctgg tgaatccggg gcccgccatg gcaagccaca 3780
aggacgatga agaaaagttt tttcctcaga gcggggttct catctttggg aagcaaggct 3840
cagagaaaac aaatgtgaac attgaaaagg tcatgattac agacgaagag gaaatcggaa 3900
caaccaatcc cgtggctacg gagcagtatg gttctgtatc taccaacctc cagagaggca 3960
acagacaagc agctaccgca gatgtcaaca cacaaggcgt tcttccaggc atggtctggc 4020
aggacagaga tgtgtacctt caggggccca tctgggcaaa gattccacac acggacggac 4080
attttcaccc ctctcccctc atgggtggat tcggacttaa acaccctcct ccacagattc 4140
tcatcaagaa caccccggta cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg 4200
cttccttcat cacacagtac tccacgggac acggtcagcg tggagatcga gtgggagctg 4260
cagaaggaaa acagcaaacg ctggaatccc gaaattcagt acacttccaa ctacaacaag 4320
tctgttaatc gtggacttac cgtggatact aatggcgtgt attcagagcc tcgccccatt 4380
ggcaccagat acctgactcg taatctgtaa ttgcttgtta atcaataaac cgtttaattc 4440
gtttcagttg aactttggtc tctgcgtatt tctttcttat ctagtttcca tgctctagag 4500
catggctacg tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg 4560
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 4620
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgccagctg 4680
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 4740
cgaatggaat tccagacgat tgagcgtcaa aatgtaggta tttccatgag cgtttttcct 4800
gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga tagtttgagt 4860
tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac aacggttaat 4920
ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa cacttctcag 4980
gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt tagctcccgc 5040
tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat agtacgcgcc 5100
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 5160
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5220
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5280
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5340
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5400
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5460
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5520
ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct tcctgttttt 5580
ggggcttttc tgattatcaa ccggggtaca tatgattgac atgctagttt tacgattacc 5640
gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag cctttgtaga 5700
gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac ggttgaatat 5760
catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc tttacctaca 5820
cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta tccttgcgtt 5880
gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg tacaaccgat 5940
ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc ttgcctgtat 6000
gatttattgg atgttggaat tcctgatgcg gtattttctc cttacgcatc tgtgcggtat 6060
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 6120
gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 6180
cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 6240
atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc ctatttttat aggttaatgt 6300
catgataata atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac 6360
ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 6420
ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 6480
cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 6540
ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 6600
tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 6660
cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 6720
actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 6780
aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 6840
tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 6900
ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 6960
tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 7020
gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 7080
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 7140
tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 7200
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 7260
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 7320
gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 7380
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 7440
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 7500
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 7560
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 7620
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 7680
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 7740
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 7800
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 7860
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 7920
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 7980
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 8040
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 8100
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 8160
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 8220
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 8280
tctccccgcg cgttggccga ttcattaatg 8310
<210> 4
<211> 6867
<212> DNA
<213> 人工序列
<220>
<223> pZac-ITR-CASI-rCAP-PolyA-ITR
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1254)..(3464)
<223> 重组CAP基因序列
<220>
<221> misc_feature
<222> (3470)..(3856)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (3916)..(4056)
<223> ITR序列
<400> 4
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggatggctg 1260
ccgatggtta tcttccagat tggctcgagg acaacctctc tgagggcatt cgcgagtggt 1320
gggacttgaa acctggagcc ccgaagccca aagccaacca gcaaaagcag gacgacggcc 1380
ggggtctggt gcttcctggc tacaagtacc tcggaccctt caacggactc gacaaggggg 1440
agcccgtcaa cgcggcggac gcagcggccc tcgagcacga caaggcctac gaccagcagc 1500
tcaaagcggg tgacaatccg tacctgcggt ataaccacgc cgacgccgag tttcaggagc 1560
gtctgcaaga agatacgtct tttgggggca acctcgggcg agcagtcttc caggccaaga 1620
agcgggttct cgaacctctc ggtctggttg aggaaggcgc taagacggct cctggaaaga 1680
aacgtccggt agagcagtcg ccacaagagc cagactcctc ctcgggcatc ggcaagacag 1740
gccagcagcc cgctaaaaag agactcaatt ttggtcagac tggcgactca gagtcagtcc 1800
ccgatccaca acctctcgga gaacctccag caacccccgc tgctgtggga cctactacaa 1860
tggcttcagg cggtggcgca ccaatggcag acaataacga aggcgccgac ggagtgggta 1920
atgcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc atcaccacca 1980
gcacccgcac ctgggccttg cccacctaca ataaccacct ctacaagcaa atctccagtg 2040
cttcaacggg ggccagcaac gacaaccact acttcggcta cagcaccccc tgggggtatt 2100
ttgatttcaa cagattccac tgccactttt caccacgtga ctggcagcga ctcatcaaca 2160
acaattgggg attccggccc aagagactca acttcaaact cttcaacatc caagtcaagg 2220
aggtcacgac gaatgatggc gtcacaacca tcgctaataa ccttaccagc acggttcaag 2280
tcttctcgga ctcggagtac cagcttccgt acgtcctcgg ctctgcgcac cagggctgcc 2340
tccctccgtt cccggcggac gtgttcatga ttccgcaata cggctacctg acgctcaaca 2400
atggcagcca agccgtggga cgttcatcct tttactgcct ggaatatttc ccttctcaga 2460
tgctgagaac gggcaacaac tttaccttca gctacacctt tgaggaagtg cctttccaca 2520
gcagctacgc gcacagccag agcctggacc ggctgatgaa tcctctcatc gaccaatacc 2580
tgtattacct gaacagaact caaaatcagt ccggaagtgc ccaaaacaag gacttgctgt 2640
ttagccgtgg gtctccagct ggcatgtctg ttcagcccaa aaactggcta cctggaccct 2700
gttatcggca gcagcgcgtt tctaaaacaa aaacagacaa caacaacagc aattttacct 2760
ggactggtgc ttcaaaatat aacctcaatg ggcgtgaatc catcatcaac cctggcactg 2820
ctatggcctc acacaaagac gacgaagaca agttctttcc catgagcggt gtcatgattt 2880
ttggaaaaga gagcgccgga gcttcaaaca ctgcattgga caatgtcatg attacagacg 2940
aagaggaaat taaagccact aaccctgtgg ccaccgaaag atttgggacc gtggcagtca 3000
atttccagag cagcagcaca gaccctgcga ccggagatgt gcatgctatg ggagcattac 3060
ctggcatggt gtggcaagat agagacgtgt acctgcaggg tcccatttgg gccaaaattc 3120
ctcacacaga tggacacttt cacccgtctc ctcttatggg cggctttgga ctcaagaacc 3180
cgcctcctca gatcctcatc aaaaacacgc ctgttcctgc gaatcctccg gcggagtttt 3240
cagctacaaa gtttgcttca ttcatcaccc aatactccac aggacaagtg agtgtggaaa 3300
ttgaatggga gctgcagaaa gaaaacagca agcgctggaa tcccgaagtg cagtacacat 3360
ccaattatgc aaaatctgcc aacgttgatt ttactgtgga caacaatgga ctttatactg 3420
agcctcgccc cattggcacc cgttacctta cccgtcccct gtaaccggtt ggctaataaa 3480
ggaaatttat tttcattgca atagtgtgtt ggaatttttt gtgtctctca ctcggaagga 3540
catatgggag ggcaaatcat ttaaaacatc agaatgagta tttggtttag agtttggcaa 3600
catatgccca tatgctggct gccatgaaca aaggttggct ataaagaggt catcagtata 3660
tgaaacagcc ccctgctgtc cattccttat tccatagaaa agccttgact tgaggttaga 3720
ttttttttat attttgtttt gtgttatttt tttctttaac atccctaaaa ttttccttac 3780
atgttttact agccagattt ttcctcctct cctgactact cccagtcata gctgtccctc 3840
ttctcttatg gagatcggat ccgaattcgc atggctacgt agataagtag catggcgggt 3900
taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 3960
gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 4020
cctcagtgag cgagcgagcg cgcagcctaa ttaaggcctt aattaaccta attcactggc 4080
cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc 4140
agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc 4200
ccaacagttg cgcagcctga atggcgaatg ggacgcgccc tgtagcggcg cattaagcgc 4260
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 4320
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 4380
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 4440
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 4500
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 4560
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 4620
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 4680
tataatttca ggtggcatct ttcggggaaa tgtgcgcgga acccctattt gtttattttt 4740
ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata 4800
atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt 4860
tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc 4920
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaata gtggtaagat 4980
ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct 5040
atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca 5100
ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg 5160
catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa 5220
cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg 5280
ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga 5340
cgagcgtgac accacgatgc ctgtagtaat ggtaacaacg ttgcgcaaac tattaactgg 5400
cgaactactt actctagctt cccggcaaca attaatagac tggatggagg cggataaagt 5460
tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg 5520
agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc 5580
ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca 5640
gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc 5700
atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat 5760
cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 5820
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 5880
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 5940
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 6000
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 6060
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 6120
gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 6180
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 6240
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 6300
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 6360
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 6420
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 6480
ctgcggtttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 6540
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 6600
agtgagcgag gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc 6660
gattcattaa tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa 6720
cgcaattaat gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc 6780
ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga 6840
ccatgattac gccagattta attaagg 6867
<210> 5
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒的ITR序列
(pZac-CASI-eGFP-条形码-PolyA), 用于重组衣壳文库的
质粒(pZac-ITR-Rep-rCap-PolyA-ITR)和pSub201
<400> 5
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 6
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒的ITR序列
(pZac-CASI-eGFP-barcode-PolyA), 用于重组衣壳文库的
质粒 (pZac-ITR-Rep-rCap-PolyA-ITR) 和
pZac-ITR-CASI-rCAP-PolyA-ITR
<400> 6
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag cctaattaag g 141
<210> 7
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> pSub201的ITR序列
<400> 7
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgc 128
<210> 8
<211> 1056
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒的CASI启动子序列
(pZac-CASI-eGFP-条形码-PolyA)和pZac-ITR-CASI-rCAP-PolyA-ITR
<400> 8
ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 60
ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 120
ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 180
tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 240
tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 300
cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca tctccccccc 360
ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc 420
gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc 480
gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat 540
ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagtcgc 600
tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc cgccccggct 660
ctgactgacc gcgttactaa aacaggtaag tccggcctcc gcgccgggtt ttggcgcctc 720
ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc agacgaaggg cgcagcgagc 780
gtcctgatcc ttccgcccgg acgctcagga cagcggcccg ctgctcataa gactcggcct 840
tagaacccca gtatcagcag aaggacattt taggacggga cttgggtgac tctagggcac 900
tggttttctt tccagagagc ggaacaggcg aggaaaagta gtcccttctc ggcgattctg 960
cggagggatc tccgtggggc ggtgaacgcc gatgatgcct ctactaacca tgttcatgtt 1020
ttcttttttt ttctacaggt cctgggtgac gaacag 1056
<210> 9
<211> 720
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒的eGFP基因序列
(pZac-CASI-eGFP-条形码-PolyA)
<400> 9
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 10
<211> 387
<212> DNA
<213> 人工序列
<220>
<223> 条形码化的AAV衣壳质粒的聚腺苷酸尾序列
(pZac-CASI-eGFP-条形码-PolyA), pZac-ITR-CASI-rCAP-PolyA-ITR和
用于重组衣壳文库的质粒
(pZac-ITR-Rep-rCap-PolyA-ITR)
<400> 10
tggctaataa aggaaattta ttttcattgc aatagtgtgt tggaattttt tgtgtctctc 60
actcggaagg acatatggga gggcaaatca tttaaaacat cagaatgagt atttggttta 120
gagtttggca acatatgccc atatgctggc tgccatgaac aaaggttggc tataaagagg 180
tcatcagtat atgaaacagc cccctgctgt ccattcctta ttccatagaa aagccttgac 240
ttgaggttag atttttttta tattttgttt tgtgttattt ttttctttaa catccctaaa 300
attttcctta catgttttac tagccagatt tttcctcctc tcctgactac tcccagtcat 360
agctgtccct cttctcttat ggagatc 387
<210> 11
<211> 131
<212> DNA
<213> 人工序列
<220>
<223> 用于重组衣壳文库的质粒的P5启动子序列
(pZac-ITR-Rep-rCap-PolyA-ITR)
<400> 11
ggtcctgtat tagaggtcac gtgagtgttt tgcgacattt tgcgacacca tgtggtcacg 60
ctgggtattt aagcccgagt gagcacgcag ggtctccatt ttgaagcggg aggtttgaac 120
gcgcagccgc c 131
<210> 12
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 用于重组衣壳文库的质粒的REP基因序列
(pZac-ITR-Rep-rCap-PolyA-ITR)
<400> 12
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc ggacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagactga atcagaattc aaatatctgc 1680
ttcactcacg gtgtcaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcacatcat gggaaaggtg 1800
ccagacgctt gcactgcttg cgacctggtc aatgtggact tggatgactg tgtttctgaa 1860
caataa 1866
<210> 13
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> pSub201的REP基因序列
<400> 13
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacgg gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 14
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 用于重组衣壳文库的质粒的重组CAP基因序列
(pZac-ITR-Rep-rCap-PolyA-ITR)
<400> 14
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 15
<211> 2209
<212> DNA
<213> 人工序列
<220>
<223> pSub201的重组CAP基因序列
<400> 15
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgtcaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggg 1560
cccgccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtgaaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcggaac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca cggtcagcgt 2040
ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc tggaatcccg aaattcagta 2100
cacttccaac tacaacaagt ctgttaatcg tggacttacc gtggatacta atggcgtgta 2160
ttcagagcct cgccccattg gcaccagata cctgactcgt aatctgtaa 2209
<210> 16
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> pZac-ITR-CASI-rCAP-PolyA-ITR的重组CAP基因序列
<400> 16
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211
<210> 17
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP1 (带有条形码序列1)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列1
<400> 17
taaatcgatc gatcacgac 19
<210> 18
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP2 (带有条形码序列2)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列2
<400> 18
taaatcgatc gacagtggt 19
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP3 (带有条形码序列3)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列3
<400> 19
taaatcgatc gcagatcca 19
<210> 20
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP4 (带有条形码序列4)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列4
<400> 20
taaatcgatc gacaaacgg 19
<210> 21
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP5 (带有条形码序列5)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列5
<400> 21
taaatcgatc gacccagca 19
<210> 22
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP6 (带有条形码序列6)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列6
<400> 22
taaatcgatc gaacccctc 19
<210> 23
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP7 (带有条形码序列7)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列7
<400> 23
taaatcgatc gcccaacct 19
<210> 24
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP8 (带有条形码序列8)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列8
<400> 24
taaatcgatc gcaccacac 19
<210> 25
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP9 (带有条形码序列9)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列9
<400> 25
taaatcgatc ggaaaccca 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP10 (带有条形码序列10)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列10
<400> 26
taaatcgatc gtgtgacca 19
<210> 27
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP11 (带有条形码序列11)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列11
<400> 27
taaatcgatc gagggtcaa 19
<210> 28
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 编辑genome.fa参考GFP12 (带有条形码序列12)
<220>
<221> misc_feature
<222> (12)..(19)
<223> 条形码序列12
<400> 28
taaatcgatc gaggagtgg 19
<210> 29
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP2-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 2
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gacagtggta ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 30
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP3-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 3
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 30
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gcagatccaa ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 31
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP4-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 4
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 31
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gacaaacgga ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 32
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP5-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 5
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 32
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gacccagcaa ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 33
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP6-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 6
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 33
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gaacccctca ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 34
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP7-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 7
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 34
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gcccaaccta ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 35
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP8-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 8
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 35
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gcaccacaca ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 36
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP9-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 9
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 36
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc ggaaacccaa ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 37
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP10-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 10
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 37
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gtgtgaccaa ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 38
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP11-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 11
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 38
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gagggtcaaa ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 39
<211> 5413
<212> DNA
<213> 人工序列
<220>
<223> pZac-CASI-GFP12-PolyA
<220>
<221> misc_feature
<222> (1)..(130)
<223> ITR序列
<220>
<221> 启动子
<222> (197)..(1252)
<223> CASI启动子序列
<220>
<221> misc_feature
<222> (1268)..(1987)
<223> eGFP基因序列
<220>
<221> misc_feature
<222> (2002)..(2009)
<223> AAV 条形码 12
<220>
<221> misc_feature
<222> (2016)..(2402)
<223> 聚腺苷酸尾序列
<220>
<221> misc_feature
<222> (2462)..(2602)
<223> ITR序列
<400> 39
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 240
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactaaaaca ggtaagtccg gcctccgcgc 900
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 960
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 1020
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 1080
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 1140
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg atgcctctac 1200
taaccatgtt catgttttct ttttttttct acaggtcctg ggtgacgaac aggctagcgc 1260
cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 1320
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 1380
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 1440
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 1500
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 1560
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 1620
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 1680
ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca 1740
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 1800
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 1860
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 1920
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 1980
caagtaataa taaatcgatc gaggagtgga ccggttggct aataaaggaa atttattttc 2040
attgcaatag tgtgttggaa ttttttgtgt ctctcactcg gaaggacata tgggagggca 2100
aatcatttaa aacatcagaa tgagtatttg gtttagagtt tggcaacata tgcccatatg 2160
ctggctgcca tgaacaaagg ttggctataa agaggtcatc agtatatgaa acagccccct 2220
gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt ttttatattt 2280
tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt tttactagcc 2340
agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct cttatggaga 2400
tcggatccga attcgcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 2460
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 2520
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 2580
cgagcgcgca gcctaattaa ggccttaatt aacctaattc actggccgtc gttttacaac 2640
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 2700
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 2760
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2820
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2880
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2940
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 3000
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 3060
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 3120
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 3180
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg 3240
gcatctttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 3300
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 3360
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 3420
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 3480
gtgcacgagt gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc 3540
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 3600
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3660
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3720
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3780
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3840
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3900
cgatgcctgt agtaatggta acaacgttgc gcaaactatt aactggcgaa ctacttactc 3960
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 4020
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 4080
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 4140
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 4200
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 4260
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4320
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4380
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4440
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4500
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4560
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4620
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4680
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4740
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4800
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4860
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4920
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4980
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgc ggttttgctc 5040
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 5100
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 5160
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 5220
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 5280
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 5340
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 5400
gatttaatta agg 5413
<210> 40
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 在质粒骨架pZac2.1-CMV-eGFP.rgb中在eGFP转基因终止密码子
之后的用于构建条形码化的eGFP质粒短序列
<220>
<221> misc_feature
<222> (15)..(22)
<223> n是a, c, g, 或 t
<400> 40
taataaatcg atcgnnnnnn nn 22
<210> 41
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> GFP_NGS_P7Amp引物
<400> 41
gtgactggag ttcagacgtg tgctcttccg atctgggcat ggacgagctg tacaag 56
<210> 42
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> GFP_NGS_P5Amp引物
<400> 42
acactctttc cctacacgac gctcttccga tctgcaatga aaataaattt cctttattag 60
ccaacc 66
<210> 43
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> P5通用引物
<400> 43
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 44
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> P7条形码接头_UDI0001引物
<400> 44
caagcagaag acggcatacg agatagcgct aggtgactgg agttcagacg tgtgctcttc 60
cgatct 66

Claims (33)

1.一种在单细胞水平上评估载体的转导效率和/或特异性的方法,所述方法包括:
a)提供多个不同的载体;
b)用所述多个不同的载体转导异质细胞群;
c)将所述异质细胞群分隔成多个区室,其中每个区室包含来自所述异质细胞群的单细胞;
d)对每个分隔的细胞进行核苷酸测序;
e)在每个分隔的细胞中检测所述不同的载体中的任一者或多者的存在。
2.根据权利要求1所述的方法,其中所述方法还包括:
f)基于使用步骤d)中获得的测序结果确定的每个分隔的细胞的基因表达模式和/或表观遗传特征,将所述细胞分类为特定的细胞类型。
3.根据前述权利要求中任一项所述的方法,其中特定载体对特定细胞类型的转导效率通过所述特定细胞类型的已被检测出对于所述特定载体的存在呈阳性的细胞的百分比来确定。
4.根据前述权利要求中任一项所述的方法,其中特定载体对特定细胞类型的转导效率通过将在所述特定细胞类型的细胞中检测到所述特定载体存在的频率与在所述特定细胞类型的细胞中检测到另一载体存在的频率进行比较来评估。
5.根据前述权利要求中任一项所述的方法,其中特定载体对特定细胞类型相对于另一细胞类型的转导特异性通过将在所述特定细胞类型的细胞中检测到所述特定载体存在的频率与在另一特定细胞类型的细胞中检测到所述特定载体存在的频率进行比较来评估。
6.根据前述权利要求中任一项所述的方法,其中所述多个不同的载体中的每一者包含寡核苷酸条形码序列,其中任意两个不同载体之间的所述条形码序列不同。
7.根据前述权利要求中任一项所述的方法,其中所述条形码序列位于所述载体中的表达盒上,其中所述盒的表达使得产生包含所述条形码序列的RNA分子,其中所述RNA分子还包含聚腺苷酸尾。
8.根据权利要求7所述的方法,其中所述条形码序列位于所述RNA分子的允许对所述条形码序列进行测序的区域上。
9.根据权利要求8所述的方法,其中所述条形码序列在距所述聚腺苷酸尾98个核苷酸的距离内。
10.根据权利要求6至9中任一项所述的方法,其中所述条形码序列的长度为5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸。
11.根据权利要求10所述的方法,其中所述条形码序列的长度为8个核苷酸。
12.根据权利要求1至5中任一项所述的方法,其中所述多个不同的载体中的每一者包含标记物多核苷酸,其中任意两个不同的载体之间的所述标记物多核苷酸不同;并且其中所述标记物多核苷酸编码一种或多种蛋白质,所述一种或多种蛋白质在表达时形成包封所述标记物多核苷酸的蛋白质包膜,使得在所述载体转染后,每种标记物多核苷酸被所述标记物多核苷酸编码的所述一种或多种蛋白质包封。
13.根据权利要求12所述的方法,其中所述标记物多核苷酸位于所述载体中的表达盒上,其中所述盒的表达使得产生包含所述标记物多核苷酸的RNA分子,其中所述RNA分子还包含聚腺苷酸尾。
14.根据权利要求12或13所述的方法,其中所述标记物多核苷酸是病毒衣壳编码基因,其中由所述标记物多核苷酸表达的衣壳包封所述标记物多核苷酸。
15.根据权利要求12至14中任一项所述的方法,其中所述病毒衣壳编码基因具体是AAV衣壳编码基因。
16.根据前述权利要求中任一项所述的方法,其中步骤e)包括检测对每个不同的载体具有特异性的一条或多条标记物序列的存在;其中当每个载体包含唯一的条形码序列时,所述一条或多条标记物序列包含所述条形码序列;其中当每个载体包含唯一的标记物多核苷酸时,所述一条或多条标记物序列包含所述标记物多核苷酸。
17.根据权利要求16所述的方法,其中步骤e)包括将步骤d)中获得的序列读段与参考数据集进行匹配。
18.根据权利要求17所述的方法,其中所述参考数据集包含所述多个不同的病毒载体的基因组和/或转录组,和/或包含在所述多个不同的病毒载体中的条形码,和/或包含在所述多个不同的病毒载体中的标记物多核苷酸。
19.根据前述权利要求中任一项所述的方法,其中所述区室是油滴。
20.根据前述权利要求中任一项所述的方法,其中所述核苷酸测序是RNA测序。
21.根据前述权利要求中任一项所述的方法,其中所述核苷酸测序是DNA测序。
22.根据前述权利要求中任一项所述的方法,其中所述载体选自由以下项组成的组:病毒载体、假病毒载体、病毒样颗粒载体、脂质体载体、外泌体载体、纳米颗粒及其组合;其中所述载体包含DNA、RNA、修饰的RNA、修饰的DNA或其组合。
23.根据前述权利要求中任一项所述的方法,其中所述载体包括病毒载体,其中所述病毒载体选自由以下项组成的组:腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、冠状病毒载体、肠病毒载体、逆转录病毒载体或其组合。
24.根据权利要求23所述的方法,其中所述病毒载体是AAV载体。
25.根据权利要求24所述的方法,其中所述病毒载体选自由以下项组成的组:AAV 1型(AAV-1)、AAV 2型(AAV-2)、AAV 3型(AAV-3)、AAV4型(AAV-4)、AAV 5型(AAV-5)、AAV 6型(AAV-6)、AAV 7型(AAV-7)、AAV 8型(AAV-8)、AAV 9型(AAV9)、AAV 10型(AAV10)、AAV 11型(AAV11)、AAV 12型(AAV12)、AAV 13型(AAV13)、rh10、AAVDJ、AAVAnc80、AAV-PHP.S、AAV-PHP.eB、AAV-LK03、AAV2-7m8、其AAV变体及其组合。
26.根据权利要求22至25中任一项所述的方法,其中所述多个不同的病毒载体包括不同科的病毒载体、不同属的病毒载体、不同种的病毒载体、不同血清型的病毒载体、其携带不同突变的病毒载体或其组合。
27.根据前述权利要求中任一项所述的方法,其中所述异质细胞群包括植物细胞、动物细胞、真菌细胞或其组合。
28.根据权利要求27所述的方法,其中所述异质细胞群包括哺乳动物细胞。
29.根据权利要求27所述的方法,其中所述异质细胞群包括人细胞。
30.根据权利要求28或29所述的方法,其中所述异质细胞群在被转导时包含在动物或人受试者中。
31.根据权利要求1至29中任一项所述的方法,其中所述异质细胞群是培养的细胞。
32.根据权利要求1至29中任一项所述的方法,其中所述异质细胞群获自一种或多种培养的类器官。
33.根据权利要求32所述的方法,其中所述一种或多种培养的类器官选自由眼类器官、脑类器官、上皮类器官、肾类器官、肺类器官、胰腺类器官、心脏类器官和肝类器官组成的组。
CN202180042704.3A 2020-06-12 2021-06-11 在单细胞水平上评估载体转导效率和/或特异性的方法 Pending CN115698332A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10202005599R 2020-06-12
SG10202005599R 2020-06-12
PCT/SG2021/050338 WO2021251905A1 (en) 2020-06-12 2021-06-11 A method for assessing transduction efficiency and/or specificity of vectors at single cell level

Publications (1)

Publication Number Publication Date
CN115698332A true CN115698332A (zh) 2023-02-03

Family

ID=78845830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180042704.3A Pending CN115698332A (zh) 2020-06-12 2021-06-11 在单细胞水平上评估载体转导效率和/或特异性的方法

Country Status (3)

Country Link
US (1) US20230257736A1 (zh)
CN (1) CN115698332A (zh)
WO (1) WO2021251905A1 (zh)

Also Published As

Publication number Publication date
WO2021251905A1 (en) 2021-12-16
US20230257736A1 (en) 2023-08-17

Similar Documents

Publication Publication Date Title
AU2019204429B2 (en) Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR102135239B1 (ko) 세포 면역요법을 위한 방법 및 조성물
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
KR20200015701A (ko) 레트 증후군에서의 MeCP2의 안전한 발현을 위한 자가-조절 AAV 벡터
CA2763792C (en) Expression cassettes derived from maize
CN107635575A (zh) 重组glut1腺相关病毒载体构建体以及用于恢复glut1表达的相关方法
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
CN109451729B (zh) 工程化病毒载体减少了炎症和免疫反应的诱导
CA3103485A1 (en) Adeno-associated virus vector delivery of muscle specific micro-dystrophin to treat muscular dystrophy
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
AU2024202827A1 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
KR20220130093A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR102409420B1 (ko) 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법
CN116348149A (zh) 用于肌营养不良症的腺相关病毒载体递送
CN115698332A (zh) 在单细胞水平上评估载体转导效率和/或特异性的方法
KR20240021765A (ko) 근이영양증 치료를 위한 재조합 aav 벡터의 제조
CN110016481A (zh) 一种pX335-xCas9n载体及其构建方法和应用
KR20230012530A (ko) 이소프레노이드의 생산을 위한 개선된 방법
CN115867295A (zh) 用于靶向hpv感染细胞的组合物和方法
CN117750983A (zh) 用于使用硬纤毛蛋白双重载体***治疗感觉神经性听力损失的组合物和方法
CN117642509A (zh) 产生用于治疗肌营养不良的重组aav载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination