CN114555805A

CN114555805A - 用于鉴定细胞类型命运特化的调控物的组合物和方法

Info

Publication number: CN114555805A
Application number: CN202080058262.7A
Authority: CN
Inventors: 查尔斯·A·格斯巴赫; 约书亚·B·布莱克; 詹妮弗·权; 肖纳克·阿德卡尔
Original assignee: Duke University
Current assignee: Duke University
Priority date: 2019-08-19
Filing date: 2020-08-19
Publication date: 2022-05-27
Also published as: AU2020331968A1; AU2020331968A8; KR20220047623A; US20220307015A1; EP4017971A4; WO2021034987A1; EP4017971A1; CA3151336A1; JP2022545461A

Abstract

本文公开了用于选择具有作为神经元特异性转录因子的活性的多核苷酸的组合物、方法和***。所述***可以包含编码报告蛋白和泛神经元标志物的多核苷酸、Cas蛋白和靶向假定转录因子的指导RNA(gRNA)的文库。还提供了筛选神经元特异性转录因子的方法。

Description

用于鉴定细胞类型命运特化的调控物的组合物和方法

与相关申请的交叉引用

本申请要求2019年8月19日提交的美国临时专利申请号62/888,922、2019年8月20日提交的美国临时专利申请号62/889,361和2020年1月14日提交的美国临时专利申请号62/961,084的优先权，每个所述临时申请整体通过参考并入本文。

关于联邦资助研究的陈述

本发明在美国国立卫生研究院(National Institutes of Health)授予的资助号为R21NS103007、DP2OD008586、R01DA036865、F31NS105419和T32GM008555以及由美国国家科学基金会(National Science Foundation)授予的资助号为EFMA-1830957的政府支持下做出。美国政府在本发明中具有一定权利。

技术领域

本公开涉及用于鉴定细胞类型命运特化的调控物的DNA靶向组合物例如CRISPR/Cas9组合物和方法。

背景技术

对细胞命运进行重编程的方法的出现彻底改变了再生医学、疾病建模和细胞治疗。鉴于越来越多的证据将特定的神经元亚型定义为神经***疾病的起源，在体外产生这些亚型的能力可能有助于这些复杂疾病的研究和治疗。一些当前的细胞重编程方法过表达转录因子(TF)，以重新连接起始细胞的转录程序。尽管这种方法已成功地产生了临床相关的细胞类型，但以这种方式重新编程的细胞类型仍然相对较少。已做出努力对所有假定人类转录因子的集合进行分类并定义它们的组织特异性表达，然而，在细胞命运特化中的作用已被经验验证的TF相对较少。此外，为细胞重编程应用选择决定命运的TF通常依赖于评估一小部分TF或使用计算模型来预测最佳TF组合的方法。当前使用TF开发新的细胞重编程方案的策略缓慢、低效且费力。以前的研究主要在小鼠中进行，但从小鼠到人类细胞重编程的变化不可忽视。小鼠细胞与人类细胞的可塑性存在固有差异。小鼠细胞通常更易于重编程，通常获得更高的转化效率和更短的成熟时间。因此，人类细胞通常需要额外的辅助因子或完全不同的方案，以便实现与其小鼠对应物可比的转化结果。鉴于人脑中神经元细胞类型的多样性可能是由多种多样的TF编程的，因此仍然需要继续开发高通量方法来***地分析TF在指导神经元细胞类型身份中的因果作用，特别是与人类密切相关的神经元细胞类型。

发明内容

一方面，本公开涉及一种多核苷酸，其可以编码：(1)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或(2)选自NGN3和ASCL1或其组合的第一神经元特异性转录因子；以及选自下述的第二神经元特异性转录因子：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7；(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

另一方面，本公开涉及一种用于提高神经元特异性基因的表达的***，所述***可以包含：(a)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或(b)靶向选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的第一gRNA；和靶向选自下述的第二神经元特异性转录因子的第二gRNA：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7；(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX；以及Cas蛋白或融合蛋白。在某些实施方式中，所述融合蛋白可以包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有选自转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性。在某些实施方式中，所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2、NKX2-2、HES3和ZFP36L1。在某些实施方式中，所述第二神经元特异性转录因子可以选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2和NKX2-2。在某些实施方式中，所述第二神经元特异性转录因子可以选自HES3和ZFP36L1。在某些实施方式中，所述第二神经元特异性转录因子可以选自：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7，并且其中所述第二多肽结构域具有转录激活活性。在某些实施方式中，所述融合蛋白可以包含^VP64dCas9^VP64或dCas9-p300。在某些实施方式中，所述第二神经元特异性转录因子可以选自：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX，并且其中所述第二多肽结构域具有转录阻遏活性。在某些实施方式中，所述融合蛋白可以包含dCas9-KRAB。在某些实施方式中，所述第一gRNA和第二gRNA各自单独地可以包含12-22个碱基对的靶DNA序列的互补多核苷酸序列，随后是前间区序列邻近基序，并且任选地其中所述gRNA结合并靶向和/或包含含有选自SEQ ID NO：38-87的序列的多核苷酸，并且任选地其中所述第一gRNA和/或第二gRNA包含crRNA、tracrRNA或其组合。

本公开的另一方面提供了一种分离的多核苷酸，其可以编码本文中详述的***。

本公开的另一方面提供了一种载体，其可以包含本文中详述的分离的多核苷酸。

另一方面，本公开涉及一种细胞，其可以包含本文中详述的分离的多核苷酸或本文中详述的载体。

另一方面，本公开涉及一种提高干细胞衍生的神经元的成熟的方法。所述方法可以包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

本公开的另一方面提供了一种提高干细胞衍生的神经元的成熟的方法。所述方法可以包括：提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

本公开的另一方面提供了一种提高干细胞向神经元的转化的方法。所述方法可以包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

本公开的另一方面提供了一种提高干细胞向神经元的转化的方法。所述方法可以包括：提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

本公开的另一方面涉及一种治疗有需要的对象的方法。所述方法可以包括：(a)提高所述对象中的干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

本公开的另一方面提供了一种治疗有需要的对象的方法。所述方法可以包括：提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

在某些实施方式中，提高所述第一神经元特异性转录因子的水平可以包括下述至少一者：(a)向所述干细胞给药编码所述第一神经元特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述第一神经元特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第一神经元特异性转录因子的锌指蛋白或靶向所述第一神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第一神经元特异性转录因子的gRNA。在某些实施方式中，提高所述第二神经元特异性转录因子的水平可以包括下述至少一者：(a)向所述干细胞给药编码所述第二神经元特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述第二神经元特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。在某些实施方式中，降低所述第二神经元特异性转录因子的水平可以包括向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录阻遏活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。在某些实施方式中，所述干细胞可以不经历多能阶段直接转化成神经元。在某些实施方式中，所述干细胞可以是多能干细胞、诱导多能干细胞或胚胎干细胞。

本公开的另一方面提供了一种用于选择具有作为细胞类型特异性转录因子的活性的多核苷酸的***。所述***可以包含：编码报告蛋白和细胞类型标志物的多核苷酸；融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白，并且第二多肽结构域具有转录激活活性；以及指导RNA(gRNA)的文库，每个gRNA靶向不同的假定细胞类型特异性转录因子。在某些实施方式中，所述细胞类型特异性转录因子可以是神经元特异性转录因子，其中所述细胞类型标志物是神经元标志物，并且其中所述神经元标志物包括TUBB3。在某些实施方式中，所述细胞类型特异性转录因子可以是肌肉特异性转录因子，其中所述细胞类型标志物是成肌标志物，并且其中所述成肌标志物包括PAX7。在某些实施方式中，所述细胞类型特异性转录因子可以是软骨细胞特异性转录因子，其中所述细胞类型标志物是胶原标志物，并且其中所述胶原标志物包括COL2A1。在某些实施方式中，所述报告蛋白可以包括mCherry。

本公开的另一方面提供了一种分离的多核苷酸序列，其可以编码本文中详述的***。

本公开的另一方面提供了一种载体，其可以包含本文中详述的分离的多核苷酸序列。

本公开的另一方面提供了一种细胞，其可以包含本文中详述的***、本文中详述的分离的多核苷酸序列或本文中详述的载体或其组合。

本公开的另一方面提供了一种筛选细胞类型特异性转录因子的方法。所述方法可以包括：用本文中详述的***以约0.2的感染复数(MOI)转导细胞群体，使得大部分所述细胞各自独立地包括一种gRNA并靶向一种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平。在某些实施方式中，所述报告蛋白的高表达可以被定义为在所述细胞群体内的前5％中；并且当所述假定转录因子对应于在所述具有报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述假定转录因子作为细胞类型特异性转录因子。

本公开的另一方面提供了一种筛选一对细胞类型特异性转录因子的方法。所述方法可以包括：用本文中详述的***以约0.2的感染复数(MOI)转导细胞群体，使得大部分所述细胞各自独立地包括两种gRNA并靶向两种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中所述两种gRNA的水平。在某些实施方式中，所述报告蛋白的高表达可以被定义为在所述细胞群体内的前5％中；并且当所述假定转录因子对应于在所述具有报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述两种假定转录因子作为一对细胞类型特异性转录因子。在某些实施方式中，在每个细胞中所述报告蛋白的表达水平可以在从转导起约4天后确定。在某些实施方式中，在每个细胞中所述报告蛋白的表达水平可以通过流式细胞术来确定。在某些实施方式中，在每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平可以通过深度测序来确定。在某些实施方式中，相对于非靶向gRNA，所述gRNA可以将所述细胞中所述报告蛋白的表达提高约2-50％。

本公开的另一方面提供了一种多核苷酸，其编码选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子。

本公开的另一方面提供了一种用于提高肌肉特异性基因的表达的***。所述***可以包含：(a)选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子；或(b)融合蛋白，其中所述融合蛋白包含两个异源多肽结构域。在某些实施方式中，第一多肽结构域可以包含Cas蛋白、靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的锌指蛋白或靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有选自转录激活活性、转录释放因子活性、组蛋白修饰活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性，并且其中当所述第一多肽结构域包含Cas蛋白时，所述***还包含靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的gRNA。在某些实施方式中，所述融合蛋白可以包含^VP64dCas9^VP64或dCas9-p300。

本公开的另一方面提供了一种细胞，其可以包含本文中详述的分离的多核苷酸或本文中详述的载体。

本公开的另一方面提供了一种提高干细胞向成肌细胞的分化的方法。所述方法可以包括：提高所述干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。

本公开的另一方面提供了一种治疗有需要的对象的方法。所述方法可以包括：提高来自于所述对象的干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。在某些实施方式中，提高所述肌肉特异性转录因子的水平可以包括下述至少一者：(a)向所述干细胞给药编码所述肌肉特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述肌肉特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述肌肉特异性转录因子的锌指蛋白或靶向所述肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外给药靶向所述肌肉特异性转录因子的gRNA。

本公开还提供了其他方面和实施方式，它们根据下述具体实施方式和附图将变得显而易见。

附图说明

图1A-图1G.高通量CRISPRa筛选鉴定候选神经源性转录因子。(图1A)人类多能干细胞中决定神经元命运的转录因子的CRISPRa筛选的示意图。将^VP64dCas9^VP64 TUBB3-2A-mCherry报告细胞系用CAS-TF合并慢病毒文库以0.2的MOI转导，并通过FACS分拣mCherry表达。每个细胞箱中的gRNA丰度通过深度测序来测量，并通过差异表达分析来鉴定被耗竭或富集的gRNA。(图1B)从以前的基因组广度的CRISPRa文库(Horlbeck，2016，紧凑且高度活跃的下一代文库(Compact and highly active next-generation libraries)，eLife)提取CAS-TF gRNA文库，其由靶向1496种假定转录因子的8,505个gRNA组成。(图1C)将TUBB3-2A-mCherry细胞在mCherry信号的基础上分拣出表达最高和最低的5％的细胞。还对未分拣的主体细胞群体进行采样，以建立基线gRNA分布。(图1D)高mCherry和未分拣的细胞群体之间归一化的gRNA计数的差异表达分析。红色数据点表示通过差异DESeq2分析FDR<0.01(n＝3个生物学平行样)。蓝色数据点表示一组100个乱序非靶向gRNA。(图1E)在CAS-TF筛选中鉴定到的17种TF的TF家族类型分析。(图1F)在CAS-TF筛选中鉴定到的17种TF和三组随机的17种TF的跨多个发育时间点和解剖学脑区的平均基因表达的比较。(图1G)来自于三种已知原神经TF的所有5种gRNA与随机选择的5种乱序gRNA相比，来自于高mCherry和低mCherry细胞群体之间的差异表达分析的gRNA丰度的变化倍数。也参见图7A-图7D。

图2A-图2F.许多候选因子从多能干细胞产生神经元细胞。(图2A)在gRNA转导后4天17种因子的TUBB3-2A-mCherry表达的验证(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将所有组与乱序物1比较，门控被设定到对于乱序gRNA来说1％阳性，n＝3个生物学平行样。误差条表示SEM)。(图2B)对来自于ATOH1和NR5A1的所有5种gRNA来说，通过个体验证评估的TUBB3-2A-mCherry表达与来自于文库选集的差异表达分析的gRNA丰度变化倍数之间的关系。(图2C)在gRNA转导后4天17种因子对泛神经元标志物NCAM(上图)和MAP2(下图)的诱导的验证(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将所有组与乱序物1比较，n＝3个生物学平行样，误差条表示SEM)。(图2D)在用带有编码指定因子的cDNA的四环素诱导型慢病毒载体或用仅仅M2rtTA阴性对照转导后4天，iPSC的免疫荧光染色，用于评估TUBB3表达。标尺条，50μm。(图2E)在与星形胶质细胞长期共培养后，使用指定因子的iPSC的免疫荧光染色，用于评估MAP2表达。标尺条，50μm。(图2F)在用指定因子转导后4天，H9 hESC的免疫荧光染色，用于评估TUBB3表达。也参见图8A-图8C、图9A-图9D和图10A-图10E。

图3A-图3G.组合gRNA筛选鉴定神经元分化的辅助因子。(图3A)人类多能干细胞中决定神经元命运的转录因子的组合CRISPRa筛选的示意图。使用双gRNA表达载体将神经源性因子与CAS-TF gRNA文库共表达。使用sgASCL1和sgNGN3进行两次独立的筛选。(图3B)对于sgNGN3成对筛选来说，显著性(P值)相对于基于高mCherry与未分拣的细胞群体之间的差异DESeq2分析的gRNA丰度变化倍数的火山图。红色数据点指示FDR<0.001(n＝3个生物学平行样)。蓝色数据点指示一组100种乱序非靶向gRNA。(图3C)sgASCL1相比于sgNGN3成对筛选，对于两种筛选中所有正富集的gRNA来说gRNA丰度的变化倍数。(图3D)对于来自于两种成对筛选的阳性命中物来说，TF家族类型和在多能干细胞中的基础表达水平的分析。(图3E)预计单独没有活性但在sgASCL1和sgNGN3成对筛选中具有协同活性的一组TF的gRNA丰度的变化倍数。TF辅助因子的验证对于sgNGN3来说使用TUBB3-2A-mCherry(图3F)，并且对于sgASCL1来说使用NCAM染色(图3G)。(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将所有组与乱序物1比较，n＝3个生物学平行样，误差条表示SEM)。也参见图11A-图11B和图12A-图12D。

图4A-图4F.由单种转录因子产生的神经元的转录多样性。(图4A)在ATOH1和NEUROG3衍生的神经元中检测到的差异上调的基因(FDR<0.01并且log2(变化倍数)>1)。(图4B)在ATOH1和NEUROG3之间共有且上调的2846个基因的集合的富集基因本体(GO)条目。(图4C)在分析的所有平行样品中一组泛神经元基因的表达水平(log2(TPM+1))。(图4D)ATOH1和NEUROG3衍生的神经元之间所有检测到的基因的比较。红色和蓝色圆圈分别代表使用NEUROG3或ATOH1时差异表达的基因。(图4E)在仅使用NEUROG3或ATOH1时上调的标志物的GO条目分析。(图4F)一组多巴胺能和谷氨酸能标志物的表达水平(log2(TPM+1))和相应的z-分值。

图5A-图5N.使用成对转录因子产生的神经元的转录和功能成熟。(图5A)在源自于成对TF的神经元中检测到的差异上调的基因(FDR<0.01并且log2(变化倍数)>1)。(图5B)使用成对TF与单独的NEUROG3相比，在差异上调的基因集合中富集的GO条目。分别添加RUNX3或E2F7时(图5C)NTRK3和(图5D)CDKN1A的上调。(图5E)在添加LHX8时差异上调的基因集合的SynGO条目。(图5F)一组突触标志物的表达水平(下图：log2(变化倍数)；上图：log2(TPM+1))。使用单独的或与LHX8组合的NEUROG3产生的神经元第7天的包括(图5G)静息膜电位(V_rest)、(图5H)输入电阻(R_m)和(图5I)膜电容(C_m)在内的膜性质的平均值。使用单独的或与LHX8组合的NEUROG3产生的神经元第7天的包括(图5J)动作电位阈值(AP_threshold)、(图5K)动作电位高度(AP_height)和(图5L)动作电位半宽度(AP_half-width)在内的动作电位性质的平均值。(图5M)产生的动作电位平均数量相对于注入电流振幅的变化(*p<0.05，双向ANOVA)。(图5N)具有失败(左)、单个(中)或多个(右)动作电位的细胞的示例性迹线。相应的饼图表示所分析的细胞对单个去极化电流注入做出响应不能产生AP(深色度)、产生单个AP(中色度)或产生多个AP(浅色度)的总分数。对于图5G至图5L来说：ns，不显著；*p<0.05，非配对t-检验(如果数据通过正态性验证；α＝0.05)或Mann-Whitney检验(如果数据未通过正态性验证；α＝0.05)；对于单独的NEUROG3来说n＝19个细胞；对于NEUROG3+LHX8来说n＝22个细胞。

图6A-图6I.组合gRNA筛选鉴定神经元分化的负调控物。(图6A)sgASCL1与sgNGN3成对筛选相比，两种筛选中所有负富集的gRNA的gRNA丰度变化倍数。(图6B)TF的一个子集的验证，评估了TUBB3-2A-mCherry阳性细胞的百分数和(图6C)泛神经元标志物NCAM的表达(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将所有组与sgNGN3+乱序gRNA条件进行比较，n＝3个生物学平行样，误差条表示SEM)。(图6D)同样的负调控物在H9 hESC中的验证。(图6E)iPSC与ESC相比，gRNA对神经元分化的影响的比较。(图6F)正交基因激活和阻遏的示意图。(图6G)在测试的所有三个组之间，通过z-分值定量的变化最大的100个基因的相对表达。(图6H)在ZFP36L1敲减的sgNGN3衍生的神经元中，在差异表达的基因集合中富集的GO条目。(图6I)与神经元分化和形态发育相关的差异表达的基因的示例性集合。也参见图13A-图13C和图14A-图14D。

图7A-图7D.TUBB3-2A-mCherry报告细胞系的产生和表征。(图7A)使用Cas9核酸酶和供体模板，在人类多能干细胞系中TUBB3的外显子4中敲入P2A-mCherry表达盒的示意图。(图7B)使用^VP64dCas9^VP64和一组4个靶向NEUROG2启动子的gRNA，在多能干细胞中靶向激活内源NEUROG2。靶向激活NEUROG2时NCAM(中)和MAP2(右)的表达(n＝2个生物学平行样)。(图7C)使用^VP64dCas9^VP64和一组4个靶向启动子的gRNA靶向激活NEUROG2时，通过流式细胞术测定的TUBB3-2A-mCherry表达。(图7D)在用^VP64dCas9^VP64和gRNA激活NEUROG2后，在分拣的具有最高和最低mCherry表达的TUBB3-2A-mCherry细胞中TUBB3和MAP2的表达(n＝1个生物学平行样)。

图8A-图8C.具有单种富集的gRNA的TF的验证。(图8A)在单因子CAS-TF筛选中，mCherry高表达细胞相比于mCherry低表达细胞之间gRNA丰度的变化倍数的排序表。ASCL1、ATOH7和ATOH8均具有显著富集的单种gRNA。(图8B)sgASCL1、sgATOH7和sgATOH8的个体验证，以评估gRNA转导后4天(图8B)TUBB3-2A-mCherry表达的百分率和(图8C)MAP2(左)和NCAM(右)表达(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将所有组与乱序gRNA进行比较，n＝3个生物学平行样，误差条表示SEM)。

图9A-图9D.使用^VP64dCas9^VP64内源诱导TF。(图9A)使用^VP64dCas9^VP64和富集排名靠前的gRNA对在单因子CAS-TF筛选中富集的17种TF的子集的诱导倍数(相对于乱序gRNA的变化倍数，n＝2个生物学平行样)。(图9B)每种TF的诱导倍数与该TF的基础表达相对于GAPDH表达之间的相关性。(图9C)对于两种NEUROG2 gRNA来说，来自于单因子CAS-TF筛选的gRNA富集的比较。(图9D)这两种NEUROG2 gRNA的TF诱导和下游神经元标志物的表达的验证(*p<0.05，通过全局单向ANOVA和Tukey事后检验，比较了所述两种NEUROG2 gRNA，n＝3个生物学平行样，误差条表示SEM)。

图10A-图10E.CAS-TF子文库gRNA筛选。(图10A)在人类多能干细胞中决定神经元命运的转录因子的CRISPRa子文库筛选的示意图。将^VP64dCas9^VP64 TUBB3-2A-mCherry报告细胞系用CAS-TF合并慢病毒文库以0.2的MOI转导，并通过FACS分拣mCherry的表达。每个细胞箱中的gRNA丰度通过深度测序来测量，并通过差异表达分析来鉴定被耗竭或富集的gRNA。(图10B)从几个以前的基因组广度的CRISPRa文库提取CAS-TF gRNA子文库，其由靶向109种假定转录因子的3,874个gRNA组成(每个基因～33个gRNA)。(图10C)高mCherry和低mCherry细胞群体之间归一化的gRNA计数的差异表达分析。红色数据点表示通过差异DESeq2分析FDR<0.01(n＝3个生物学平行样)。(图10D)每个基因富集的gRNA的百分率的排序表。(图10E)在gRNA转导后4天，10种因子的TUBB3-2A-mCherry表达的验证(n＝2个生物学平行样)。

图11A-图11B.使用sgASCL1的成对gRNA筛选。对于sgASCL1成对筛选来说，显著性(P值)相比于(图11A)高mCherry相比于未分拣的细胞群体和(图11B)高mCherry相比于低mCherry细胞群体的基于差异DESeq2分析的gRNA丰度变化倍数的火山图。红色数据点表示FDR<0.001(n＝3个生物学平行样)。

图12A-图12D.单因子和成对CAS-TF筛选的比较。高mCherry表达与低mCherry表达的细胞之间gRNA丰度的变化倍数；(图12A和图12B)sgNGN3相比于单因子CAS-TF筛选，在两种筛选中所有正(图12A)和负(图12B)富集的gRNA；以及(图12C和图12D)sgASCL1相比于单因子CAS-TF筛选，在两种筛选中所有正(图12C)和负(图12D)富集的gRNA。

图13A-图13C.使用正交CRISPR***的基因激活和阻遏。(图13A)使用靶向启动子的dSaCas9^KRAB和单种gRNA 7天，在多能干细胞中靶向阻遏ZFP36L1和HES3(*p<0.05，通过双尾t-检验，n＝3个生物学平行样，误差条表示SEM)。在ZFP36L1和HES3敲减细胞系中使用sgNGN3(图13B)或sgASLC1(图13C)对分化的影响(*p<0.05，通过全局单向ANOVA和Dunnett事后检验，将使用sgNGN3或sgASCL1的所有组与接受乱序非靶向金黄色葡萄球菌(S.aureus)gRNA的对照细胞系进行比较，n＝3个生物学平行样，误差条表示SEM)。

图14A-图14D.使用基于正交CRISPR的基因调控的基因组广度的表达分析。具有(图14A)HES3敲减和(图14B)ZFP36L1敲减的sgNGN3衍生的神经元的差异表达分析。红色数据点表示使用DESeq2的差异表达分析FDR<0.01(n＝3个生物学平行样)。(图14C)在示出的三种条件下，酿脓链球菌(S.pyogenes)gRNA靶基因NEUROG3的表达。(图14D)在示出的三种条件下，使用酿脓链球菌gRNA慢病毒载体上GFP的表达作为转导水平和gRNA表达的替代物。

图15A-图15E.人类ESC中PAX7-2a-GFP报告细胞系的产生和验证。(图15A)PAX7基因靶向策略。gRNA被设计成靶向PAX7的终止密码子，并设计了含有可切除选择标记的2a-GFP供体表达盒用于通过同源重组进行***。(图15B)使用同源臂之外的引物对克隆进行的PCR验证显示出报告基因表达盒的杂合***。(图15C)2.6kb产物的测序确认了2a-GFP报告基因表达盒的***。(图15D)通过CRISPRa靶向单个克隆的PAX7启动子用于激活证实了GFP的变化。(图15E)排名前15％和后15％的表达GFP的细胞分别对应于高和低PAX7 mRNA表达。

图16A-图16E.PAX7的上游调控物的CRa-TF筛选。(图16A)CRa-TF筛选的示意图。将稳定表达^VP64dCas9^VP64的H9 Pax7-2a-GFP细胞用CRa-TF慢病毒文库以0.2的MOI转导。使用小分子CHIRON99021(CHIR)和bFGF将细胞选择并分化14天。分拣出前10％和后10％的表达GFP的细胞，并对DNA进行深度测序以回收gRNA。(图16B)分化第14天的柱状图证实了与无文库对照相比，在CRa-TF筛选的三份平行样中出现了GFP+群体。(图16C)MA图证实了与未分拣的细胞相比，在前10％的细胞中显著的gRNA命中(p<0.05)。(图16D)各个gRNA命中物的验证，证实了PAX7的诱导。(图16E)命中物的cDNA递送也证实了PAX7的诱导(平均值±SEM，n＝3)。

图17A-图17C.用于鉴定PAX7辅助因子的组合CRa-TF筛选。(图17A)在初始筛选的第二个版本中，对慢病毒构建物进行了重新设计，以包括靶向PAX7的gRNA。将慢病毒以0.2的MOI转导，使得每个细胞接受一个拷贝的PAX7 gRNA和来自于CRa-TF文库的gRNA。(图17B)分化第7天的柱状图证实了与无文库对照相比，在第二种CRa-TF筛选的三份平行样中GFP变化。(图17C)维恩图，示出了来自于所述筛选的两个版本的独特和重叠的显著(p<0.05)命中物。

图18A-图18D.通过CRa-TF命中物诱导成肌谱系的验证。(图18A)通过命中物的诱导型表达进行验证的示意图。将表达TetO-^VP64dCas^VP64的H9 PAX7-2a-GFP用各个gRNA命中物和rtTA3转导。将细胞在dox存在下分化28天。在分析前14天通过撤除dox来诱导终末分化。(图18B)终末分化后的RNA分析证实了与非靶向gRNA对照相比PAX7表达提高。(图18C)终末分化后的RNA分析证实了与非靶向gRNA对照相比MYOG表达提高(平均值±SEM，n＝3)。

(图18D)细胞的图像。

图19A-图19B.多克隆反式激活物细胞系的产生和验证。(图19A)^VP64dCas9^VP64-2A-杀稻瘟菌素表达盒的示意图。(图19B)在NGN2转导后内源NGN2的激活。

图20A-图20C.TF靶向gRNA筛选以鉴定软骨形成的调控物。(图20A)实验示意图，演示了在报告细胞系中激活物细胞系的产生的gRNA文库的慢病毒包装。在文库转导和成软骨分化后，分拣出GFP^高和GFP^低细胞并从两个群体回收gRNA。使用下一代测序比较gRNA的差异表达。(图20B)文库转导和成软骨分化后GFP荧光的柱状图。门示出了GFP^高和GFP^低的分拣群体。(图20C)火山图，示出了在GFP^高和GFP^低群体中显著富集的gRNA(红色)以及未满足显著性标准但具有高(>3)的log₂(变化倍数)的gRNA。更大的火山图参见附录B。

图21A-图21C.在定向分化的背景下SOX9的验证。(图21A)实验设计的示意图。具有SOX9过表达的报告hiPSC分化成生骨节，然后在第6天进行流式细胞术。(图21B)未修饰的细胞系与含有(红色)和不含(黑色)SOX9慢病毒的报告细胞系在第6天的流式细胞术的比较。(图21C)分化第6天的数据与第21天的GFP荧光(蓝色)的比较。

具体实施方式

本文中详细描述了细胞类型特异性转录因子和使用它们提高细胞类型特异性基因的表达、提高干细胞衍生的神经元的成熟、提高干细胞向神经元的转化效率和治疗有需要的对象的方法。本文中还详细描述了一种高通量合并CRISPR激活(CRISPRa)筛选方法，用于绘制人类细胞命运调控物图并剖析假定的人类转录因子对多能干细胞的神经元细胞命运特化的贡献。CRISPRa筛选用于在高通量方法中剖析人类基因组中的数千种假定转录因子。与传统方法相比，基于CRISPR的gRNA文库更容易设计和规模缩放，并且更易于测试组合基因相互作用和质询非编码基因组。使用神经元定型的报告物，对人类多能干细胞中所有转录因子的神经源性活性进行了剖析。进行了单因子筛选以鉴定人类神经元命运的主要调控物，并且鉴定到许多已知和以前未表征的TF。进行了组合筛选，并鉴定到分别增强或减少神经元分化的协同和拮抗性TF相互作用。TF被发现可以提高转化效率，影响亚型特化，并促进体外衍生的人类神经元的成熟。

总的来说，本工作突出了DNA靶向***例如基于CRISPR的技术在调节内源性基因表达方面的效用，并为鉴定细胞命运调控物在定义任何感兴趣的细胞类型中的因果作用提供了一个框架。从本文详述的研究挑选出的一组候选原神经转录因子可以充当建立方案的资源，以产生人脑中的每种细胞类型。

1.定义

除非另有定义，否则本文中使用的所有技术和科学术语均具有与本领域普通技术人员通常理解的相同的含义。在有冲突的情况下，以包括定义在内的本文件为准。下文描述优选的方法和材料，尽管与本文中描述的相似或等效的方法和材料也可用于本发明的实践和试验。本文中提到的所有出版物、专利申请、专利和其他参考文献整体通过参考并入本文。本文公开的材料、方法和实例仅仅是说明性的而不打算是限制性的。

当在本文中使用时，术语“包含”、“包括”、“具有”、“可以”、“含有”及其变化形式打算作为开放性过渡短语、术语或词语，其不排除其他行动或结构的可能性。没有具体数目的指称包括复数指称物，除非上下文明确叙述不是如此。本公开还设想了“包含”本文中呈现的实施方式或要素、“由它们组成”和“基本上由它们组成”的其他实施方式，不论是否明确阐述。

对于本文中的数字范围的叙述来说，明确设想了在其间具有相同精度的每个居间数字。例如，对于6-9的范围来说，除了6和9之外还设想了数字7和8，并且对于6.0-7.0的范围来说，明确设想了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。

当在本文中使用时，术语“约”在应用于一个或多个感兴趣的值时，是指与所陈述的参比值相近的值。在某些情况下，术语“约”是指落于所陈述的参比值在任一方向上(大于或小于)的20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小范围之内的值的范围，除非另有陈述或从上下文明确看出不是如此(除了这样的数字将超过可能值的100％的情况之外)。

在本文中可互换使用的“腺相关病毒”或“AAV”是指属于细小病毒科的依赖病毒属的一种感染人类和一些其他灵长类动物的小病毒。目前尚不知道AAV会引起疾病，因此所述病毒引起非常温和的免疫应答。

当在本文中使用时，“氨基酸”是指天然存在的氨基酸和非天然的合成氨基酸，以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸。氨基酸在本文中可以通过它们通常已知的三字母符号或由IUPAC-IUB生物化学命名委员会推荐的单字母符号指称。氨基酸包括侧链和多肽骨架部分。

当在本文中使用时，“结合区”是指核酸酶靶区域内被所述核酸酶识别并结合的区域。

当在本文中使用时，“编码序列”或“编码核酸”意味着包含编码蛋白质的核苷酸序列的核酸(RNA或DNA分子)。编码序列还可以包括可操作连接到调控元件的起始和终止信号，包括启动子和多聚腺苷化信号，其能够在所述核酸给药到的个体或哺乳动物的细胞中指导表达。编码序列可以是密码子优化的。

当在本文中使用时，“互补体”或“互补的”意味着核酸可以在所述核酸分子的核苷酸或核苷酸类似物之间包含Watson-Crick(例如A-T/U和C-G)或Hoogsteen碱基配对。“互补性”是指两个核酸序列之间享有的性质，使得当它们彼此反平行对齐时，每个位置处的核苷酸碱基将是互补的。

术语“对照”、“参比水平”和“参比”在本文中可互换使用。所述参比水平可以是预定的值或范围，其被用作评估测量结果的基准。当在本文中使用时，“对照组”是指对照对象的组。所述预定水平可以是来自于对照组的截止值。所述预定水平可以是来自于对照组的平均值。截止值(或预定截止值)可以通过自适应指数模型(AIM)方法来确定。截止值(或预定截止值)可以通过来自于患者组的生物样品的对象工作曲线(ROC)分析来确定。正如生物学技术领域中公知的，ROC分析是某种测试区分一种情况与另一种情况、例如确定每种标志物在鉴定CRC患者中的表现的能力的确定。ROC分析的描述提供在P.J.Heagerty等(Biometrics 2000,56,337-44)中，其公开内容整体通过参考并入本文。或者，截止值可以通过患者组的生物学样品的四分位数分析来确定。例如，截止值可以通过选择对应于第25至75百分位数范围之内的任何值的值，优选为对应于第25百分位数、第50百分位数或第75百分位数、更优选为第75百分位数的值来确定。此类统计分析可以使用本领域中已知的任何方法来进行，并且可以通过任何数目的可商购的软件包(例如来自于Analyse-itSoftware Ltd.,Leeds,UK；StataCorp LP,College Station,TX；SAS Institute Inc.,Cary,NC.)来进行。靶或蛋白质活性的健康或正常水平或范围可以根据标准实践来定义。对照可以是不具有本文详述的激动剂的对象或细胞。对照可以是疾病状态已知的对象或来自于其的样品。所述对象或来自于其的样品可能是健康的、患病的、在治疗前患病的、在治疗期间患病的或在治疗后患病的或其组合。

当在本文中使用时，“融合蛋白”是指通过两个或更多个联结的最初编码独立蛋白质的基因的翻译产生的嵌合蛋白。所述融合基因的翻译产生单一多肽，其具有源自于每个最初的独立蛋白质的功能特性。

当在本文中使用时，“遗传构建物”是指包含编码蛋白的多核苷酸的DNA或RNA分子。所述编码序列包括可操作连接到调控元件的起始和终止信号，包括启动子和多聚腺苷化信号，其能够在所述核酸分子给药到的个体的细胞中指导表达。当在本文中使用时，术语“可表达形式”是指含有可操作连接到编码蛋白的编码序列必需调控元件的基因构建物，使得当存在于个体的细胞中时，所述编码序列被表达。

当在本文中使用时，“基因组编辑”是指改变基因。基因组编辑可以包括校正或恢复突变基因。基因组编辑可以包括敲除基因例如突变基因或正常基因。基因组编辑可用于通过改变感兴趣的基因来治疗疾病或增强肌肉修复。

当在本文中使用时，“同一的”或“同一性”在两个或更多个核酸或多肽序列的情形中意味着所述序列在规定的区域内具有规定百分数的相同残基。所述百分数可以如下计算：将所述两个序列最佳比对，在所述规定区域内比较所述两个序列，确定在两个序列中存在相同残基的位置的数目以得到匹配位置数，将所述匹配位置数除以所述规定区域中的总位置数并将结果乘以100，以得到序列同一性百分数。在所述两个序列具有不同长度或所述比对产生一个或多个交错末端和所述比较的规定区域只包括单个序列的情况下，单个序列的残基包括在所述计算的分母中但不包括在分子中。当比较DNA和RNA时，胸腺嘧啶(T)和尿嘧啶(U)可以被认为是等同的。同一性分析可以人工或通过使用计算机序列算法例如BLAST或BLAST 2.0来进行。

在本文中可互换使用的“突变基因”和“突变的基因”是指已经历可检测突变的基因。突变基因已经历影响基因的正常传递和表达的变化，例如遗传物质的丧失、获得或交换。当在本文中使用时，“破坏的基因”是指具有导致过早终止密码子的突变的突变基因。所述破坏的基因的产物相对于全长未破坏基因的产物被截短。

当在本文中使用时，“正常基因”是指尚未经历变化例如遗传物质的丧失、获得或交换的基因。所述正常基因经历正常的基因传递和基因表达。例如，正常基因可以是野生型基因。

当在本文中使用时，“核酸”或“寡核苷酸”或“多核苷酸”意味着共价连接在一起的至少两个核苷酸。单链的描绘也定义了互补链的序列。因此，多核苷酸也涵盖所描绘的单链的互补链。多核苷酸的许多变体可用于与给定多核苷酸相同的目的。因此，多核苷酸也涵盖基本上同一的多核苷酸及其互补体。单链提供了可以在严紧杂交条件下与靶序列杂交的探针。因此，多核苷酸还涵盖在严紧杂交条件下杂交的探针。多核苷酸可以是单链或双链的，或者可能含有双链和单链序列两者的部分。多核苷酸可以是天然或合成的核酸、DNA、基因组DNA、cDNA、RNA或杂合体，其中所述多核苷酸可以含有脱氧核糖核苷酸和核糖核苷酸的组合以及包括例如尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤在内的碱基的组合。多核苷酸可以通过化学合成方法或通过重组方法来获得。

当在本文中使用时，“可操作连接的”意味着基因的表达在空间上与其相连的启动子的控制之下。启动子可能位于在其控制之下的基因的5'(上游)或3'(下游)。启动子与基因之间的距离可以与在所述启动子所源自的基因中所述启动子与其控制的基因之间的距离大致相同。正如本领域中已知的，可以容许这个距离的变动而不丧失启动子功能。

当在本文中使用时，“部分有功能的”描述了由突变基因编码并具有比有功能蛋白质更低但比无功能蛋白质更高的生物学活性的蛋白质。

“肽”或“多肽”是通过肽键相连的两个或更多个氨基酸的连接的序列。多肽可以是天然多肽、合成多肽或天然和合成多肽的修饰或组合。肽和多肽包括蛋白质例如结合蛋白、受体和抗体。术语“多肽”、“蛋白质”和“肽”在本文中可互换使用。“一级结构”是指特定肽的氨基酸序列。“二级结构”是指多肽内局部有序的三维结构。这些结构通常被称为结构域，例如酶结构域、细胞外结构域、跨膜结构域、孔结构域和胞质尾部结构域。“结构域”是多肽的形成所述多肽的紧凑单元的部分，通常为15至350个氨基酸长。示例性结构域包括具有酶活性或配体结合活性的结构域。典型的结构域由组织化较低的区段例如β-折叠和α-螺旋的区段组成。“三级结构”是指多肽单体的完整三维结构。“四级结构”是指由独立的三级单元的非共价缔合形成的三维结构。“基序”是多肽序列的一部分，并包括至少两个氨基酸。基序的长度可以是2至20、2至15或2至10个氨基酸。在某些实施方式中，基序包括3、4、5、6或7个连续氨基酸。结构域可以由一系列相同类型的基序组成。

在本文中可互换使用的“过早终止密码子”或“框外终止密码子”是指DNA序列中的无义突变，其在野生型基因中通常不存在的位置中产生终止密码子。过早终止密码子可以产生与全长版本的蛋白质相比被截短或更短的蛋白质。

当在本文中使用时，“启动子”意味着能够在细胞中赋予、激活或增强核酸表达的合成或天然来源的分子。启动子可以包含一个或多个特定的转录调控序列，以进一步增强表达和/或改变其空间表达和/或时间表达。启动子还可以包含远端增强子或阻遏蛋白元件，它们可以位于距转录起始位点多达数千碱基对处。启动子可以源自于包括病毒、细菌、真菌、植物、昆虫和动物在内的来源。启动子可以组成性地或相对于在其中进行表达的细胞、组织或器官或相对于发生表达的发育阶段或对外部刺激例如生理胁迫、病原体、金属离子或诱导剂做出响应而差异性地调节基因组分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵基因-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV40晚期启动子、人类U6(hU6)启动子和CMV IE启动子。

当在本文中使用时，“样品”或“试验样品”可以指要在其中检测或确定靶的存在和/或水平的任何样品，或包含本文中详述的DNA靶向***或其组分的任何样品。样品可以包括液体、溶液、乳液或悬液。样品可以包括医学样品。样品可以包括任何生物学流体或组织，例如血液、全血、血液级分例如血浆和血清、肌肉、组织间隙液、汗液、唾液、尿液、泪液、滑膜液、骨髓、脑脊液、鼻分泌物、痰液、羊水、支气管肺泡灌洗液、胃灌洗液、呕吐物、粪便、肺组织、外周血单核细胞、总白细胞、***细胞、脾细胞、扁桃体细胞、癌细胞、肿瘤细胞、胆汁、消化液、皮肤或其组合。在某些实施方式中，样品包含等分试样。在其他实施方式中，样品包含生物学流体。样品可以通过本领域中已知的任何手段来获得。样品可以在从患者获得时直接使用，或者可以进行预处理，例如通过过滤、蒸馏、提取、浓缩、离心、干扰组分的失活、添加试剂等，以便以本文中讨论的或本领域中已知的某种方式改变所述样品的特性。

在本文中可互换使用的“间隔物”和“间隔区”是指TALE或锌指靶区域中位于两个TALE或锌指蛋白的结合区之间但不是所述结合区的一部分的区域。

当在本文中使用时，“对象”或“患者”可以意味着想要或需要本文中描述的组合物或方法的动物。对象可以是人类或非人类。对象可以是任何脊椎动物。对象可以是哺乳动物。哺乳动物可以是灵长动物或非灵长动物。哺乳动物可以是非灵长动物例如狗、猫、马、奶牛、猪、小鼠、大鼠、小鼠、骆驼、美洲驼、山羊、兔、绵羊、仓鼠和豚鼠。哺乳动物可以是灵长动物例如人类。哺乳动物可以是非人类灵长动物例如猴、食蟹猴、恒河猴、黑猩猩、大猩猩、猩猩和长臂猿。对象可以处于任何年龄或发育阶段，例如成人、青少年或婴儿。对象可以是雄性。对象可以是雌性。在某些实施方式中，对象具有特定遗传标志物。对象可能正经历其他形式的治疗。

“基本上同一的”可以指第一和第二氨基酸或多核苷酸序列分别在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100个氨基酸或核苷酸的区域内至少具有60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的同一性。

“转录激活因子样效应物”或“TALE”是指识别并结合特定DNA序列的蛋白质结构。“TALE DNA结合结构域”是指包括串联的被称为RVD模块的33-35个氨基酸的重复序列的阵列的DNA结合结构域，每个所述模块特异性识别DNA的单个碱基对。RVD模块可以以任何顺序排列，以组装识别限定序列的阵列。TALE DNA结合结构域的结合特异性由所述RVD阵列和随后的单个20个氨基酸的截短的重复序列决定。“重复序列可变双残基”或“RVD”是指TALEDNA结合结构域的包括33-35个氨基酸的DNA识别基序(也被称为“RVD模块”)内的一对相邻氨基酸残基。所述RVD决定RVD模块的核苷酸特异性。可以将RVD模块组合以产生RVD阵列。当在本文中使用时，“RVD阵列长度”是指RVD模块的数目，其对应于被TALEN识别的TALEN靶区域、即结合区内的核苷酸序列的长度。TALE DNA结合结构域可以具有12至27个RVD模块，每个模块含有一个RVD并识别DNA的单个碱基对。已鉴定到识别四种可能的DNA核苷酸(A、T、C和G)的特异性RVD。由于TALE DNA结合结构域是模块式的，因此可以将识别所述四种不同DNA核苷酸的重复序列连接在一起以识别任何特定DNA序列。然后可以将这些靶向的DNA结合结构域与催化结构域组合以产生有功能的酶，包括人造转录因子、甲基转移酶、整合酶、核酸酶和重组酶。

当在本文中使用时，“靶基因”是指编码已知或假定基因产物的任何核苷酸序列。靶基因可以是参与遗传疾病的突变的基因。在某些实施方式中，所述靶基因是编码转录因子的基因。

当在本文中使用时，“靶区域”是指基于CRISPR/Cas9的基因编辑***被设计与其结合的靶基因的区域。

当在本文中使用时，“转入基因”是指含有已从一个生物体分离并被引入到不同生物体中的基因序列的基因或遗传物质。这个非本源DNA区段可以在转基因生物体中保留产生RNA或蛋白质的能力，或者它可以改变所述转基因生物体的遗传密码的正常功能。转入基因的引入具有改变生物体的表型的潜力。

“治疗”在指称保护对象对抗疾病时，意味着抑制、阻遏、改善或完全消除所述疾病。预防疾病涉及在所述疾病发作之前向对象给药本发明的组合物。抑制疾病涉及在诱导所述疾病之后但在其临床表现出现之前向对象给药本发明的组合物。阻遏或改善疾病涉及在所述疾病临床表现出现之后向对象给药本发明的组合物。

对于多核苷酸来说，本文使用的“变体”意味着(i)参比核苷酸序列的一部分或片段；(ii)参比核苷酸序列或其部分的互补体；(iii)与参比核酸或其互补体基本上同一的核酸；或(iv)在严紧条件下与参比核酸、其互补体或与其基本上同一的序列杂交的核酸。

对于肽或多肽来说，“变体”通过氨基酸的***、缺失或保守替换而在氨基酸序列上有差异，但保留至少一种生物学活性。变体也可以指具有与参比蛋白质所具有的氨基酸序列基本上同一的氨基酸序列，并保留至少一种生物学活性的蛋白质。“生物学活性”的代表性实例包括被特异性抗体或多肽结合的能力或促进免疫应答的能力。变体可以指其功能性片段。变体也可以指多肽的多个拷贝。所述多个拷贝可以是串联的或者被连接物分开。氨基酸的保守替换，即将氨基酸用性质(例如亲水性、带电荷区域的程度和分布)相近的不同氨基酸代替，在本领域中被认为通常涉及微小改变。这些微小改变可以部分地通过考虑氨基酸的亲水指数来鉴定，正如本领域中所理解的。Kyte等，J.Mol.Biol.157:105-132(1982)。氨基酸的亲水指数基于对其疏水性和电荷的考虑。在本领域中，已知亲水指数相近的氨基酸可以被替换并仍保留蛋白质功能。在一种情况下，具有±2的亲水指数的氨基酸被替换。氨基酸的亲水性也可用于揭示导致蛋白质保留生物学功能的替换。在肽的背景中考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性。替换可以使用彼此之间亲水性值在±2以内的氨基酸来进行。氨基酸的疏水指数和亲水性值两者均受到该氨基酸的具体侧链的影响。与该观察相一致，与生物学功能相容的氨基酸替换被理解为取决于氨基酸的相对相似性，特别是那些氨基酸的侧链，正如由疏水性、亲水性、电荷、尺寸和其他性质所揭示的。

当在本文中使用时，“载体”意味着含有复制原点的核酸序列。载体可以是病毒载体、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自身复制的染色体外载体，并且优选为DNA质粒。例如，载体可以编码Cas9蛋白和至少一种gRNA分子。

当在本文中使用时，“锌指”是指一种识别并结合DNA序列的蛋白质。锌指结构域是人类蛋白质组中最常见的DNA结合基序。单个锌指含有大约30个氨基酸，并且所述结构域通常通过每个碱基对与单个氨基酸侧链的相互作用，通过结合DNA的3个连续碱基对来发挥作用。

除非在本文中另有定义，否则与本公开相结合使用的科学和技术术语均应具有本领域普通技术人员通常理解的含义。例如，本文描述的与细胞和组织培养、分子生物学、免疫学、微生物学、遗传学和蛋白质和核酸化学以及杂交相结合使用的任何术语及其技术，在本领域中是公知且常用的。所述术语的含义和范围应该是清晰的；然而，在存在任何潜在歧义的情况下，本文提供的定义优先于任何字典或外来定义。此外，除非上下文另有需要，否则单数术语应包括复数，并且复数术语应包括单数。

2.转录因子

本文中提供了细胞类型特异性转录因子。转录因子(TF)是一种通过与特定DNA序列结合来控制遗传信息从DNA向信使RNA转录的速率的蛋白质。TF对基因进行调控，以确保在细胞和生物体的整个生命中它们在正确的细胞中在正确的时间和以正确的量表达。TF将内在和外在信号的复杂模式传输到定义细胞类型身份的动态基因表达程序中。成组的TF可能以协调的方式发挥作用，以指导例如整个一生中的细胞***、细胞生长和细胞死亡，胚胎发育过程中的细胞迁移和组织化(身体计划)，并间歇性地响应来自于细胞外的信号例如激素。TF可以单独地或与复合物中的其他蛋白质一起工作，例如通过促进或阻断RNA聚合酶的召集。所述TF可能对特定细胞类型特异。所述TF可以是神经元特异性的。所述TF可以是肌肉特异性的。所述TF可以是软骨细胞特异性的。所述TF可以对任何细胞类型特异，例如来自于选自骨髓、皮肤、骨骼肌、脂肪组织和外周血的组织的细胞。所述细胞可以是肌肉细胞(例如平滑肌细胞、骨骼肌细胞和心肌细胞)、上皮细胞、内皮细胞、尿路上皮细胞、成纤维细胞、肝细胞、成肌细胞、神经元、成骨细胞、破骨细胞、T细胞、角质形成细胞、毛囊细胞、人脐静脉内皮细胞(HUVEC)、脐带血细胞、神经祖细胞、软骨细胞、成软骨细胞、胆管细胞、胰岛细胞、甲状腺细胞、甲状旁腺细胞、肾上腺细胞、下丘脑细胞、垂体细胞、卵巢细胞、睾丸细胞、唾液腺细胞、脂肪细胞、前体细胞、造血干细胞(HSC)、脂肪间充质干细胞(MSC)、骨髓间充质干细胞(MSC)、少突胶质细胞、少突胶质细胞前体、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、淋巴细胞、单核细胞或心肌细胞。所述TF可以是例如C2H2 ZF、bHLH或HMG/Sox DNA结合结构域家族的成员。所述TF可以是激活型TF(其激活或提高基因表达)，或者所述TF可以是阻遏型TF(其阻遏或降低基因表达)。

TF可能使用各种不同的机制来调控基因表达。例如，TF可以稳定或阻断RNA聚合酶与DNA的结合。TF可以将共激活蛋白或共阻遏蛋白召集到转录因子DNA复合物。TF可以直接或间接催化组蛋白的乙酰化或去乙酰化。组蛋白乙酰转移酶(HAT)活性使组蛋白乙酰化，从而削弱DNA与组蛋白的结合，这可以使DNA更容易被转录，从而上调转录。组蛋白去乙酰化酶(HDAC)活性使组蛋白去乙酰化，从而加强DNA与组蛋白的结合，这可能使DNA不易被转录，从而下调转录。TF可能影响DNA的三维成环，进而可以影响基因表达。

本文提供了编码至少一种转录因子的多核苷酸或所述转录因子多肽本身。在某些实施方式中，所述转录因子是内源转录因子。在这里，“内源”是指在染色体DNA中，在对象的基因组中的天然位置中编码TF的基因拷贝。所述转录因子可以指导基因在神经元中的表达。所述转录因子可以指导细胞分化成神经元。在某些实施方式中，第一转录因子可以与第二转录因子一同工作。所述转录因子可以是假定的。所述转录因子可以被选择或鉴定为神经元特异性转录因子。神经元特异性转录因子可以被称为神经源性因子。

所述细胞类型特异性转录因子可以是激活型或阻遏型的。例如，激活型或正神经元特异性转录因子提高细胞分化成神经元或提高基因在神经元中的表达。正神经元特异性转录因子的表达提高可以促进或提高细胞分化成神经元或提高基因在神经元中的表达。阻遏型或负神经元特异性转录因子抑制细胞分化成神经元或抑制基因在神经元中的表达。敲减或抑制负神经元特异性转录因子的表达可以促进或提高细胞分化成神经元或提高基因在神经元中的表达。所述神经元特异性转录因子的表达或蛋白质水平的调节可以不经历多能阶段将干细胞直接转化成神经元。

本文提供了第一神经元特异性转录因子，其选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2。还提供了编码所述第一神经元特异性转录因子的多核苷酸。在某些实施方式中，所述第一神经元特异性转录因子选自NGN3和ASCL1或其组合。

在某些实施方式中，本文还提供了第二神经元特异性转录因子或编码所述第二神经元特异性转录因子的多核苷酸。第一神经元特异性转录因子可以与第二神经元特异性转录因子组合。在此类实施方式中，所述第一神经元特异性转录因子可以选自NGN3和ASCL1或其组合。所述第二神经元特异性转录因子可以选自：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1、PLAGL2(选自表1中的“正单一因子CRa-TF”)；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3(选自表1中的“正sgNGN3+CRa-TF”)；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7(选自表1中的“正sgASCL1+CRa-TF”)；(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3(选自表2中的“负单一因子CRa-TF”)；(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791(选自表2中的“负sgNGN3+CRa-TF”)；和(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3、BSX(选自表2中的“负sgASCL1+CRa-TF”)。

在某些实施方式中，所述第二神经元特异性转录因子选自NEUROG3、SOX4和SOX9。在某些实施方式中，所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2、NKX2-2、HES3和ZFP36L1。在某些实施方式中，所述第二神经元特异性转录因子是选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2、NKX2-2的激活型转录因子。在某些实施方式中，所述第二神经元特异性转录因子是选自HES3和ZFP36L1的阻遏型转录因子。

本文还提供了一种肌肉特异性转录因子。所述肌肉特异性转录因子可以选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1。还提供了编码所述肌肉特异性转录因子的多核苷酸。

3.基于CRISPR/Cas的基因编辑***

所述***可以是基于CRISPR/Cas的基因编辑***。所述基于CRISPR/Cas的基因编辑***可以包括针对TF基因中的靶区域或TF基因的启动子或调控元件或其部分的核酸酶失活的Cas蛋白(dCas)或dCas融合蛋白，导致TF的内源表达的激活或阻遏。所述***可以是基于CRISPR/Cas9的基因编辑***。在本文中可互换使用的“簇集规则间隔短回文重复序列”和“CRISPR”是指含有在大约40％的被测序细菌和90％的被测序古菌的基因组中存在的多个短直接重复序列的基因座。CRISPR***是一种微生物的核酸酶***，参与针对入侵噬菌体和质粒的防御，提供了一种形式的获得性免疫。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因与能够编程CRISPR介导的核酸切割的特异性的非编码RNA元件的组合。被称为间隔物的短的外来DNA区段被并入到基因组中CRISPR重复序列之间，并充当过去暴露的“记忆”。Cas蛋白例如Cas9蛋白与sgRNA(在本文中也可互换地称为“gRNA”)的3’末端形成复合体，并且所述蛋白质-RNA对通过所述sgRNA序列的5’末端与被称为前间区序列的预定的20bp DNA序列之间的互补碱基配对来识别它的基因组靶。这种复合体通过crRNA内编码的区域即前间区序列和病原体基因组内的前间区序列邻近基序(PAM)，被导向病原体DNA的同源基因座。所述非编码CRISPR阵列被转录，并在直接重复序列内被切割成含有单个间隔物序列的短crRNA，其将Cas核酸酶导向靶位点(前间区序列)。通过简单地交换所述表达的sgDNA的20bp识别序列，可以将Cas9核酸酶导向新的基因组靶。CRISPR间隔物以与真核生物体中的RNAi类似的方式被用于识别并沉默外源遗传元件。

已知三种类型的CRISPR***(I、II和III型效应物***)。II型效应物***在4个顺序步骤中进行靶向DNA双链断裂，并使用单个效应酶例如Cas9来切割dsDNA。与需要多个不同效应物作为复合体起作用的I型和III型效应物***相比，II型效应物***可以在可选背景例如真核细胞中起作用。所述II型效应物***由从含有间隔物的CRISPR基因座转录的长的pre-crRNA、Cas9蛋白和参与pre-crRNA加工的tracrRNA组成。所述tracrRNA杂交到分隔pre-crRNA的间隔物的重复序列区，从而通过内源RNA酶III启动dsRNA切割。这个切割之后是每个间隔物内由Cas9进行的第二个切割事件，产生保持与tracrRNA和Cas9结合的成熟的crRNA，形成Cas9:crRNA-tracrRNA复合体。

所述Cas9:crRNA-tracrRNA复合体解开DNA双链体并搜索与crRNA匹配的序列进行切割。当检测到靶DNA中的“前间区”序列与crRNA中的剩余间隔物序列之间的互补性时，发生靶识别。如果在前间区序列的3’末端处也存在正确的前间区序列邻近基序(PAM)，则Cas9介导靶DNA的切割。对于前间区序列靶向来说，在所述序列后必须紧跟前间区序列邻近基序(PAM)，这是被DNA切割所需的Cas9核酸酶识别的短序列。不同的II型***具有不同的PAM要求。酿脓链球菌(Streptococcus pyogenes)CRISPR***可以具有5’-NRG-3’作为这种Cas9(SpCas9)的PAM序列，其中R是A或G，并以这种***在人类细胞中的特异性为特征。基于CRISPR/Cas9的基因编辑***的独特能力是能够通过单个Cas9蛋白与两个或更多个sgRNA的共表达直接地同时靶向多个不同基因组基因座。例如，酿脓链球菌II型***天然偏好使用“NGG”序列，其中“N”可以是任何核苷酸，但是在工程化改造的***中也接受其他PAM序列例如“NAG”(Hsu等，Nature Biotechnology 2013doi:10.1038/nbt.2647)。同样地，源自于脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9(NmCas9)正常情况下具有NNNNGATT的天然PAM(SEQ ID NO：12)，但具有跨多种PAM的活性，包括高度简并的NNNNGNNN PAM(SEQ IDNO：13)(Esvelt等，Nature Methods 2013doi:10.1038/nmeth.2681)。

金黄色葡萄球菌的Cas9分子识别序列基序NNGRR(R＝A或G)(SEQ ID NO：8)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R＝A或G)(SEQ ID NO：9)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R＝A或G)(SEQ ID NO：10)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R＝A或G)(SEQ ID NO：11)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在上述实施方式中，N可以是任何核苷酸残基，例如A、G、C或T中的任一者。Cas9分子可以被工程化改造，以改变所述Cas9分子的PAM特异性。

一种工程化改造形式的酿脓链球菌II型效应物***显示出在人类细胞中具有基因组化改造的功能。在这个***中，通过一种合成重构的“指导RNA”(“gRNA”，在本文中也可与嵌合单一指导RNA(“sgRNA”)互换使用)将Cas9蛋白导向基因组靶位点，所述指导RNA是crRNA-tracrRNA融合体，免除了一般而言对RNA酶III和crRNA加工的需求。本文中提供了用于基因组编辑和治疗遗传疾病的基于CRISPR/Cas9的工程化改造的***。所述基于CRISPR/Cas9的工程化改造的***可以被设计成靶向任何基因，包括参与遗传疾病、衰老、组织再生或伤口愈合的基因。所述基于CRISPR/Cas9的基因编辑***可以包括Cas9蛋白或Cas9融合蛋白和至少一种gRNA。在某些实施方式中，所述***包含两种gRNA分子。所述Cas9融合蛋白可以例如包括与Cas9内源的结构域具有不同活性的结构域，例如反式激活结构域。

所述靶基因可以参与细胞的分化或其中可能需要激活基因的任何其他过程，或者可以具有突变例如移码突变或无义突变。在某些实施方式中，所述靶或靶基因包括假定转录因子的基因或其部分。所述基于CRISPR/Cas9的基因编辑***可以介导也可以不介导基因组的蛋白质编码区的脱靶变化。所述基于CRISPR/Cas9的基因编辑***可以结合并识别靶区域。

a.Cas蛋白

所述基于CRISPR/Cas9的基因编辑***可以包括Cas蛋白或Cas融合蛋白。在某些实施方式中，所述Cas蛋白是Cas12蛋白(也被称为Cpf1)，例如Cas12a蛋白。所述Cas12蛋白可以来自于任何细菌或古菌物种，包括但不限于新凶手弗朗西丝氏菌(Francisellanovicida)、氨基酸球菌属菌种(Acidaminococcus sp.)、毛螺菌科菌种(Lachnospiraceaesp.)和普氏菌属菌种(Prevotella sp)。在某些实施方式中，所述Cas蛋白是Cas9蛋白。Cas9蛋白是一种内切核苷酸，其切割核酸，由CRISPR基因座编码，并参与II型CRISPR***。所述Cas9蛋白可以来自于任何细菌或古菌物种，包括但不限于酿脓链球菌、金黄色葡萄球菌(Staphylococcus aureus(S.aureus))、燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、产琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属菌种(Actinomyces sp.)、cycliphilus denitrificans、Aminomonas paucivorans、蜡样芽孢杆菌(Bacilluscereus)、斯密氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillusthuringiensis)、拟杆菌属菌种(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属菌种(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、大肠弯曲杆菌(Campylobacter coli)、空肠弯曲杆菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatus Puniceispirillum、解纤维素梭菌(Clostridiumcellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒状杆菌(Corynebacterium accolens)、白喉棒状杆菌(Corynebacterium diphtheria)、马氏棒状杆菌(Corynebacteriummatruchotii)、Dinoroseobacter shibae、细长真杆菌(Eubacterium dolichum)、γ变形杆菌(gamma proteobacterium)、重氮营养葡糖醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilusparainfluenzae)、Haemophilus sputorum、加拿大螺旋杆菌(Helicobacter canadensis)、Helicobacter cinaedi、Helicobacter mustelae、Ilyobacter polytropus、Kingellakingae、卷曲乳杆菌(Lactobacillus crispatus)、Listeria ivanovii、单核细胞增多性李斯特菌(Listeria monocytogenes)、李斯特氏菌科(Listeriaceae)细菌、甲基孢囊菌属菌种(Methylocystis sp.)、Methylosinus trichosporium、羞怯动弯杆菌(Mobiluncusmulieris)、Neisseria bacilliformis、灰色奈瑟氏菌(Neisseria cinerea)、金黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌属菌种(Neisseria sp.)、Neisseria wadsworthii、亚硝化单胞菌属菌种(Nitrosomonas sp.)、Parvibaculum lavamentivorans、多杀巴氏杆菌(Pasteurella multocida)、Phascolarctobacterium succinatutens、Ralstonia syzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属菌种(Rhodovulum sp.)、Simonsiellamuelleri、鞘氨醇单胞菌属菌种(Sphingomonas sp.)、Sporolactobacillus vineae、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属菌种(Streptococcus sp.)、Subdoligranulum sp.、Tistrella mobilis、密螺旋体属菌种(Treponema sp.)或Verminephrobacter eiseniae。在某些实施方式中，所述Cas9分子是酿脓链球菌Cas9分子(在本文中也被称为“SpCas9”)。在某些实施方式中，所述Cas9分子是金黄色葡萄球菌(Staphylococcus aureus)Cas9分子(在本文中也被称为“SaCas9”)。

Cas分子或Cas融合蛋白可以与一种或多种gRNA分子相互作用，并且与所述gRNA分子合作，可以定位到包含靶结构域并且在某些实施方式中PAM序列的位点。Cas分子或Cas融合蛋白识别PAM序列的能力可以例如使用本领域中已知的转化测定法来确定。

在某些实施方式中，Cas分子或Cas融合蛋白与靶核酸相互作用并切割靶核酸的能力是前间区序列邻近基序(PAM)序列依赖性的。PAM序列是靶核酸中的序列。在某些实施方式中，所述靶核酸的切割发生在PAM序列上游。来自于不同细菌菌种的Cas分子可以识别不同的序列基序(例如PAM序列)。在某些实施方式中，新凶手弗朗西丝氏菌的Cas12分子识别序列基序TTTN(SEQ ID NO：35)。在某些实施方式中，酿脓链球菌的Cas9分子识别序列基序NGG(SEQ ID NO：1)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，嗜热链球菌(S.thermophilus)的Cas9分子识别序列基序NGGNG(SEQ ID NO：5)和/或NNAGAAW(W＝A或T)(SEQ ID NO：6)，并指导靶核酸序列1至10在例如这些序列上游3至5bp处的切割。在某些实施方式中，变形链球菌(S.mutans)的Cas9分子识别序列基序NGG(SEQ ID NO：1)和/或NAAR(R＝A或G)(SEQ ID NO：7)，并指导靶核酸序列1至10在例如这个序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRR(R＝A或G)(SEQ ID NO：8)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R＝A或G)(SEQID NO：9)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R＝A或G)(SEQ ID NO：10)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中，金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R＝A或G；V＝A或C或G)(SEQ ID NO：11)，并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在上述实施方式中，N可以是任何核苷酸残基，例如A、G、C或T中的任一者。Cas9分子可以被工程化改造，以改变所述Cas9分子的PAM特异性。

在某些实施方式中，所述载体编码至少一个识别NNGRRT(SEQ ID NO：10)或NNGRRV(SEQ ID NO：11)的前间区序列邻近基序(PAM)的Cas9分子。在某些实施方式中，所述至少一个Cas9分子是金黄色葡萄球菌Cas9分子。在某些实施方式中，所述至少一个Cas9分子是突变的金黄色葡萄球菌Cas9分子。

所述Cas蛋白可以被突变，使得核酸酶活性失活。所述没有内切核酸酶活性的失活的Cas9蛋白(“iCas9”，也被称为“dCas9”)已通过gRNA靶向细菌、酵母和人类细胞中的基因，以通过空间位阻沉默基因表达。参考酿脓链球菌Cas9序列，示例性突变包括D10A、E762A、H840A、N854A、N863A和/或D986A。参考金黄色葡萄球菌Cas9序列，示例性突变包括D10A和N580A.。在某些实施方式中，所述Cas9分子是突变的金黄色葡萄球菌Cas9分子。在某些实施方式中，所述dCas9是参考酿脓链球菌Cas9序列包括选自D10A、E762A、H840A、N854A、N863A和/或D986A的至少两个突变的Cas9分子。在某些实施方式中，所述Cas蛋白是dCas9蛋白。在某些实施方式中，所述Cas蛋白是dCas12蛋白。

在某些实施方式中，所述突变的金黄色葡萄球菌Cas9分子包含D10A突变。编码这种突变的金黄色葡萄球菌Cas9分子的核苷酸序列阐述在SEQ ID NO：22中。

在某些实施方式中，所述突变的金黄色葡萄球菌Cas9分子包含N580A突变。编码这种突变的金黄色葡萄球菌Cas9分子的核苷酸序列阐述在SEQ ID NO：23中。

编码Cas9分子的多核苷酸可以是合成多核苷酸。例如，所述合成多核苷酸可以被化学修饰。所述合成多核苷酸可以被密码子优化，例如至少一个不常用密码子或使用频率较低的密码子已被常用密码子代替。例如，所述合成多核苷酸可以指导优化的信使mRNA的合成，例如被优化以在例如本文中所描述的哺乳动物表达***中表达。

此外或可选地，编码Cas9分子或Cas9多肽的核酸可以包含核定位序列(NLS)。核定位序列在本领域中是已知的。编码酿脓链球菌的Cas9分子的示例性密码子优化的核酸序列阐述在SEQ ID NO：14中。相应的酿脓链球菌Cas9分子得氨基酸序列阐述在SEQ ID NO：15中。

编码金黄色葡萄球菌的Cas9分子并任选地含有核定位序列(NLS)的示例性密码子优化的核酸序列阐述在SEQ ID NO：16-20和24-25中。编码金黄色葡萄球菌的Cas9分子的另一个示例性密码子优化的核酸序列包含SEQ ID NO：27的第1293-4451位核苷酸。金黄色葡萄球菌Cas9分子的一个氨基酸序列阐述在SEQ ID NO：21中。金黄色葡萄球菌Cas9分子的一个氨基酸序列阐述在SEQ ID NO：26中。

b.融合蛋白

可选地或此外，所述基于CRISPR/Cas的基因编辑***可以包括融合蛋白。所述融合蛋白可以包含两个异源多肽结构域，其中第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有诸如转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基化酶活性的活性。所述融合蛋白可以包括第一多肽结构域例如Cas9蛋白或突变的Cas9蛋白，其融合到具有诸如转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基化酶活性的活性的第二多肽结构域。在某些实施方式中，所述第二多肽结构域具有转录激活活性。在某些实施方式中，所述第二多肽结构域具有转录阻遏活性。在某些实施方式中，所述第二多肽结构域包含合成转录因子。所述第二多肽结构域可以位于所述第一多肽结构域的C-端末端处或所述第一多肽结构域的N-端末端处或其组合。所述融合蛋白可以包括一个第二多肽结构域。所述融合蛋白可以包括两个所述第二多肽结构域。例如，所述融合蛋白可以包括在所述第一多肽结构域的N-端末端处的第二多肽结构域以及在所述第一多肽结构域的C-端末端处的第二多肽结构域。在其他实施方式中，所述融合蛋白可以包括单个第一多肽结构域和超过一个(例如两个或三个)串联的第二多肽结构域。

i)转录激活活性

所述第二多肽结构域可以具有转录激活活性，即反式激活结构域。例如，内源哺乳动物基因例如人类基因的表达，可以通过将第一多肽结构域例如dCas9或dCas12和反式激活结构域的融合蛋白通过gRNA的组合靶向哺乳动物启动子来实现。所述反式激活结构域可以包括VP16蛋白、多个VP16蛋白例如VP48结构域或VP64结构域、NFκB转录激活物活性的p65结构域或p300。例如，所述融合蛋白可以是dCas9-VP64。在其他实施方式中，所述Cas9蛋白可以是VP64-dCas9-VP64(SEQ ID NO：36，由SEQ ID NO：37的多核苷酸编码)。在其他实施方式中，所述激活转录的融合蛋白可以是dCas9-p300。在某些实施方式中，p300可以包含SEQID NO：159或SEQ ID NO：160的多肽。

ii)转录阻遏活性

所述第二多肽结构域可以具有转录阻遏活性。所述第二多肽结构域可以具有Kruppel结合盒活性，例如KRAB结构域、ERF阻遏结构域活性、Mxil阻遏结构域活性、SID4X阻遏结构域活性、Mad-SID阻遏结构域活性或TATA盒结合蛋白活性。例如，所述融合蛋白可以是dCas9-KRAB。

iii)转录释放因子活性

所述第二多肽结构域可以具有转录释放因子活性。所述第二多肽结构域可以具有真核释放因子1(ERF1)活性或真核释放因子3(ERF3)活性。

iv)组蛋白修饰活性

所述第二多肽结构域可以具有组蛋白修饰活性。所述第二多肽结构域可以具有组蛋白脱乙酰酶、组蛋白乙酰转移酶、组蛋白脱甲基化酶或组蛋白甲基转移酶活性。所述组蛋白乙酰转移酶可以是p300或CREB结合蛋白(CBP)或其片段。例如，所述融合蛋白可以是dCas9-p300。在某些实施方式中，p300可以包含SEQ ID NO：159或SEQ ID NO：160的多肽。

v)核酸酶活性

所述第二多肽结构域可以具有不同于Cas9蛋白的核酸酶活性的核酸酶活性。核酸酶或具有核酸酶活性的蛋白质是能够切割核酸的核苷酸亚基之间的磷酸二酯键的酶。核酸酶通常被进一步分成内切核酸酶和外切核酸酶，尽管某些酶可以落于两个类别内。公知的核酸酶包括脱氧核糖核酸酶和核糖核酸酶。

vi)核酸结合活性

所述第二多肽结构域可以具有核酸结合活性或核酸结合蛋白-DNA结合结构域(DBD)。DBD是独立折叠的蛋白质结构域，其含有至少一个识别双链或单链DNA的基序。DBD可以识别特定DNA序列(识别序列)或对DNA具有普遍亲和性。核酸结合区可以选自螺旋-转角-螺旋区、亮氨酸拉链区、有翼螺旋区、有翼螺旋-转角-螺旋区、螺旋-环-螺旋区、免疫球蛋白折叠、B3结构域、锌指、HMG盒、Wor3结构域、TAL效应物DNA结合结构域。

vii)甲基化酶活性

所述第二多肽结构域可以具有甲基化酶活性，其参与甲基向DNA、RNA、蛋白质、小分子、胞嘧啶或腺嘌呤的转移。在某些实施方式中，所述第二多肽结构域包括DNA甲基转移酶。

viii)脱甲基化酶活性

所述第二多肽结构域可以具有脱甲基化酶活性。所述第二多肽结构域可以包括从核酸、蛋白质(特别是组蛋白)和其他分子移除甲基(CH3-)的酶。或者，所述第二多肽可以通过使DNA脱甲基化的机制将甲基转变成羟甲基胞嘧啶。所述第二多肽可以催化这个反应。例如，催化这个反应的第二多肽可以是Tet1。

c.gRNA

所述基于CRISPR/Cas的基因编辑***包括至少一种gRNA分子。例如，所述基于CRISPR/Cas的基因编辑***可以包括两种gRNA分子。所述gRNA提供基于CRISPR/Cas的基因编辑***的靶向。所述gRNA是两个非编码RNA即crRNA和tracrRNA的融合体。在某些实施方式中，所述多核苷酸包括crRNA和/或tracrRNA。所述sgRNA可以通过交换编码20bp前间区序列的序列来靶向任何所需DNA序列，所述前间区序列通过与所需DNA靶的互补碱基配对而提供靶向特异性。gRNA模拟参与II型效应物***的天然存在的crRNA:tracrRNA双链体。这个可以包括例如42个核苷酸的crRNA和75个核苷酸的tracrRNA的双链体充当Cas9切割靶核酸的指导物。“靶区域”、“靶序列”或“前间区序列”是指所述基于CRISPR/Cas9的基因编辑***靶向并结合的靶基因的区域。所述gRNA的靶向基因组中的靶序列的部分可以被称为“靶向序列”或“靶向部分”或“靶向结构域”。“前间区序列”或“gRNA间隔物”可以是指所述基于CRISPR/Cas9的基因编辑***靶向并结合的靶基因的区域；“前间区序列”或“gRNA间隔物”也可以是指所述gRNA的与基因组中的被靶向序列互补的部分。所述gRNA可以包括gRNA支架。gRNA支架促进Cas9与所述gRNA结合并且可以促进内切核酸酶活性。所述gRNA支架是在所述gRNA的对应于gRNA所靶向的序列的部分之后的多核苷酸序列。所述gRNA靶向部分和gRNA支架合在一起形成一个多核苷酸。所述支架可以包含SEQ ID NO：158的多核苷酸序列。所述基于CRISPR/Cas9的基因编辑***可以包括至少一种gRNA，其中所述gRNA靶向不同的DNA序列。所述靶DNA序列可以是交叠的。所述靶序列或前间区序列后面跟有基因组中所述前间区序列的3’末端处的PAM序列。不同的II型***具有不同的PAM要求。例如，酿脓链球菌II型***使用“NGG”序列(SEQ ID NO：1)，其中“N”可以是任何核苷酸。在某些实施方式中，所述PAM序列可以是“NGG”，其中“N”可以是任何核苷酸。在某些实施方式中，所述PAM序列可以是NNGRRT(SEQ ID NO：10)或NNGRRV(SEQ ID NO：11)。所述至少一种gRNA分子可以结合并识别靶区域。

由遗传构建物(例如AAV载体)编码的gRNA分子的数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少11种不同的gRNA、至少12种不同的gRNA、至少13种不同的gRNA、至少14种不同的gRNA、至少15种不同的gRNA、至少16种不同的gRNA、至少17种不同的gRNA、至少18种不同的gRNA、至少18种不同的gRNA、至少20种不同的gRNA、至少25种不同的gRNA、至少30种不同的gRNA、至少35种不同的gRNA、至少40种不同的gRNA、至少45种不同的gRNA或至少50种不同的gRNA。由本文公开的载体编码的gRNA的数目可以在至少1种gRNA到至少50种不同的gRNA、至少1种gRNA到至少45种不同的gRNA、至少1种gRNA到至少40种不同的gRNA、至少1种gRNA到至少35种不同的gRNA、至少1种gRNA到至少30种不同的gRNA、至少1种gRNA到至少25种不同的gRNA、至少1种gRNA到至少20种不同的gRNA、至少1种gRNA到至少16种不同的gRNA、至少1种gRNA到至少12种不同的gRNA、至少1种gRNA到至少8种不同的gRNA、至少1种gRNA到至少4种不同的gRNA、至少4种gRNA到至少50种不同的gRNA、至少4种不同的gRNA到至少45种不同的gRNA、至少4种不同的gRNA到至少40种不同的gRNA、至少4种不同的gRNA到至少35种不同的gRNA、至少4种不同的gRNA到至少30种不同的gRNA、至少4种不同的gRNA到至少25种不同的gRNA、至少4种不同的gRNA到至少20种不同的gRNA、至少4种不同的gRNA到至少16种不同的gRNA、至少4种不同的gRNA到至少12种不同的gRNA、至少4种不同的gRNA到至少8种不同的gRNA、至少8种不同的gRNA到至少50种不同的gRNA、至少8种不同的gRNA到至少45种不同的gRNA、至少8种不同的gRNA到至少40种不同的gRNA、至少8种不同的gRNA到至少35种不同的gRNA、8种不同的gRNA到至少30种不同的gRNA、至少8种不同的gRNA到至少25种不同的gRNA、8种不同的gRNA到至少20种不同的gRNA、至少8种不同的gRNA到至少16种不同的gRNA或8种不同的gRNA到至少12种不同的gRNA之间。在某些实施方式中，所述遗传构建物(例如AAV载体)编码一种gRNA分子即第一gRNA分子和任选的Cas9分子。在某些实施方式中，第一遗传构建物(例如第一AAV载体)编码一种gRNA分子即第一gRNA分子和任选的Cas9分子，并且第二遗传构建物(例如第二AAV载体)编码一种gRNA分子即第二gRNA分子和任选的Cas9分子。

所述gRNA分子包含靶向结构域，其是与靶DNA序列互补的多核苷酸序列，后面跟有PAM序列。所述gRNA可以在所述靶向结构域或互补多核苷酸序列的5’末端处包含“G”。gRNA分子的靶向结构域可以包含至少10个碱基对、至少11个碱基对、至少12个碱基对、至少13个碱基对、至少14个碱基对、至少15个碱基对、至少16个碱基对、至少17个碱基对、至少18个碱基对、至少19个碱基对、至少20个碱基对、至少21个碱基对、至少22个碱基对、至少23个碱基对、至少24个碱基对、至少25个碱基对、至少30个碱基对或至少35个碱基对的靶DNA序列的互补多核苷酸序列，后面跟有PAM序列。在某些实施方式中，gRNA分子的靶向结构域具有19-25个核苷酸的长度。在某些实施方式中，gRNA分子的靶向结构域具有20个核苷酸的长度。在某些实施方式中，gRNA分子的靶向结构域具有21个核苷酸的长度。在某些实施方式中，gRNA分子的靶向结构域具有22个核苷酸的长度。在某些实施方式中，gRNA分子的靶向结构域具有23个核苷酸的长度。

所述gRNA可以靶向编码转录因子的基因内或其附近的区域。在某些实施方式中，所述gRNA可以靶向所述基因的外显子、内含子、启动子区、增强子区或转录区中的至少一者。

在某些实施方式中，所述gRNA靶向神经元特异性转录因子。所述gRNA可以包括靶向结构域，其包含对应于表3中所示的SEQ ID NO：38-97中的至少一者的多核苷酸序列或其互补体或其变体。所述gRNA可以靶向包含选自SEQ ID NO：38-97的序列的多核苷酸或其互补体、部分或变体。所述gRNA可以由包含选自SEQ ID NO：38-97的序列的多核苷酸或其互补体、部分或变体编码。所述gRNA可以包含对应于(例如其RNA版本)SEQ ID NO：38-97中的至少一者的多核苷酸序列或其互补体、部分或变体。

表3.靶向假定神经元特异性转录因子的示例性gRNA

在某些实施方式中，所述gRNA靶向肌肉特异性转录因子。所述肌肉特异性转录因子可以选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1。所述gRNA可以包括靶向结构域，其包含对应于表5中所示的SEQ ID NO：98-104中的至少一者的多核苷酸序列或其互补体或其变体。所述gRNA可以靶向包含选自SEQ ID NO：98-104的序列的多核苷酸或其互补体、部分或变体。所述gRNA可以由包含选自SEQ ID NO：98-104的序列的多核苷酸或其互补体、部分或变体编码。所述gRNA可以包含对应于(例如其RNA版本)SEQ ID NO：98-104中的至少一者的多核苷酸序列或其互补体、部分或变体。

表5.靶向肌肉特异性转录因子的示例性gRNA

基因	gRNA靶序列	SEQ ID NO
			TWIST1	CGGCTAGGAGGCGGGTGGA	98
PAX3	CGGGCCAACCTTCTCTCCT	99
			MYOD	CGCGCACGCCAGTGTGGAG	100
MYOG	GGGCCATGCGGGAGAAAGA	101
			SOX9	GGAGGGGATCGCAGCCAAA	102
SOX10	GGAGGAGCCCTGAGTGTTG	103
			DMRT1	GCAAGCAGCTGGAGAGCGG	104

用本文中详述的***转化或转录的细胞可以表达至少一种gRNA。所述细胞可以各自独立地包括一种gRNA并靶向一种假定转录因子。细胞中所述至少一种gRNA的水平可以通过本领域中已知的任何适合的手段例如深度测序来确定。至少一种gRNA可以在细胞中富集。例如，至少一种gRNA可以在细胞中富集，所述细胞具有报告蛋白的高表达。“富集”可以是指在具有报告基因高表达的细胞中gRNA丰度的统计显著(p<0.05)的提高。这可以使用R中的差异表达分析软件包DESeq2来计算。所述gRNA或细胞中的至少一种gRNA可以将所述细胞中所述报告蛋白的表达相对于对照提高约2％、约3％、约4％、约5％、约6％、约7％、约8％、约9％、约10％、约15％、约20％、约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％或约90％。对照可以是具有非靶向gRNA的细胞。在某些实施方式中，相对于非靶向gRNA，所述gRNA可以将所述细胞中所述报告蛋白的表达提高约2-50％。

d.遗传构建物

所述用于鉴定细胞类型特异性转录因子或用于提高细胞类型特异性基因的表达的***或其一种或多种组分，可以由遗传构建物编码或者包含在遗传构建物内。遗传构建物可以包括多核苷酸例如载体和质粒。所述构建物可以是重组的。在某些实施方式中，所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或Cas分子或融合蛋白的多核苷酸的启动子。在某些实施方式中，所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或dCas分子或融合蛋白的多核苷酸的启动子。在某些实施方式中，所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或Cas9分子或融合蛋白的多核苷酸的启动子。在某些实施方式中，所述启动子被可操作连接到编码gRNA分子、报告蛋白、神经元标志物和/或Cas9分子的多核苷酸。在某些实施方式中，所述启动子被可操作连接到所述编码第一gRNA分子、第二gRNA分子、报告蛋白、神经元标志物和/或Cas9分子的多核苷酸。所述遗传构建物可以作为有功能的染色体外分子存在于细胞中。所述遗传构建物可以是包括着丝粒、端粒的线性微型染色体，或质粒或粘粒。所述遗传构建物可以被转化或转导到细胞中。所述遗传构建物可以被配制成任何适合类型的递送介质，包括例如病毒载体、慢病毒表达、mRNA电穿孔和脂质介导的转染。本文还提供了一种用本文中详细描述的***或其组分转化或转导的细胞。在某些实施方式中，所述细胞是干细胞。所述干细胞可以是人类干细胞。在某些实施方式中，所述细胞是胚胎干细胞。所述干细胞可以是人类多能干细胞(iPSC)。还提供了干细胞衍生的神经元，例如从用本文中详述的DNA靶向***或其组分转化或转导的iPSC衍生的神经元。

本文中还提供了一种病毒递送***。病毒递送***可以包括如慢病毒、反转录病毒、mRNA电穿孔或纳米粒子。在某些实施方式中，所述载体是腺相关病毒(AAV)载体。所述AAV载体是属于细小病毒科依赖病毒属的小病毒，感染人类和一些其他的灵长动物物种。AAV载体可用于利用各种不同的构建物配置来递送基于CRISPR/Cas9的基因编辑***。例如，AAV载体可以在分开的载体上或在同一载体上递送Cas9和gRNA表达盒。或者，如果使用源自于诸如金黄色葡萄球菌或脑膜炎奈瑟氏菌的物种的小Cas9蛋白，则可以将在4.7kb包装限度内的Cas9和至多两个gRNA表达盒合并在单个AAV载体中。

在某些实施方式中，所述AAV载体是修饰的AAV载体。所述修饰的AAV载体可以具有增强的心肌和/或骨骼肌组织嗜性。所述修饰的AAV载体可能能够在哺乳动物细胞中递送和表达所述基于CRISPR/Cas9的基因编辑***。例如，所述修饰的AAV载体可以是AAV-SASTG载体(Piacentino等，Human Gene Therapy 2012,23,635–646)。所述修饰的AAV载体可以基于几种衣壳类型中的一者或多者，包括AAV1、AAV2、AAV5、AAV6、AAV8和AAV9。所述修饰的AAV载体可以基于具有可选的肌肉嗜性AAV衣壳的AAV2假型，例如AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5和AAV/SASTG载体，其通过***性或局部递送高效转导骨骼肌或心肌(Seto等，Current Gene Therapy 2012,12,139-151)。所述修饰的AAV载体可以是AAV2i8G9(Shen等，J.Biol.Chem.2013,288,28814-28823)。

4.用于提高基因的神经元特异性转录的***

本文提供了一种用于提高基因的神经元特异性转录或用于提高神经元特异性基因的表达的***。所述***可以包括靶向第一神经元特异性转录因子、其调控区、启动子区或部分的第一gRNA，以及如上所详述的Cas蛋白或融合蛋白。所述***可以包括靶向第一神经元特异性转录因子、其调控区、启动子区其部分的第一gRNA，靶向第二神经元特异性转录因子、其调控区、启动子区或部分的第二gRNA，以及如上所详述的Cas蛋白或融合蛋白。在某些实施方式中，所述第二神经元特异性转录因子是正或激活型转录因子，并且所述融合蛋白的第二多肽结构域具有转录激活活性。在某些实施方式中，所述第二神经元特异性转录因子是负或阻遏型转录因子，并且所述融合蛋白的第二多肽结构域具有转录阻遏活性。

5.用于鉴定细胞类型特异性转录因子的***

本文提供了用于选择或鉴定细胞类型特异性转录因子例如神经元特异性转录因子或肌肉特异性转录因子或软骨细胞特异性转录因子的组合物和方法。所述***包括编码报告蛋白和细胞类型标志物的多核苷酸，如上所详述的Cas蛋白或融合蛋白，以及靶向假定转录因子的gRNA的文库。本文还提供了一种细胞类型特异性转录因子或编码所述细胞类型特异性转录因子的多核苷酸序列或编码靶向所述细胞类型特异性转录因子的gRNA的多核苷酸序列，其通过本文中详述的组合物和方法选择或鉴定。

a.报告蛋白

所述多核苷酸可以编码报告蛋白。报告蛋白由报告基因编码，并在重组***中在另一个基因表达的同时产生一些可测定或可检测的特征，以指示该另一个基因的表达。所述报告蛋白能够产生可检测信号。可以使用各种不同的报告蛋白，它们在信号转导的物理本质(例如荧光、电化学、核磁共振(NMR)和电子顺磁共振(EPR))和报告蛋白的化学本质方面有差异。在某些实施方式中，所述来自于报告蛋白的信号是荧光信号。

在某些实施方式中，所述报告蛋白是荧光蛋白。荧光蛋白包括例如萤光素酶、增强型蓝色荧光蛋白(EBFP)、增强型蓝色荧光蛋白-2(EBFP2)、mKATE、iRFP(红外荧光蛋白)、增强型黄色荧光蛋白(EYFP)、黄色荧光蛋白(YFP)、Katushka、Ds-Red express、红色荧光蛋白、红色荧光蛋白turbo、TurboRFP、TagRFP、绿色荧光蛋白(GFP)、蓝色荧光蛋白(BFP)、蓝绿色荧光蛋白(CFP)、增强型绿色荧光蛋白(EGFP)、AcGFP、TurboGFP、Emerald、Azami Green、ZsGreen、Sapphire、T-Sapphire、增强蓝绿色荧光蛋白(ECFP)、mCFP、Cerulean、CyPet、AmCyanl、Midori-Ishi Cyan、mTFPl(Teal)、Topaz、Venus、mCitrine、YPet、PhiYFP、ZsYellowl、mBanana、Kusabira Orange、mOrange、dTomato、dTomato-Tandem、DsRed、DsRed2、DsRed-Express(Tl)、DsRed-单体、mTangerine、mStrawberry、AsRed2、mRFPl、JRed、mCherry、HcRedl、mRaspberry、HcRedl、HcRed-Tandem、mPlum和AQ143或其组合。在某些实施方式中，所述报告蛋白包含mCherry。mCherry可以包含具有SEQ ID NO：28的氨基酸序列的多肽，并且可以由包含SEQ ID NO：29的多核苷酸编码。在某些实施方式中，所述报告蛋白是可以通过免疫组织化学或抗体染色鉴定的任何多肽。

用所述多核苷酸转染或转化的细胞可以表达所述报告蛋白。可以例如确定细胞中所述报告蛋白的表达水平。所述报告蛋白的表达水平可以在用本文中详述的***转染所述细胞后的各个不同时间点测定。例如，细胞中所述报告蛋白的表达水平可以在从转导起约1、2、3、4、5、6、7、8、9或10天后确定。在某些实施方式中，细胞中所述报告蛋白的表达水平在从转导起约4天后确定。荧光蛋白可以通过本领域中已知的任何适合的手段来测定，例如通过FACS或流式细胞术或荧光显微镜。在某些实施方式中，用所述多核苷酸转染或转化的细胞相对于对照具有所述报告蛋白的高表达。所述对照可以是用包括不同gRNA的多核苷酸转染或转化的另外一个或多个细胞。所述报告蛋白的“高表达”可以被定义为在所述细胞群体内的前5％的表达水平中。

b.细胞类型标志物

所述多核苷酸可以编码在某些细胞类型或状态或阶段下指示表达的标志物。例如，所述多核苷酸可以编码神经元标志物。神经元标志物是仅在或主要在神经元细胞中表达的基因。所述神经元标志物可以是仅在神经元的某些亚型中表达的亚型特异性标志物。所述神经元标志物可以是泛神经元标志物。泛神经元标志物是仅在或主要在神经元细胞中并在大多数神经元细胞中表达的基因。所述泛神经元标志物也可以被成为神经元谱系标志物。所述神经元标志物可以在神经发生中的任何时间点并在已分化成神经元的细胞中表达。神经元标志物可以选自例如TUBB3、NEUROD1、NEUROG1、NEUROG2、ASCL1、SYN1、NCAM和MAP2。在某些实施方式中，所述泛神经元标志物是TUBB3。TUBB3是编码β-3-微管蛋白(也被称为β-微管蛋白III)多肽的基因，所述多肽是几乎专门存在于神经元中的微管蛋白家族的微管元件。在某些实施方式中，所述细胞类型特异性转录因子是神经元特异性转录因子，所述细胞类型标志物是神经元标志物，并且所述神经元标志物包括TUBB3。

在其他实施方式中，所述细胞类型标志物是肌肉或成肌标志物。肌肉或成肌标志物是仅在或主要在肌细胞中表达的基因。所述肌肉或成肌标志物可以是仅在肌细胞的某些亚型中表达的亚型特异性标志物。所述肌肉或成肌标志物可以是泛肌肉或泛成肌标志物。泛肌肉或泛成肌标志物是仅在或主要在肌细胞中并且在大多数肌细胞中表达的基因。所述成肌标志物可以包括PAX7。在某些实施方式中，所述细胞类型特异性转录因子是肌肉特异性转录因子，所述细胞类型标志物是成肌标志物，并且所述成肌标志物包括PAX7。

在其他实施方式中，所述细胞类型标志物是胶原标志物。胶原标志物是仅在或主要在软骨细胞中表达的基因。所述胶原标志物可以是仅在软骨细胞的某些亚型中表达的亚型特异性标志物。所述胶原标志物可以是泛胶原标志物。泛胶原标志物是仅在或主要在软骨细胞中并且在大多数软骨细胞中表达的基因。所述胶原标志物可以包括COL2A1。在某些实施方式中，所述细胞类型特异性转录因子是软骨细胞特异性转录因子，所述细胞类型标志物是胶原标志物，并且所述胶原标志物包括COL2A1。

所述编码报告蛋白的多核苷酸可以被可操作连接到编码如上详述的细胞类型标志物的多核苷酸。所述编码报告蛋白的多核苷酸可以与所述编码细胞类型标志物的多核苷酸在同一阅读框中。因此，所述报告蛋白可以充当所述细胞类型标志物的表达或翻译报告物。

用所述多核苷酸转染或转化的细胞可以表达所述细胞类型标志物。可以例如测定细胞中所述细胞类型标志物的表达水平。所述细胞类型标志物的表达水平可以在用本文详述的***转染所述细胞后的各个不同时间点测定。例如，细胞中所述细胞类型标志物的表达水平可以在从转导起约1、2、3、4、5、6、7、8、9或10天后确定。细胞类型标志物可以通过本领域中已知的任何适合的手段来测定，例如通过免疫组织化学、qRT-PCR和RNA测序。

c.gRNA文库

所述用于选择或鉴定转录因子的***还可以包含gRNA文库。所述gRNA文库可以靶向假定转录因子。例如，gRNA可以靶向编码转录因子的基因的启动子。每个gRNA可以是不同的。所述gRNA文库可以包括多种gRNA，每种gRNA靶向假定转录因子。在某些实施方式中，每种gRNA靶向不同的假定转录因子。某些gRNA可能靶向同一种假定转录因子，其中每种gRNA靶向编码所述转录因子的基因的不同部分。在某些实施方式中，所述不同部分可能交叠。在某些实施方式中，所述gRNA文库可以包含针对转录因子的每个转录起始位点的1、2、3、4、5、6、7、8、9或10种gRNA。所述gRNA文库可以包括至少约1000种、至少约2000种、至少约3000种、至少约4000种、至少约5000种、至少约6000种、至少约7000种、至少约8000种或至少约9000种gRNA。

6.药物组合物

本文中提供了包含上述遗传构建物或***的药物组合物。本文中所描述的***或其至少一种组分可以按照制药领域中的专业技术人员公知的标准技术配制成药物组合物。所述药物组合物可以按照待使用的给药方式来配制。在药物组合物是注射用药物组合物的情况下，它们是无菌、无热原且无颗粒物的。优选地使用等渗剂型。通常，用于等渗的添加剂可以包括氯化钠、右旋糖、甘露糖醇、山梨糖醇和乳糖。在某些情况下，等渗溶液例如磷酸盐缓冲盐水是优选的。稳定剂包括明胶和白蛋白。在某些实施方式中，向所述剂型添加血管收缩剂。

所述组合物还可以包含可药用赋形剂。所述可药用赋形剂可以是功能性分子例如介质、佐剂、载体或稀释剂。术语“可药用载体”可以是无毒惰性的固体、半固体或液体填充剂、稀释剂、包封材料或任何类型的配制辅料。可药用载体包括例如稀释剂、润滑剂、粘合剂、崩解剂、着色剂、调味剂、甜味剂、抗氧化剂、防腐剂、助流剂、溶剂、悬浮剂、润湿剂、表面活性剂、润肤剂、推进剂、保湿剂、粉末、pH调节剂及其组合。所述可药用赋形剂可以是转染促进剂，其可以包括表面活性剂例如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物包括单磷酰脂A、胞壁酰肽、醌类似物、囊泡例如角鲨烯和角鲨烯、透明质酸、脂质、脂质体、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子，或其他已知的转染促进剂。

所述转染促进剂可以是聚阴离子、聚阳离子包括聚L-谷氨酸(LGS)或脂质。所述转染促进剂是聚L-谷氨酸，并且更优选地，所述聚L-谷氨酸以低于6mg/mL的浓度存在于所述用于在骨骼肌和心肌中进行基因组编辑的组合物中。所述转染促进剂还可以包括表面活性剂例如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物包括单磷酰脂A、胞壁酰肽、醌类似物和囊泡例如角鲨烯和角鲨烯，并且也可以使用透明质酸与所述遗传构建物联合给药。在某些实施方式中，编码所述组合物的DNA载体也可以包括转染促进剂例如脂质、脂质体包括卵磷脂脂质体或本领域中已知的其他脂质体作为DNA-脂质体混合物(参见例如国际专利申请号W09324640)、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。在某些实施方式中，所述转染促进剂是聚阴离子、聚阳离子包括聚L-谷氨酸(LGS)或脂质。

7.给药

本文中详述的***或其至少一种组分或包含它们的药物组合物可以被给药到对象。此类组合物可以以医学领域的专业技术人员公知的剂量和技术，将诸如特定对象的年龄、性别、体重和状况和给药途径等因素考虑在内来给药。本文公开的***或其至少一种组分、遗传构建物或包含它们的组合物可以通过不同途径给药到对象，所述途径包括口服、肠胃外、舌下、透皮、直肠、透黏膜、局部、鼻内、***内、通过吸入、通过颊给药、胸膜内、静脉内、动脉内、腹膜内、皮下、真皮内、表皮、肌肉内、鼻内、鞘内、颅内和关节内或其组合。在某些实施方式中，所述***、遗传构建物或包含它们的组合物肌肉内、静脉内或其组合给药到对象。对于兽医用途来说，所述DNA靶向***、遗传构建物或包含它们的组合物可以按照常用兽医实践适合可接受的剂型给药。兽医可以容易地确定最适合于特定动物的给药方案和给药途径。所述***、遗传构建物或包含它们的组合物可以通过传统注射器、无针注射装置、“微弹道轰击基因枪”或其他物理方法例如电穿孔(“EP”)、“流体动力学方法”或超声来给药。

所述***、遗传构建物或包含它们的组合物可以通过几种技术递送到对象，包括使用和不使用体内电穿孔、脂质体介导、纳米粒子辅助、重组载体例如重组慢病毒、重组腺病毒和重组腺相关病毒的DNA注射(也被称为DNA疫苗接种)。所述组合物可以被注射到脑或中枢神经***的其他组分中。

8.方法

a.提高干细胞的神经元成熟的方法

本文提供了提高干细胞的神经元成熟的方法或提高干细胞衍生的神经元的成熟的方法。所述方法可以包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平；或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并提高所述干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是激活型或正神经元特异性转录因子。在其他实施方式中，所述方法可以包括提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并降低所述干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是阻遏型或负神经元特异性转录因子。

在某些实施方式中，提高所述第一神经元特异性转录因子的水平包括下述中的至少一者：a)向干细胞给药编码所述第一神经元特异性转录因子的多核苷酸；(b)向干细胞给药包含所述第一神经元特异性转录因子的多肽；和(c)向干细胞给药靶向所述第一神经元特异性转录因子、其调控区、启动子区或部分的gRNA和融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有转录激活活性。

在某些实施方式中，提高所述第二神经元特异性转录因子的水平包括下述中的至少一者：(a)向干细胞给药编码所述第二神经元特异性转录因子的多核苷酸；(b)向干细胞给药包含所述第二神经元特异性转录因子的多肽；和(c)向干细胞给药靶向所述第二神经元特异性转录因子、其调控区、启动子区或部分的gRNA和融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有转录激活活性。

在某些实施方式中，降低所述第二神经元特异性转录因子的水平包括向干细胞给药靶向所述第二神经元特异性转录因子、其调控区、启动子区或部分的gRNA和融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有转录阻遏活性。

b.提高干细胞向神经元的转化的方法

本文提供了提高干细胞向神经元的转化的方法。所述方法可以包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平；或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并提高所述干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是激活型或正神经元特异性转录因子。在其他实施方式中，所述方法可以包括提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并降低所述干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是阻遏型或负神经元特异性转录因子。

在某些实施方式中，提高所述第一神经元特异性转录因子的水平包括下述中的至少一者：(a)向干细胞给药编码所述第一神经元特异性转录因子的多核苷酸；(b)向干细胞给药包含所述第一神经元特异性转录因子的多肽；和(c)向干细胞给药靶向所述第一神经元特异性转录因子、其调控区、启动子区或部分的gRNA和融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有转录激活活性。

c.治疗对象的方法

本文提供了治疗有需要的对象的方法。所述方法可以包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平；或(b)提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并提高所述对象中的干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是激活型或正神经元特异性转录因子。在其他实施方式中，所述方法可以包括提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平，并降低所述对象中的干细胞中第二神经元特异性转录因子的水平，其中所述第二神经元特异性转录因子是阻遏型或负神经元特异性转录因子。

d.筛选神经元特异性转录因子的方法

本文提供了筛选神经元特异性转录因子的方法。所述方法可以包括用权利要求1-3中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数所述细胞各自独立地包含一种gRNA并靶向一种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中的gRNA水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；以及当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述假定转录因子作为神经元特异性转录因子。“富集”可以是在具有报告基因高表达的细胞中gRNA丰度的统计显著(p<0.05)的提高。

在某些实施方式中，每个细胞中所述报告蛋白的表达水平在从转导起约4天后确定。在某些实施方式中，所述每个细胞中报告蛋白的表达水平通过流式细胞术来确定。在某些实施方式中，每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平通过深度测序来确定。在某些实施方式中，相对于非靶向gRNA，所述gRNA将所述细胞中所述报告蛋白的表达提高约2-50％。

e.筛选一对神经元特异性转录因子的方法

本文提供了筛选一对神经元特异性转录因子的方法。所述方法可以包括用权利要求1-3中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数所述细胞各自独立地包含两种gRNA并靶向两种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中所述两种gRNA的水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；以及当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述两种假定转录因子作为一对神经元特异性转录因子。

9.实施例

实施例1

材料和方法

TUBB3-2A-mCherry多能干细胞系的构建。使用人类iPS细胞系(RVR-iPSC)构建TUBB3-2A-mCherry报告细胞系。按照以前所做将RVR-iPSC从BJ成纤维细胞通过反转录病毒重编程并表征(Lee等，Cell 2012,51,547-558)。为了产生TUBB3-2A-mCherry报告细胞系，将3x10⁶个细胞用Accutase(Stemcell Tech,7920)解离，并使用P3原代细胞4D-Nucleofector试剂盒(Lonza,V4XP-3032)用6μg gRNA-Cas9表达载体和3μg TUBB3靶向载体电穿孔。将转染的细胞铺于用基质胶(Corning,354230)包被的10cm培养皿中增补有10μMRock抑制剂(Y-27632,Stemcell Tech,72304)的完全mTesR(Stemcell Tech,85850)中。转染后24小时，开始使用1μg/mL嘌呤霉素进行7天的正选择。在选择后，将细胞用CMV-CRE重组酶表达载体转染，以除去两侧带有lox P的嘌呤霉素选择盒。将转染的细胞扩增并以低密度铺板，用于集落分离(180个细胞/cm²)。将得到的克隆机械挑取并扩增，并使用QuickExtract DNA提取液(Lucigen,QE09050)提取gDNA，用于靶向载体整合的PCR筛选。在^VP64dCas9^VP64的慢病毒转导后，使用相同的方案进行第二轮集落分离。

质粒构建。通过修饰Addgene质粒#59791以将GFP用BSD杀稻瘟菌素抗性基因代替，产生了慢病毒^VP64dCas9^VP64质粒。通过修饰Addgene质粒#106249以***带有ZFP36L1、HES3或乱序非靶向gRNA的金黄色葡萄球菌gRNA盒，产生了慢病毒dSaCas9^KRAB质粒。通过修饰Addgene质粒#83925以包含优化的gRNA支架(Chen等，Cell 2013,155,1479-149)并用嘌呤霉素抗性基因代替Bsr，产生了用于单一CAS-TF筛选的gRNA表达质粒。通过进一步修饰所述单一gRNA表达质粒以包含带有以前描述的修饰的gRNA支架(Adamson等，Cell 2016,167,1867-1882e1821)的在mU6 Pol III启动子控制下表达sgNGN3或sgASCL1的另一个gRNA表达盒，产生了用于成对CAS-TF筛选的gRNA表达质粒。各个gRNA作为寡核苷酸订购(IntegratedDNA Technologies)，进行磷酸化，杂交，并使用BsmBI位点克隆到所述gRNA表达质粒中。用于各个gRNA克隆的前间区序列列于上面的表3中。

TUBB3靶向载体通过***～700bp的同源臂(在TUBB3终止密码子周围)来克隆，所述同源臂从RVR-iPS细胞的基因组DNA通过PCR扩增，围绕着P2A–mCherry序列和两侧带有lox P的嘌呤霉素抗性盒。

编码TF的cDNA从cDNA合并物PCR扩增或作为gBlock合成(Integrative DNATechnologies)，并使用EcoRI和XbaI限制性位点克隆到Addgene质粒#52047中。TetO基因表达通过M2rtTA(Addgene#20342)的共同递送来实现。

慢病毒的产生和滴定。HEK293T细胞从美国组织保藏中心(American TissueCollection Center)(ATCC)获得并通过杜克大学细胞培养部门(Duke University CellCulture Facility)购买。将细胞维持在增补有10％FBS和1％青霉素/链霉素的高葡萄糖DMEM中，并在37℃和5％CO₂下培养。为了产生gRNA文库^VP64dCas9^VP64和dSaCas9^KRAB的慢病毒，使用磷酸钙沉淀法(Salmon和Trono，2007Curr.Protoc.Hum.Genet.第12章，第12 10单元)，将4.5x10⁶个细胞用6μg pMD2.G(Addgene#12259)、15μg psPAX2(Addgene#12260)和20μg转移载体转染。在转染后12-14小时更换培养基，并在该培养基更换后24和48小时收获病毒上清液。将所述病毒上清液合并，以600g离心10min，通过PVDF 0.45μm滤器(Millipore,SLHV033RB)，并使用Lenti-X浓缩仪(Clontech,631232)按照制造商的方案在1x PBS中浓缩至50x。

为了产生用于gRNA和cDNA验证的慢病毒，使用Lipofectamine 3000(Invitrogen,L3000008)按照制造商的说明书将0.4x10⁶个细胞用200ng pMD2.G、600ng psPAX2和200ng转移载体转染。在转染后12-14小时更换培养基，并在该培养基更换后24和48小时收获病毒上清液。将所述病毒上清液合并，以600g离心10min，并使用Lenti-X浓缩仪(Clontech,631232)按照制造商的方案在1x PBS中浓缩至50x。

所述用于单一或成对CAS-TF文库的慢病毒gRNA文库合并物的滴度，通过用慢病毒的连续稀释液转导6x10⁴个细胞，并在转导后4天用Accuri C6流式细胞仪(BD)测量GFP表达百分数来确定。所有慢病毒滴定均在用于CAS-TF单一和成对gRNA筛选的TUBB3-2A-mCherry细胞系中进行。

CAS-TF gRNA文库设计和克隆。假定的TF从以前的人类转录因子目录(Vaquerizas等，Nat.Rev.Genet.2009,10,252-263)中选择。从以前的基因组广度的CRISPRa文库(Horlbeck,2016，紧凑且高活性的下一代文库(Compact and highly active next-generation libraries)，eLife)提取gRNA文库，其由靶向1,496种TF的每个TSS 5个gRNA组成。所述文库包含从同一个基因组广度的文库提取的一组100种乱序非靶向gRNA，共计8,505种gRNA。将所述寡核苷酸合并物(Custom Array)PCR扩增，并使用Gibson组装法克隆到用于单一CAS-TF筛选的单一gRNA表达质粒或用于使用sgASCL1或sgNGN3的成对CAS-TF筛选的双gRNA表达质粒中。

通过从几个以前发表的CRISPRa基因组广度文库(Gilbert等，Cell 2014,159,647-66；Horlbeck,2016，紧凑且高活性的下一代文库(Compact and highly active next-generation libraries)，eLife；Konermann等，Nature 2015,517,583-588；Sanson等，Nat.Commun.2018,9,5416)提取另外的gRNA，以获得靶向109种TF的每个基因平均33种gRNA，设计了子文库。所述文库包括一组300种乱序非靶向gRNA，共计3,874种gRNA。将所述寡核苷酸合并物(Twist Bioscience)PCR扩增，并按照与原始的CAS-TF文库相同的方法克隆到单一gRNA表达质粒中。

单一和成对CAS-TF神经元分化筛选。每个CAS-TF筛选使用独立的转导进行一式三份。对于每个平行实验来说，将24x10⁶个TUBB3-2A-mCherry^VP64dCas9^VP64iPSC用Accutase(Stemcell Tech,7920)解离，并在5个基质胶包被的15-cm培养皿中，在增补有10μM Rock抑制剂(Y-27632,Stemcell Tech,72304)的mTesR(Stemcell Tech 85850)中悬浮转导。将细胞以0.2的MOI转导，以获得每个细胞一种gRNA和所述CAS-TF gRNA文库的～550倍覆盖率。在转导后18-20小时，将培养基更换为新鲜的不含Rock抑制剂的mTesR。在转导后30小时，通过在不更换培养基的情况下向培养板直接添加1μg/mL嘌呤霉素(Sigma,P8833)，开始抗生素选择。在转导后48小时，将培养基更换成增补有1μg/mL嘌呤霉素的神经源性培养基(DMEM/F-12营养混合物(Gibco,11320)，1x B-27无血清增补物(Gibco,17504)，1x N-2增补物(Gibco,17502)和25μg/mL庆大霉素(Sigma,G1397))用于剩余的实验，并每天更换培养基。

对于单因子CAS-TF筛选和sgASCL1成对筛选来说，在gRNA文库转导后5天收获细胞用于分拣。对于sgNGN3成对筛选来说，在转导后4天收获细胞。将细胞用1x PBS清洗一次，用Accutase解离，通过30μm CellTrics滤器(Sysmex,04-004-2326)过滤，并重悬浮在FACS缓冲液(含有0.5％BSA(Sigma,A7906)、2mM EDTA(Sigma,E7889)的PBS)中。在分拣之前，取出4.8x10⁶个细胞的等分试样，以代表未分拣的本体群体。在mCherry表达的基础上分拣最高和最低的5％的细胞，并将4.8x10⁶个细胞分拣到每个箱中。分拣使用SH800 FACS细胞分拣仪(Sony Biotechnology)进行。在分拣后，使用DNeasy血液和组织试剂盒(Qiagen,69506)收获基因组DNA。

子文库筛选。CAS-TF子文库筛选使用独立的转导进行一式三份。对于每个平行实验来说，将9.6x10⁶个TUBB3-2A-mCherry ^VP64dCas9^VP64iPSC用Accutase(Stemcell Tech,7920)解离，并在两个基质胶包被的15-cm培养皿中，在增补有10μM Rock抑制剂(Y-27632,Stemcell Tech,72304)的mTesR(Stemcell Tech 85850)中悬浮转导。将细胞以0.2的MOI转导，以获得每个细胞一种gRNA和CAS-TF gRNA子文库的～495倍的覆盖率。在转导后18-20小时，将培养基更换成新鲜的不含Rock抑制剂的mTesR。在转导后30小时，通过在不更换培养基的情况下直接向培养板添加1μg/mL嘌呤霉素(Sigma,P8833)，开始抗生素选择。在转导后48小时，将培养基更换成增补有1μg/mL嘌呤霉素的神经源性培养基(DMEM/F-12营养混合物(Gibco,11320)，1x B-27无血清增补物(Gibco,17504)，1x N-2增补物(Gibco,17502)和25μg/mL庆大霉素(Sigma,G1397))用于剩余的实验，并每天更换培养基。

在gRNA文库转导后5天收获细胞用于分拣。将细胞用1x PBS清洗一次，用Accutase解离，通过30μm CellTrics滤器(Sysmex,04-004-2326)过滤，并重悬浮在FACS缓冲液(含有0.5％BSA(Sigma,A7906)、2mM EDTA(Sigma,E7889)的PBS)中。在分拣之前，取出2x10⁶个细胞的等分试样，以代表未分拣的本体群体。在mCherry表达的基础上分拣最高和最低的5％的细胞，并将2x10⁶个细胞分拣到每个箱中。分拣使用SH800 FACS细胞分拣仪(SonyBiotechnology)进行。在分拣后，使用DNeasy血液和组织试剂盒(Qiagen,69506)收获基因组DNA。

gRNA文库测序。在100μL PCR反应中，从每个基因组DNA样品扩增gRNA文库，使用Q5热启动聚合酶(NEB,M0493)和每个反应1μg基因组DNA。PCR扩增按照制造商的说明书进行，使用60℃的退火温度下的25个循环，并使用下述引物：

Fwd：5′-AATGATACGGCGACCACCGAGATCTACACAATTTCTTGGGTAGTTTGCAGTT

Rev：5′-CAAGCAGAAGACGGCATACGAGAT-(6-bp索引序列)-GACTCGGTGCCACTTTTTCAA

将所述扩增的文库用Agencourt AMPure XP珠子(Beckman Coulter,A63881)，使用0.65×原始体积、然后是1×原始体积的双尺寸选择进行纯化，以纯化282bp的扩增子。在纯化后，将每个样品用Qubit dsDNA高灵敏度测定试剂盒(Thermo Fisher,Q32854)定量。将样品合并，使用20-bp配对末端测序法在MiSeq(Illumina)上使用下述自定义读出和索引引物进行测序：

读出1：5′-GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG(SEQ ID NO：32)。

索引：5′-GCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTC(SEQ ID NO：33)。

读出2：5′-GTTGATAACGGACTAGCCTTATTTAAACTTGCTATGCTGTTTCCAGCATAGCTCTTAAAC(SEQ ID NO：34)。

数据处理和富集分析。使用Bowtie 2(Langmead和Salzberg Nat.Methods 2012,9,357-359)将FASTQ文件与8,505个前间区序列的自定义索引(从bowtie2-build函数生成)对齐。提取每种gRNA的计数并用于进一步分析。所有富集分析均使用R进行。各个gRNA富集使用DESeq2(Love等，Genome Biol.2014,15,550)软件包来进行，以比较每个筛选的高和低、未分拣的和低或未分拣的和高条件之间的gRNA丰度。如果相对于未分拣和低mCherry细胞箱两者来说在高mCherry细胞箱中两种或更多种gRNA被显著富集(FDR<0.01)，则将所述TF选为命中物。

体内表达比较。下载了作为脑发育转录组图谱(Brainspan DevelopmentalTranscriptome Atlas)的一部分生成的RNA测序数据(Miller等，Nature 2014,508,199-206)。在受孕后8至13周之间，为列出的每个发育时间点和解剖区域计算在单因子CAS-TF筛选中鉴定到的17种TF的平均表达。对一组随机的17种TF进行了相同的分析，代表性比较示出在图1F中。

gRNA和cDNA验证。如前所述将来自于所述筛选的排名靠前的富集gRNA克隆到适合的gRNA表达载体中。gRNA验证的执行与筛选类似，区别在于转导在24孔板中进行，并且病毒以高的MOI递送。在gRNA转导后4天收获细胞用于流式细胞术或qRT-PCR。

对于免疫荧光染色实验来说，如前所述将编码排名靠前的富集TF的cDNA PCR扩增，并克隆到强力霉素诱导型表达载体中。将细胞在增补有10μM Rock抑制剂的mTesR中，用指定的TF和编码M2rtTA的独立的慢病毒(Addgene#20342)悬浮共转导。将未修饰的iPSC用于这些实验，以便能够在不受mCherry报告物干扰的情况下用红色荧光团染色。在转导后18-20小时，将培养基更换成增补有0.1μg/mL强力霉素(Sigma,D9891)的神经源性培养基。在转导后4天如前所述进行染色。对于一部分TF来说，在转导后3天，使用TUBB3-2A-mCherry细胞系分拣出mCherry表达最高的细胞。将所述细胞在预先建立的人类星形胶质细胞(Lonza,CC-2565)的单层上重新铺板，并在染色前在神经源性培养基中继续培养8天。H9人类胚胎干细胞中的gRNA和cDNA验证的执行与为iPSC所描述的相似。通过慢病毒转导建立多克隆^VP64dCas9^VP64H9 ESC细胞系。并使用独立的慢病毒递送gRNA。

定量RT-PCR。将细胞用Accutase(StemCell Tech,7920)解离，并以300g离心5min。使用RNeasy Plus(Qiagen,74136)和QIAshredder试剂盒(Qiagen,79656)分离总RNA。在10μL反应中，使用SuperScript VILO反转录试剂盒(Invitrogen,11754)对每种样品0.1μg总RNA进行反转录。每个PCR反应使用1.0μL cDNA，使用Perfecta SYBR Green Fastmix(Quanta BioSciences,95072)并使用CFX96实时PCR检测***(Bio-Rad)。使用纯化的扩增子的稀释液来优化在所有引物的适合动态范围内的扩增效率。所有扩增子产物均通过凝胶电泳和解链曲线分析进行验证。所有qRT-PCR结果均表示为归一化的GAPDH表达的RNA的变化倍数。在本研究中使用的引物参见表4。

表4.在本研究中使用的所有qRT-PCR引物

免疫荧光染色.将细胞用PBS简短清洗，然后用4％多聚甲醛(Santa Cruz,sc-281692)在室温固定20分钟。将细胞用PBS清洗两次，然后与阻断缓冲液(含有10％山羊血清(Sigma,G6767)、2％BSA(Sigma,A7906)的PBS)在室温温育30min。将细胞用0.2％Triton-X100(Sigma,T8787)在室温通透化10min。使用下述第一抗体在室温温育2小时：小鼠抗TUBB3抗体(1:1000稀释，BioLegend,801201)；兔抗MAP2抗体(1:500稀释，Sigma,AB5622)。将细胞用PBS清洗三次，然后与第二抗体和DAPI(Invitrogen,D3571)在阻断溶液中在室温温育1小时。使用下述第二抗体：Alexa Fluor 488山羊抗小鼠抗体(1:500稀释，Invitrogen,A-11001)；Alexa Fluor 594山羊抗兔抗体(1:500稀释，Invitrogen,A-11012)。将细胞用PBS清洗三次，并用Zeiss 780直立式共聚焦显微镜成像。

对于用于gRNA验证的活细胞NCAM染色，将细胞用Accutase(Stemcell Tech,7920)解离，以300g离心5min，并以10x10⁶个细胞/mL的密度重悬浮在染色缓冲液(含有0.5％BSA(Sigma,A7906)和2mM EDTA(Sigma,E7889)的PBS)中。以每1x10⁶个细胞0.6μg的量添加小鼠抗CD56抗体(NCAM,Invitrogen,12-0567)，并在4℃温育30min。将细胞用1mL染色缓冲液清洗，以300g离心5min并重悬浮在染色缓冲液中，用于在SH800 FACS细胞分拣仪(SonyBiotechnology)上分析。

RNA-测序和tetO cDNA表达。将TUBB3-2A-mCherry iPSC用编码M2rtTA的慢病毒和指定tetO-cDNA共转导。细胞在含有10μM Rock抑制剂的mTesR中转导。第二天，将培养基更换成增补有0.1μg/mL强力霉素的神经源性培养基(DMEM/F-12营养混合物(Gibco,11320)，1x B-27无血清增补物(Gibco,17504)，1x N-2增补物(Gibco,17502)和25μg/mL庆大霉素(Sigma,G1397))。在转入基因表达2或3天后，使用SH800 FACS细胞分拣仪以半纯度模式对细胞进行分拣。将分拣的细胞在基质胶包被的24孔板上重新铺板，并在增补有各10ng/mL的BDNF、GDNF和NT-3(PeproTech)的神经源性培养基中培养，直至6或7天后收获。

使用RNeasy小提试剂盒(Qiagen)提取总RNA，并将100ng RNA用于开发RNA-seq文库。RNA-测序文库使用Truseq标准mRNA试剂盒(Illumina)，按照制造商的方案来制备。将所述文库在NextSeq 500上以高输出模式，使用75bp配对末端读出来测序。将读出序列首先用Trimmomatic v0.32裁剪以除去接头，然后使用STAR aligner(Langmead等，Nat.Methods2012,9,357-359)与GRCh38比对。使用Gencode v22中的综合基因注释，使用来自于亚读出软件包(1.4.6-p4版)的特征计数获得基因计数。差异表达分析使用DESeq2来确定，其中将基因计数拟合到负二项式广义线性模型(GLM)，并用Wald统计确定显著命中物。如果在所有测试的条件下至少三个样品具有TPM>1，则将基因纳入分析。基因本体分析使用基因本体联合数据库(Ashburner等，2000，The Gene Ontology Consortium，2017)和突触基因本体联合数据库(Koopmans等，Neuron 2019,103,217-234e214)来进行。

电生理学。将TUBB3-2A-mCherry iPSC用编码M2rtTA的慢病毒和单独的或与tetO-LHX8组合的tetO-NEUROG3共转导。细胞在含有10μM Rock抑制剂的mTesR中转导。第二天，将培养基更换成增补有0.1μg/mL强力霉素的神经源性培养基。在转入基因表达3天后，使用SH800 FACS细胞分拣仪以半纯度模式对细胞进行分拣。将分拣的细胞在基质胶包被的盖玻片上重新铺板，并在实验的剩余部分中在增补有各10ng/mL的BDNF、GDNF和NT-3(PeproTech)的神经源性培养基中培养。

在诱导转入基因表达后7天，在Zeiss Axio Examiner.D1显微镜下对培养的细胞进行全细胞膜片钳记录。为避免渗透压休克，将培养基在大约5分钟内以逐步方式逐渐更换为人工CSF(aCSF)，然后将盖玻片移至记录室。aCSF含有124mM NaCl，26mM NaHCO₃，10mM D-葡萄糖，2mM CaCl₂，3mM KCl，1.3mM MgSO₄和1.25mM NaH₂PO₄(310mOsm/L)，并在室温下用95％O₂和5％CO₂连续鼓泡。使用红外照明和微分干涉对比光学元件(IR-DIC)，在20x水浸物镜下检查细胞。实验人员对条件不知情，并选择形态学上最复杂的神经元进行记录。使用P-97拉拔器(Sutter Instrument)从硼硅酸盐玻璃毛细管拉出电极(4-7MΩ)，并填充含有135mM甲磺酸钾、8mM NaCl、10mM HEPES、0.3mM EGTA、4mM MgATP和0.3mM Na₂GTP的细胞内溶液(用KOH调节到pH 7.3，用蔗糖调节到295mOsm/L)。在千兆欧姆密封破裂后，在电压钳模式下用短暂的超极化脉冲测量膜电阻，并从放大器的电容补偿电路估算膜电容。然后，在电流钳模式下记录静息膜电位。最后，施加小的保持电流以将膜电位调整到-60mV左右，并通过注入越来越多的电流来生成输入-输出曲线。数据使用Multiclamp 700B放大器(Molecular Devices)来记录，并使用Digidata 1550(Molecular Devices)在50kHz下进行数字化。基于使用自定义MATLAB脚本生成的第一个动作电位来计算动作电位性质。无论峰值幅度如何，如果动作电位具有特征性的双分量上升阶段，则通过目测来计数它们。所有实验都在对条件不知情的情况下进行分析，并且仅使用在整个数据收集期间保持稳定的记录。

基于正交CRISPR的基因调控。将TUBB3-2A-mCherry ^VP64dCas9^VP64 iPSC用含有ZFP36L1、HES3或乱序金黄色葡萄球菌gRNA的一体化dSaCas9^KRAB慢病毒(Thankore等，Nat.Commun.2018,9,1674)转导。2天后，使用0.5μg/mL嘌呤霉素开始抗生素选择，并将细胞在mTesR中继续培养7天。在用dSaCas9^KRAB和金黄色葡萄球菌gRNA转导后9天后，将细胞用编码sgNGN3或sgASCL1的慢病毒转导，并切换成神经源性培养基。对于mRNA测序来说在gRNA转导后3天收获细胞，对于流式细胞术来说在gRNA转导后4天收获细胞。

使用RNeasy Plus(Qiagen,74136)和QIAshredder试剂盒(Qiagen,79656)分离总RNA。制备文库，并由Genewiz在Illumina Hiseq上使用2x150bp配对末端读出进行测序。测序运行的平均质量得分为39.03，并且94.48％的读出≥30。每个样品的平均读出数目为～50,000,000个读出。mRNA测序分析如前为tetO cDNA实验所述来进行。GFP转入基因的表达使用bowtie2来定量，以将修剪后的读出与使用bowtie2-build函数生成的自定义GFP索引对齐。将原始计数针对测序深度进行标准化，并显示为在所分析的三种条件下的相对计数。

统计方法。统计分析使用GraphPad Prism 7来进行。关于为每个实验运行的特定统计检验的详细信息参见图例。统计显著性用星号(*)表示，并指示计算的p值<0.05。

实施例2

用于神经元细胞命运的CRISPRa筛选的人类多能干细胞系的产生

为了能够在CRISPRa筛选框架内富集神经元细胞，我们将2A-mCherry序列***到人类多能干细胞系中泛神经元标志物TUBB3的外显子4中(图7A)。TUBB3几乎专门表达在神经元中，并在细胞体外分化并重编程成神经元后很早被诱导。2A介导的核糖体跳跃确保mCherry充当TUBB3的翻译报告物，同时还减轻了可能由直接蛋白质融合引起的对内源TUBB3功能的任何干扰。

为了能够在我们的TUBB3-P2A-mCherry细胞系中实现高效稳健的靶向基因激活，我们使用慢病毒载体建立了一种克隆细胞系，其在人类遍在蛋白C启动子的控制下表达在N-和C-端两端均融合到VP64反式激活结构域的dCas9(^VP64dCas9^VP64)(Kabadi等，NucleicAcids Res.2014,42,e147)。^VP64dCas9^VP64以前已被用于实现足以用于细胞命运重编程的稳健的内源基因激活。

为了在我们的^VP64dCas9^VP64 TUBB3-2A-mCherry细胞系中评估用于神经元分化的CRISPRa方法，我们递送了靶向NEUROG2的近端启动子的4种慢病毒gRNA的合并物，所述NEUROG2是神经发生的一种主要调控物，当被异位过表达时或用CRISPRa内源激活时足以从多能干细胞产生神经元(Chavez等，Nat.Methods 2015,12,326-328；Zhang等，Neuron2013,78,785-798)。在gRNA表达5天后，我们检测到靶基因NEUROG2以及早期泛神经元标志物NCAM和MAP2的上调(图7B)。靶向基因激活仅在^VP64dCas9^VP64和NEUROG2 gRNA两者被共表达的情况下实现(图7B)。

在递送NEUROG2 gRNA后，我们在转导后6天相对于未处理的对照细胞检测到15％mCherry阳性细胞(图7C)。为了评估我们的TUBB3-2A-mCherry报告细胞系作为神经元表型的替代性指标的适用性，我们使用荧光激活细胞分拣(FACS)分离了mCherry表达最高和最低的10％细胞。高mCherry细胞也具有mCherry标记的基因TUBB3以及MAP2的较高的mRNA表达水平(图7D)。所述TUBB3-2A-mCherry细胞和CRISPRa方法被用于本研究中描述的所有筛选中。

实施例3

神经元细胞命运的主要调控物的CRISPRa筛选

为了以无偏倚的方式鉴定一组神经元细胞命运调控物，我们在TUBB3-2A-mCherry细胞系中进行了CRISPRa合并gRNA筛选(图1A)。所述gRNA文库由靶向一组假定的人类TF的gRNA组成(Vaquerizas等，Nat.Rev.Genet.2009,10,252-263)。TF对于细胞命运特化来说是必需的，并已广泛用于细胞重编程和定向分化应用。我们选择了一组1,496个TF，并构建了每个转录起始位点5种gRNA的靶向gRNA文库，其从优化的CRISPRa gRNA的基因组广度的文库提取(Horlbeck,2016，紧凑且高度活跃的下一代文库(Compact and highly activenext-generation libraries)，eLife)(图1B)。

将所述CRISPRa-TF gRNA慢病毒文库(被命名为CRISPR-激活筛选TF或CAS-TF)以0.2的感染复数(MOI)和550倍的文库覆盖率转导，以确保大多数细胞激活单种TF，并考虑了体外细胞分化的随机且通常低效的本质(图1A)。在gRNA表达5天后，我们使用FACS分离了mCherry表达最高和最低的5％的细胞(图1C)，然后在对每个分拣的箱中的前间区序列进行深度测序后使用差异表达分析定量gRNA丰度。我们收集了mCherry分布的5％的尾部，以便能够识别TUBB3表达的细微变化。细胞在转导后第5天进行分拣，以便有足够的时间进行TF表达和报告基因的诱导，同时限制了由长时间培养或通过传代造成的有丝***后神经元的丧失。

与未分拣的本体细胞群体相比，在高表达mCherry的细胞箱中存在显著富集的gRNA(FDR<0.01；图1D)。当将mCherry高表达细胞与mCherry低表达细胞进行比较时，我们观察到类似的结果(图8A)。在不同细胞箱之间，一组100个乱序非靶向gRNA保持不变(图1D)。

对于给定靶基因来说，在一组gRNA中使用基于dCas9的激活物实现的转录激活程度可以变化。因此，我们预期对于大多数靶基因来说将观察到有活性和无活性gRNA的混合物。此外，脱靶gRNA活性可能通过独立于预测的TF靶调节报告基因的表达而促进假阳性。为了确保我们不会过度解释单种gRNA的结果，如果TF具有至少两个相对于未分拣的细胞和低mCherry细胞箱在mCherry高表达细胞箱中显著富集的gRNA(FDR<0.01)，则它们被选为高置信度命中物。这种方法产生了作为候选神经源性因子的17个TF的名单(图1E)。这些TF中的大部分属C2H2 ZF、bHLH或HMG/Sox DNA结合结构域家族这三个所有人类转录因子中最丰富的家族(图1E)。

我们使用作为BrainSpan(Miller等，Nature 2014,508,199-206)(http:// brainspan.org)的一部分展示的可公开获得的发育人脑中的基因表达数据分析了所述17个候选神经源性因子的表达。我们观察到横跨人脑的几个解剖学区域和发育时间点计算的所述17种因子的平均表达(参见实施例1)比随机产生的一组17种TF的平均表达更高(图1F)。

作为CAS-TF筛选的保真度的进一步证明，我们观察到三种充分表征的原神经因子NEUROD1、NEUROG1和NEUROG2各自具有几个在高表达mCherry的细胞中富集的gRNA，而5个乱序非靶向gRNA的随机集合不变(图1G)。基于我们的严格选择标准，具有预期的原神经活性的第四个基因ASCL1未被选为高置信度命中物。然而，在高表达mCherry的细胞中富集了单种ASCL1 gRNA(图8A)，并且这个gRNA足以产生表达NCAM和MAP2的mCherry阳性细胞(图8B和图8C)。

实施例4

候选神经源性转录因子的验证

为了验证候选神经源性TF的活性，我们对在CAS-TF筛选中鉴定到的17种TF的最富集的gRNA进行了单独测试。我们将这些gRNA以高MOI转导到TUBB3-2A-mCherry细胞系中，并在4天后评估了报告物表达(图2A)。相对于乱序非靶向gRNA的递送，所有测试的gRNA均不同程度地提高mCherry阳性细胞的数目(～2％至～50％)，尽管只有一部分即10种因子以统计显著性做到这一点(图2A；α＝0.05)。为了验证CRISPRa活性，我们确认了所有TF均对适合的gRNA的表达做出响应而上调(图9A)。TF诱导的程度与靶基因的基础表达水平直接相关，这与以前的报道相一致(Konerman Nature 2015,517,583-588)(图9B)。

对ATOH1和NR5A1的在CAS-TF文库中代表的所有5种gRNA的进一步验证表明，当所述gRNA被单独测试时，在从合并筛选计算的富集与使用报告基因表达评估的分化程度之间存在直接相关性(图2B)。在某些情况下，在筛选中未被显著富集的gRNA仍然能够进行适度基因激活和神经元诱导(图9C和图9D)。例如，NEUROG2 gRNA足以上调NEUROG2，这与NCAM和MAP2诱导并行，但在CAS-TF筛选中未被富集(图9C和图9D)。

鉴于我们依靠单种报告基因作为神经元表型的替代性指标，我们预计在CAS-TF筛选中富集的TF将包括足以启动分化的神经元命运的主要调控物，以及辅助因子或仅调控一个或一部分神经元基因的下游效应物。为了在我们的一组候选因子中使这些差异更清楚，我们首先在gRNA递送后4天评估了另外两种神经元标志物NCAM和MAP2的表达。几种TF上调这些标志物中的一种或两种，而其他TF不产生变化或甚至下调(图2C)。例如，诱导平均为34％的mCherry表达百分数的最大提高之一的SOX4，对NCAM和MAP2表达没有可检测的影响(图2A和图2C)。

利用在我们的CAS-TF筛选中鉴定到的一部分TF的表达，我们使用免疫荧光染色评估了神经元形态的存在(图2D)。为了确保稳健的TF表达并控制差异gRNA活性，我们过表达了编码每种TF的cDNA。包括NEUROG3和NEUROD1在内的几种因子在表达4天之内产生TUBB3染色呈阳性的具有复杂的树突分枝的细胞(图2D)。相比之下，许多TF正如预期上调TUBB3，但未能产生具有神经元形态的细胞。我们推断在这些细胞中缺乏形态发育可能归因于较慢的分化动力学。其他神经元重编程范式通常需要长期培养才能实现形态成熟。考虑到这一点，我们进一步将所述细胞与原代星形胶质细胞一起培养11天，并发现随着培养时间延长，ATOH1、ATOH7和ASCL1足以产生MAP2染色呈阳性的具有复杂神经元形态的细胞(图2E)。对于KLF7、NR5A1和OVOL1来说，随着培养延长，我们没有观察到类似的形态成熟。

为了解释不同多能干细胞对这些TF的表达的响应的差异，并且为了观察对于几种因子来说缺少完整的神经元分化是否是细胞系特异性现象，我们还在H9胚胎干细胞中测试了KLF7、NR5A1和OVOL1。我们同样观察到TUBB3的明显上调而没有神经元形态的发生(图2F)。正如预期，NEUROG3能够诱导快速分化并伴有清晰的神经元形态的发生。

尽管所述17种高置信度TF命中物具有高验证率，但我们怀疑许多原神经TF与ASCL1类似，不满足我们的严格截止标准。事实上，有另外109种TF至少含有单种在mCherry高表达细胞中显著富集的gRNA，但不被称为命中物。为了进一步调查这些TF，我们首先关注与17种高置信度命中物之一共享一个亚家族的TF。例如，ATOH1是具有几种富集的gRNA的高置信度命中物，但ATOH7和ATOH8都只有单种富集的gRNA(图8A)。当这些gRNA被单独测试时，ATOH7和ATOH8均足以产生表达NCAM和/或MAP2的mCherry阳性细胞(图8B和图8C)，表明在这个截止值下仅具有单种富集的gRNA的许多命中物代表了真阳性。

为了更全面地验证这109种TF的活性，我们进行了只靶向这些TF的二次子文库筛选(图10A-图10E)。这个筛选以与初次CAS-TF筛选相同的方式进行(图10A)，但所述新的子文库由每种TF平均33种gRNA组成(图10B)。该筛选揭示出在高mCherry细胞中富集的其他gRNA(图10C)。然而，所述子文库中的大部分基因具有相对少的富集gRNA，类似于乱序非靶向gRNA合并物(图10D)。几种基因在mCherry高表达细胞箱中富集超过40％的gRNA。然而，这些gRNA的个体验证揭示出对mCherry报告基因的影响大多是轻微的(图10E)。该分析既为稳健CRISPRa筛选的设计提供信息，也证实了我们的筛选设计在鉴定最稳健的神经源性因子方面是成功的。

实施例5

组合gRNA筛选鉴定神经元辅助因子

TF通常协同作用以协调基因表达程序。同样，TF介导的细胞重编程通常受益于TF组合的共表达，以提高转化效率、成熟度和亚型特化。由于隐含在使用共表达的TF时观察到的改善背后的机制通常是未知的，并且由于有效的辅助因子在单独表达时可能具有极小活性，因此预测有效的TF混合物可能具有挑战性。为了应对这一挑战，我们使用成对gRNA进行了合并筛选，以鉴定调节人类多能干细胞的神经元分化的调控物的新组合。

我们假设神经元分化的某些共调控物在自身单独表达时会缺少可检测的活性，因此不能在我们的初始单因子CAS-TF筛选中鉴定出来。相反，这些辅助因子可能需要与另一种神经源性因子配对才能揭示出它们的活性。为了能够鉴定此类TF，我们选择将从单因子筛选鉴定到的验证过的神经源性TF与剩余的CAS-TF文库配对来进行筛选(图3A)。使用针对NEUROG3(sgNGN3)或ASCL1(sgASCL1)的单种gRNA进行了两次这样的独立筛选(图3A)。以从以前的研究改变的形式(Adamson等，Cell 2016,167,1867-1882e1821)，将一对gRNA在单个慢病毒载体上从两个独立的RNA聚合酶III启动子共表达。选择NEUROG3和ASCL1是因为它们具有强的神经源性活性，但分化动力学不同(图2D和图2E)。所述成对筛选如对单因子筛选所述的方式进行，其中每个细胞现在接受一对gRNA。

由于在每个细胞中组成性存在验证过的神经源性因子，因此出现了明确的mCherry阳性细胞群体。由于这种基础神经源性刺激，除了检测到新的分化正辅助因子之外，我们还可以容易地在mCherry低表达细胞中检测到负调控物(图3B和图11A和图11B)。

提高转化效率的有效辅助因子通常在不同的神经元重编程范式中共有，但可以以背景依赖性方式促进亚型特化。同样，我们假设在NEUROG3与ASCL1之间共有许多辅助因子。与这个假设相一致，我们发现在所述两个筛选之间共有大多数正调控物(图3C)。然而，当与NEUROG3或ASCL1组合时，有几种因子被独特地富集(图3C)。例如，FEV仅仅随着NEUROG3正富集，而NKX2.2仅随着ASCL1正富集。重要的是，sgNGN3和sgASCL1筛选都鉴定到在单因子CAS-TF筛选中未观察到的新的TF(图12A-图12D)。许多这些TF，包括LHX6、LHX8和HMX2，都与神经元发育和亚型特化有关，但在神经元的体外产生中尚未被深入表征。在所有三种筛选中鉴定到的所有候选神经源性因子的名单可以在表1中找到。

表1.三种神经元分化筛选中的所有阳性命中物

来自于两个成对CAS-TF筛选的阳性命中物涵盖了不同的一组TF家族(图3D)。这些TF中的大部分在多能干细胞中不表达或低表达，但有几种因子表达较高(Consortium.Nature 2012,489,57-74)(图3D)。选择了一组8种TF进行进一步验证。预计这些TF本身具有极小活性，而在与NEUROG3和/或ASCL1共表达时增强神经源性活性(图3E)。尽管选择了这组8种TF用于进一步表征，但仍有大量通过CRISPRa成对筛选揭示的其他候选因子可供进一步研究(表1)。

相比于与乱序gRNA共表达的sgNGN3，所有测试的TF在与sgNGN3配对时将mCherry阳性细胞的转化效率提高多达3倍(图3F)。由于sgASCL1仅将mCherry报告基因提高到适度水平，因此我们选择使用NCAM染色来进行gRNA验证，以获得与这种gRNA的配对。只有E2F7和HMX2自身对NCAM表达具有轻度影响(图3G)。然而，几种TF显著提高ASCL1的神经源性活性，其中E2F7提高多达8倍(图3G)。与来自于所述筛选的预测结果相一致，NKX2.2仅在使用ASCL1时而不在使用NEUROG3时具有显著影响(图3E、图3F和图3G)。

实施例6

神经源性转录因子调节亚型特异性和成熟

神经元亚型身份和突触成熟度是决定体外衍生的神经元在疾病建模和细胞疗法应用中的效用的重要特点。因此，开发改进成熟动力学和亚型特化纯度的方案已成为本领域中的首要关注点。考虑到通过我们的CRISPRa筛选鉴定到的神经源性TF的多样性以及通过验证实验观察到的转化效率的范围，我们推断许多这些TF可能以不同方式影响亚型身份和成熟。为了开始解决这个问题，我们进行了批量mRNA测序，以便更全面地评估神经元转化的程度并比较使用不同TF产生的神经元群体中的转录多样性。

我们首先分析了源自于单种TF的神经元。尽管TF的组合通常增强亚型产生的特异性并提高转化效率和成熟动力学，但单种TF可能足以产生具有亚型倾向性的有功能的神经元。我们选择首先对源自于ATOH1或NEUROG3过表达的神经元进行mRNA测序(图4A-图4F)。这些TF具有一些通过验证实验确定的最高转化效率(图2A-图2F)，这有助于分离足够的材料用于测序。此外，尽管ATOH1和NEUROG3两者的神经源性活性以前已被证实，但我们对ATOH1和NEUROG3在体外神经元分化中的作用的理解仍不完整。

我们过表达了编码ATOH1或NEUROG3的cDNA，使用FACS纯化了TUBB3-mCherry阳性细胞，并在转入基因表达7天后进行了mRNA测序。相对于起始的未分化多能干细胞群体，两种神经元群体都具有超过3000个上调的基因(图4A)。这组共有基因富集在与神经元分化和发育相关的基因本体(GO)条目中(图4B)。重要的是，相对于多能干细胞，在ATOH1(3个平行实验)和NEUROG3(2个平行实验)的所有平行实验中高度富集了一组泛神经元基因(图4C)。

令人吃惊的是，我们在ATOH1和NEUROG3衍生的神经元之间，在所有可检测的基因中观察到强相关性，表明在核心神经元程序的诱导和多能性网络的抑制中具有惊人的一致性(图4D)。然而，在使用ATOH1或NEUROG3时一部分基因表达更高(图4D)。这些基因富集在对于NEUROG3来说与谷氨酸能活性相关并且对于ATOH1来说与多巴胺能活性相关的GO条目中(图4E)。事实上，当我们检查所述两种神经元亚型的一组预期标志物时，我们发现对于ATOH1来说明显富集多巴胺能标志物，并且对于NEUROG3来说明显富集谷氨酸能标志物(图4F)。在ATOH1衍生的神经元中，尽管多巴胺能神经元的某些典型标志物例如酪氨酸羟化酶(TH)保持低表达，但与多巴胺能特化相关的许多TF例如LMX1A表达更高(图4F)。

在许多情况下，TF的组合可能有助于神经元亚型特化的精确性或提高转化效率和成熟度。我们推断在我们的成对gRNA筛选中鉴定到的辅助因子，当与在单因子筛选中鉴定到的神经源性因子组合时，将充当调节亚型身份和成熟的主要候选物。因此，我们选择对源自于单独的或与E2F7、RUNX3或LHX8组合的NEUROG3的神经元进行mRNA测序。优先选择这三种辅助因子是因为它们对通过gRNA验证评估的分化效率具有实质性影响(图3A-图3G)。我们选择NEUROG3是由于它明确地偏好产生谷氨酸能神经元，通常被认为是默认亚型。我们过表达了编码单独的或与E2F7、RUNX3或LHX8组合的NEUROG3的cDNA，并在转入基因表达6天后进行了mRNA测序。

与ATOH1和NEUROG3的比较相似，所有TF对共有一组核心的上调基因(图5A)。然而，相对于单独的NEUROG3，在使用每个TF对时被独特上调的基因富集在与神经元分化和发育相关的GO条目中，这与以前测量到的在表达这些神经元辅助因子时TUBB3表达的提高和转化效率的改进相一致(图5B)。

重要的是，每个TF对独特地上调与特定神经元亚型的特化和成熟相关的基因。例如，添加RUNX3导致编码与本体感受背根神经节神经元的发育相关的TrkC neutrophin-3受体的NTRK3的表达提高(图5C)。添加E2F7导致编码参与神经元命运定型和形态发生的p21细胞周期调控物的CDKN1A的提高(图5D)。添加LHX8时表达更高的一部分基因富集在与突触发育这种神经元成熟的标志相关的突触基因本体(SynGO)条目中(图5E)。与GO条目分析相一致，在添加LHX8时，一组与突触发育、调节和功能相关的基因被明显上调(图5F)。

为了评估添加LHX8是否影响NEUROG3衍生的神经元的电生理成熟，我们在转入基因诱导后7天对TUBB3-2A-mCherry阳性细胞进行了膜片钳记录。相对于单独的NEUROG3，在添加LHX8时尽管我们没有观察到静息膜电位的差异(图5G)，但我们确实观察到了膜电阻的降低(图5H)和膜电容的提高(图5I)。LHX8改善了动作电位成熟的几个指标，包括放电阈值的降低(图5J)、动作电位高度的提高(图5K)和动作电位半宽度的降低(图5L)。此外，对于给定的使用电流注入的去极化步骤来说，含有LHX8的神经元以更高的频率触发动作电位(图5M)，并且记录到的触发多个动作电位的细胞的比例更高(图5N)。使用单独的NEUROG3产生的细胞更通常不能触发动作电位或仅触发单个低幅度动作电位(图5N)。

实施例7

组合gRNA筛选鉴定神经元命运的负调控物

通过细胞重编程和分化方案实现的转化效率通常随着起始和终止细胞类型而变。通常，亲缘关系更远的细胞类型或更衰老的细胞系不太易于转化。例如，星形胶质细胞向神经元的重编程通常比成纤维细胞向神经元的重编程更高效，并且相对于胚胎成纤维细胞，在成人成纤维细胞中效率进一步降低。这些重编程结果的差异可以部分用不同类型或发育年龄的细胞的基因表达谱和表观遗传景观的变化来解释。因此，这种细胞环境可以产生阻碍正常TF活性的障碍，从而降低转化效率和保真度。

高通量功能丧失性RNAi筛选有助于鉴定阻止细胞类型重编程和影响转化效率的分子障碍。重要的是，消除这些障碍通常引起重编程结果的显著改善。通过我们的成对CRISPRa筛选，我们鉴定到其激活阻碍神经元分化的TF(图3B和图11A和图11B)。这些候选负调控物除了许多其他未表征的TF之外，还包括Notch信号传导下游的经典神经元阻遏物的HES基因家族的几个成员。在所有三种筛选中鉴定到的所有候选负调控物的名单可以在表2中找到。

表2.三种神经元分化筛选中的所有负命中物

有趣的是，大多数负调控物在sgNGN3和sgASCL1筛选中共有(图6A)。它们由一组多样化的TF组成，跨越许多TF家族，在胚胎干细胞中具有广范围的基础表达。当使用与NEUROG3 gRNA共表达的单种gRNA进行单独测试时，包括HES和DMRT1在内的几种TF将mCherry阳性细胞的百分率降低到基础水平(图6B)。为了证明这种阻遏不仅仅局限于报告基因，我们还证明了所测试的8种阻遏型因子中的7种将NCAM表达降低多达8倍(图6C)。当在H9人类胚胎干细胞中测试这些因子时，我们同样观察到神经元分化的阻遏(图6D)。事实上，在iPSC相比于ESC中，这些负调控物的相对影响之间存在引人注目的相关性(图6E)，强调了这些影响在多种多能干细胞系中的稳健性。

我们推断，在多能干细胞中基础表达的这些鉴定到的负调控物中的一些可能充当神经元转化的障碍，并且它们的抑制可以提高分化效率。来自于不同细菌物种的Cas9蛋白可以被编程，用于正交基因调控和表观遗传修饰。因此，我们选择使用基于金黄色葡萄球菌的Cas9蛋白的正交dSaCas9^KRAB(Thakore等，Nat.Commun.2018,9,1674)来靶向在多能干细胞中基础表达的两种负调控物ZFP36L1和HES3的启动子(图6F)。使用dSaCas9^KRAB靶向这些基因的启动子导致ZFP36L1和HES3的转录分别被阻遏10倍和4倍(图13A)。

将dSaCas9^KRAB用于靶向基因阻遏能够共表达正交的^VP64dSpCas9^VP64，同时激活神经源性因子(图6F)。首先将TUBB3-2A-mCherry^VP64dSpCas9^VP64iPSC用共表达ZFP36L1、HES3或乱序的金黄色葡萄球菌gRNA的dSaCas9^KRAB慢病毒转导。在金黄色葡萄球菌gRNA转导后9天后，将细胞用编码来自于酿脓链球菌的sgNGN3或sgASCL1的慢病毒转导，并在该最后的转导后4天进行分析。ZFP36L1的敲减将使用sgNGN3获得的mCherry阳性细胞的百分率相对于表达乱序金黄色葡萄球菌gRNA的对照细胞系提高2倍(图13B)。同样，在使用sgASCL1获得的分化细胞的NCAM阳性群体中，ZFP36L1敲减将mCherry报告基因的表达水平提高1.2倍(图13C)。

为了鉴定这种基于正交CRISPR的调控的基因组广度的效果，我们对源自于NGN3激活并伴有ZFP36L1或HES3阻遏的神经元进行了mRNA测序。尽管相对于接受乱序金黄色葡萄球菌gRNA的细胞HES3的敲减仅仅引起基因表达的少量细微变化(图14A)，但相对于单独的NGN3激活ZFP36L1的敲减引起全局基因表达谱的显著变化(图6G和图14B)。在ZFP36L1敲减细胞中，我们还观察到NEUROG3和酿脓链球菌gRNA的略微增加，其通过gRNA载体上的GFP转入基因的表达来量化(图14C和图14D)。在具有ZFP36L1敲减的神经元细胞中上调的基因富集在与神经元分化和形态发育相关的GO条目中(图6H)。相比之下，被ZFP36L1敲减下调的基因富集在与细胞周期发育和进展相关的GO条目中(图6H)。被ZFP36L1敲减上调的基因的实例包括神经元转录因子NEUROD4、INSM1和OLIG2，以及参与神经元形态发生的基因包括NEFL、NGEF和NTN1(图6I)。

实施例8

讨论

正如本文中详述的，我们通过单个和组合CRISPRa筛选***地剖析了1,496种假定人类转录因子在调控多能干细胞的神经元分化中的作用。这项工作强调了基于CRISPR的技术以高通量方式改变基因表达的用途，并突出了基于dCas9的基因激活用于研究基因表达在复杂细胞表型中的因果作用的稳健本质。

使用早期泛神经元标志物如TUBB3作为神经元表型的替代性指标，能够鉴定一组广范围的具有不同神经源性活性的TF。例如，尽管NEUROG3足以在表达的4天内迅速产生神经元细胞，但ATOH7和ASCL1需要更长的培养时间才能实现类似的表型(图2D和图2E)。很可能添加辅助因子例如在我们的组合gRNA筛选中鉴定到的辅助因子可以提高分化的效率和动力学，正如使用其他细胞重编程研究所看到的(Pang等，Nature 2011,476,220-223)。此外，包括KLF7、NR5A1和OVOL1在内的几种TF诱导TUBB3的表达，但不能产生神经元细胞(图2D)。这些TF可能充当辅助因子或下游调控物，需要其他神经源性因子的共表达才能获得更完全的分化。事实上，许多在单因子筛选中鉴定到的TF在成对gRNA筛选中也是命中物(表1)。

我们发现，包括ASCL1和ATOH7在内的几种具有明显神经源性活性的TF在CAS-TF筛选中仅有单种gRNA被富集(图8)。由于单种富集的gRNA可能是脱靶活性或噪声的结果，因此准确分类这些gRNA可能具有挑战性。每个基因使用更多的gRNA或下一代基于dCas9的激活物平台可能有助于更准确地定义真正的正效应。事实上，我们的每个基因使用更大数目的gRNA的子文库筛选揭示出几个另外的候选命中物(图10)。gRNA设计和筛选分析的进一步改进可能继续使基于CRISPR的筛选更加稳健，并且可以扩展到更复杂的表型。

通过使用成对gRNA筛选，我们鉴定到一组改进神经元分化效率、成熟和亚型特化的TF。有趣的是，这些TF中的大多数本身不具有神经源性活性，正如在我们的单因子CAS-TF筛选中所评估的。这个观察强调了控制细胞分化的协同TF相互作用的重要性，并支持使用无偏倚的方法来鉴定这些TF。我们将E2F7鉴定为可以提高神经元转化效率(图3F和图3G)，这可能是由于它在抑制细胞增殖中的已知作用，这是从增殖性多能干细胞向有丝***后神经元转变中的重要开关。此外，我们发现RUNX3独特地诱导亚型特异性受体基因表达(图5C)，因此可以作为分化方案的有用补充，以更精确地指导神经元亚型身份。神经元辅助因子LHX8对神经元成熟的标志物具有深远影响，正如从许多突触相关基因的富集和电生理成熟的明显改善中看出的(图5)。功能性突触形成是体外衍生的神经元的必需表型，并且它通常是限速步骤。通过TF编程提高突触成熟可能有助于加快用于疾病建模和药物筛选的有用神经元模型的开发。

未来的研究可能会利用先进的筛选平台来进一步表征规定细胞谱系特化因子。神经元TF的更详尽的名单可能通过执行依赖于多个神经元标志物或使用成熟或亚型身份的标志物的筛选来鉴定。或者，这些筛选可以使用单细胞RNA测序(scRNA-seq)输出而不是对几个离散的标志物进行分析来执行，以更准确地定义使用不同的TF组合获得的神经元表型的多样性，并针对不断增长的来自于人脑样品的scRNA-seq数据图谱来衡量这些结果。从本文详述的筛选鉴定到的TF可以充当子文库的主要候选物，以在这些可能在文库尺寸规模方面更加受限的替代方法中进行测试。

所述成对gRNA筛选还鉴定到神经元分化的负调控物。这些TF之一ZFP36L1的敲减足以改进分化，导致基因表达朝向更加分化的神经元表型的全面变化(图6G、图6H、图6I)。尽管在这个实施例中对分化的影响有些轻微，但在不太易于转化的细胞类型例如成年成纤维细胞中可能会看到更剧烈的改进。重要的是，许多在我们的筛选中鉴定到的负调控物在用于重编程研究的其他细胞类型例如成纤维细胞和星形胶质细胞中表达。

除了TF之外还靶向表观遗传修饰物或其他基因子集的另外的CRISPRa筛选可能有助于进一步阐明基因激活可以调节神经元细胞命运的程度。用于内源基因表达和染色质状态的可编程调控的合成***的持续开发，以及这些***在更复杂的体外和体内模型中的应用，可能使研究能够更全面地定义控制细胞命运决定的基因网络和表观遗传机制。

总体而言，如本文中详述的，我们已鉴定了在人类细胞中控制神经元命运特化的一组广泛的转录因子。这个因子的目录可以作为开发用于以高的效率和保真度产生多样化神经元细胞类型的方案的基础，用于再生医学和疾病建模应用。最终，本文中详述的CRISPRa筛选平台可以扩展到其他细胞重编程范例，并促进许多临床相关的细胞类型的体外生产。

实施例9

鉴定成肌祖细胞命运的新的驱动物的高通量CRISPR激活筛选

骨骼肌再生是由肌肉卫星细胞介导的复杂过程。驱动从肌肉卫星细胞的正确成肌分化的事件级联已被良好地表征；然而，在胚胎发育过程中规定卫星细胞命运的上游事件尚未被完全理解。转录因子PAX7在卫星细胞的特化和维持中发挥重要作用，其过表达可以在人类多能干细胞中决定成肌祖细胞的命运。为了研究卫星细胞命运的新的驱动物，我们在人类H9胚胎干细胞中产生了PAX7-2a-GFP细胞系。我们使用了靶向所有人类转录因子的启动子处的gRNA文库，并共同递送了基于CRISPR/Cas9的转录激活物，以***性地鉴定PAX7表达的独立驱动物。然后，通过使用所述gRNA文库以及靶向PAX7启动子的gRNA，我们进行了第二次筛选以调查PAX7的辅助因子。该第二次筛选鉴定到单独的一组转录因子，并且一共鉴定到21种转录因子。个体验证证实了某些命中物诱导PAX7表达和成肌细胞命运的采纳。从本研究产生的数据可以在细胞和基因疗法的背景中用于骨骼肌再生的潜在治疗靶点。

PAX7-2a-GFP细胞系的产生。将人类H9 ESC(从WiCell Stem Cell Bank获得)用于这些研究，将它们维持在mTeSR(Stem Cell Technologies)中，并在包被有ES合格基质胶的组织培养处理板(Corning)上铺板。将H9 ESC用靶向PAX7亚型A终止密码子的Cas9-gRNA质粒和具有与PAX7亚型A的外显子8和3’UTR互补的同源臂的供体质粒共转染。转染使用GenePulser Xcell(Bio-Rad)，在250V、750μF和无限电阻下，在4mm比色皿中进行。所述供体质粒还含有被loxP位点包围的PGK-PuroR表达盒，以允许选择性扩增具有供体质粒整合的细胞。在嘌呤霉素选择(1μg/mL)两周后，挑取克隆并通过PCR筛选供体表达盒在正确基因组位点处的整合。将所选的阳性克隆用Cre重组酶质粒转染，以除去大的PGK-PuroR表达盒。将细胞稀疏铺板，挑取克隆并使用在供体模板之外的引物筛选正确的整合。通过Sanger测序确认得到的PCR条带。

CRISPR激活-转录因子(CRa-TF)gRNA文库的产生。在以前整理的名单的基础上选择假定的人类转录因子。可用于基因列表的相应的gRNA从人类子合并CRISPRa文库提取。也从该文库提取了100种乱序非靶向gRNA。我们的自定义文库由1496个独特基因的靶向每个转录起始位点的5种gRNA和100种乱序非靶向gRNA组成，文库总规模为8,505种gRNA。将寡核苷酸合并物(Custom Array)PCR扩增，并使用Gibson组装法克隆到单个gRNA表达质粒中用于单一CRa-TF筛选，或克隆到双gRNA表达质粒中用于使用靶向PAX7启动子的gRNA的成对CRa-TF筛选。

慢病毒产生。HEK293T细胞从美国组织保藏中心(American Tissue CollectionCenter)(ATCC)获得并通过杜克大学癌症中心部门(Duke University Cancer CenterFacilities)购买，并在增补有10％FBS(Sigma)和1％青霉素/链霉素(Invitrogen)的Dulbecco改良的Eagle’s培养基(Invitrogen)中，在37℃和5％CO₂下培养。将大约3.5百万个细胞铺于每个10cm TCPS培养皿上。24小时后，使用磷酸钙沉淀法将所述细胞用所述表达质粒、pMD2.G包膜质粒(Addgene#12259)和psPAX2第二代包装质粒(Addgene#12260)转染。在转染后12小时更换培养基，并在这次培养基更换后24和48小时收获病毒上清液。将病毒上清液合并并以500g离心5分钟，通过0.45μm滤器，并使用Lenti-X浓缩仪(Clontech)按照制造商的方案浓缩至20x。慢病毒gRNA文库通过流式细胞术来滴定。

用于PAX7的上游调控物的高通量CRa-TF筛选。将稳定表达^VP64dCas9^VP64的未分化的H9 PAX7-2a-GFP细胞解离，并将22.5x10⁶个细胞用CRa-TF慢病毒文库以每个平行样0.2的MOI转导(3.1x10⁴个细胞/cm²)。我们的目标是实现每个平行样500倍的文库覆盖率。将细胞用1μg/mL嘌呤霉素选择6天。对于分化来说，将所述hESC用Accutase(Stem CellTechnologies)解离成单细胞，并在基质胶包被的培养板上在增补有10μM Y27632(StemCell Technologies)的mTeSR培养基中铺板(3.6x10⁴个细胞/cm²)。第二天，将mTeSR培养基更换为增补有10μM CHIR99021(Sigma)的E6培养基，以开始中胚层分化。2天后，除去CHIR99021并将细胞维持在E6培养基中并每天增补10ng/mL FGF2(Sigma)。在分析之前，在第1版筛选中2周和第2版筛选中1周的分化期间细胞未传代。

在诱导分化后1或2周时，将细胞用0.2％胶原酶II(ThermoFisher)解离，并用中和培养基(含有10％FBS的DMEM/F12)清洗。通过离心沉积细胞，并将细胞重悬浮在流动培养基(含有5％FBS的PBS)中。将细胞对阳性mCherry表达进行门选，并在SONY SH800流式细胞仪上将GFP表达排名靠前的10％和靠后的10％的细胞分选到独立的管中。将分选的细胞沉积，并使用Qiagen DNeasy试剂盒提取基因组DNA。也留出未分拣的细胞用于基因组DNA分离，以充当输入对照。

通过PCR从所述基因组DNA回收gRNA序列。测序在Illumina Miseq上，使用21bp配对末端测序法并使用自定义读出和索引引物来进行。

数据处理和富集分析。使用Bowtie并使用选项-p 32--端对端--非常灵敏-3 1 -I0-X 200，将FASTQ文件与自定义索引(从bowtie2-build函数生成)对齐。提取每种gRNA的计数并用于进一步分析。所有富集分析均使用R进行。对于个体gRNA富集分析来说，使用DESeq2软件包在每个筛选的高和低、未分拣的和低或未分拣的和高条件之间进行比较。

个体gRNA验证。来自于在每个筛选中发现的排名靠前的富集gRNA的前间区序列作为寡核苷酸从IDT订购，并如较早时所述将它们克隆到慢病毒gRNA表达载体中。将与在合并CRa-TF筛选中使用的相同的H9 PAX7-2a-GFP细胞系用于个体gRNA验证。细胞用个体gRNA转导，并经历与原始筛选中相同但规模较小的嘌呤霉素选择和分化方案。

使用RNeasy Plus RNA分离试剂盒(Qiagen)分离RNA。使用SuperScript VILOcDNA合成试剂盒(Invitrogen)合成cDNA。使用CFX96实时PCR检测***(Bio-Rad)进行使用PerfeCTa SYBR Green FastMix(Quanta Biosciences)的实时PCR。结果使用ΔΔC_t法表示成归一化到GAPDH表达的感兴趣基因的表达的提高倍数。

培养的细胞的免疫荧光染色。对于分化来说，将细胞生长至合生并在基质胶包被的24孔组织培养板上分化，并在孔中直接进行免疫荧光染色。将细胞用4％PFA固定15min，并在阻断缓冲液(增补有3％BSA和0.2％Triton X-100的PBS)中在室温通透化1hr。将样品与Pax7(1:20，Developmental Studies Hybridoma Bank)和肌球蛋白重链MF20(1:200，DSHB)在4℃温育过夜。将样品用PBS清洗15min，并与1:500稀释的来自于Invitrogen的相容的第二抗体和DAPI在室温温育1hr。将样品用PBS清洗3次，每次15min，并将孔保持在PBS中并使用常规荧光显微镜成像。

结果：人类ESC中PAX7报告细胞系的产生。PAX7对卫星细胞特化、功能和维持来说可能是关键的。由于成体卫星细胞也通过它们独特的PAX7表达来鉴定，因此我们决定使用这个基因来产生卫星细胞报告细胞系。我们在H9 ESC中测试了三种被设计用于在PAX7的终止密码子附近切割的gRNA，并通过SURVEYOR分析发现gRNA 1具有最高的切割活性。我们设计了一种供体模板，其含有同源臂和***到PAX7的最后一个外显子下游的P2A-eGFP序列(图15A)。将H9 ESC用CRISPR/Cas9质粒和供体载体共转染，所述供体载体含有两侧带有loxP的PGK-PuroR表达盒，以允许选择重组事件。抗性克隆经过分子验证，并通过Cre重组切除所述选择盒。使用被设计在同源臂外部的引物，通过PCR进一步验证得到的克隆(图15B)。多个克隆的较大整合条带通过Sanger测序来验证，以确保报告物表达盒的框内定位(图15C)。较小的野生型条带也被测序，以确保在非报告基因等位基因上不产生***缺失。选择一个克隆并用于后续研究。

通过用编码^VP64dCas9^VP64的慢病毒载体和靶向PAX7启动子处的gRNA转导细胞以激活内源基因表达，来验证报告基因的活性。流式细胞术分析显示，与未转导的细胞相比，克隆群体中的GFP表达明显改变(图15D)。分拣排名前15％和后15％的表达GFP的细胞，并提取RNA用于qRT-PCR，其证实了GFP与PAX7表达的正相关性(图15E)。

CRa-TF筛选以鉴定PAX7表达的新的调控物。为了***性地鉴定作用于PAX7上游的TF，我们在以前精选的名单的基础上产生了靶向所有假定TF的启动子的gRNA文库。可用于基因列表的相应的gRNA从以前产生的人类子合并CRISPRa文库提取。为我们的研究产生的自定义CRISPRa-TF(CRa-TF)文库包括1496种独特基因的靶向每个转录起始位点的5种gRNA和100种乱序非靶向gRNA，文库总规模为8,505种gRNA。

由于在胚胎发育期间PAX7在外胚层衍生的神经嵴中表达，因此我们将我们的筛选与中胚层分化方案配对，以促进成肌谱系特化。hPSC向中胚层细胞的分化可以通过添加小分子CHIR99021这种GSK3抑制剂来启动。在分化之前，我们转导我们的细胞系以稳定表达^VP64dCas9^VP64。接下来，我们以0.2的MOI转导了我们的CRa-TF文库，进行选择，并允许细胞在无血清培养基条件下在FGF2存在下分化2周(图16A)。我们以前以确定，单独的2周中胚层分化不足以诱导GFP表达。

使用CRa-TF文库和分化，出现了可鉴别的GFP+细胞群体，并且我们通过FACS分拣了前10％和后10％的表达GFP的细胞(图16B)。我们进行了下一代测序(NGS)以鉴定在任一组中富集的gRNA。当我们将GFP低表达细胞与未分拣的细胞进行比较时，没有出现命中物，表明该细胞群体完全缺乏PAX7表达。当我们将GFP高表达细胞与未分拣的细胞进行比较时，出现了10个独特的基因(不包括PAX7 gRNA)作为显著命中物(图16C)。将这些gRNA单独地克隆到慢病毒载体中，并使用2周分化方案在同一细胞系中进行验证(图16D)。我们还将等效的cDNA克隆到慢病毒构建物中，并确定了蛋白质递送也可以导致PAX7的激活，尽管程度不同(图16E)。

组合CRa-TF筛选以鉴定与PAX7协同的TF。尽管已显示使用小分子进行中胚层分化会产生成肌细胞，但它也导致包括神经元在内的非均一细胞类型的分化。使用CHIR99021进行的中胚层分化也用于将多能细胞分化成心脏和肾脏谱系。以前已证明，在分化时间过程中PAX7 cDNA的表达可以影响细胞采纳成肌细胞命运超过可选谱系。

通过在慢病毒CRa-TF文库中添加靶向mU6-PAX7启动子的gRNA表达盒，我们进行了第二个筛选(图17A)。这个筛选也具有鉴定与PAX7协同工作以增强成肌祖细胞特化的TF的潜力。我们如较早时所述进行了所述筛选，区别在于我们将分化减少到1周而不是2周，因为我们预期PAX7会快速上调。在分化1周后，我们看到GFP群体中发生明显变化，并分拣出前10％和后10％的GFP表达细胞(图17B)。该第二个筛选发现了13种TF，它们在与PAX7共表达时对PAX7表达产生累加效应。总的来说，两个筛选产生了在中胚层分化的背景中上调PAX7的21种TF的名单(图17C)。

促进成肌分化的命中TF的验证。接下来，我们希望确定TF是否不仅可以上调PAX7表达，而且可以产生成肌细胞。我们将21种TF gRNA命中物各自克隆到表达rtTA3的慢病毒载体中，并使用四环素诱导型启动子来驱动^VP64dCas9^VP64的表达。我们将两种构建体转导到H9PAX7-2a-GFP细胞系中，并在强力霉素(dox)存在下将细胞分化28天，并在第14天进行传代步骤。我们在28天后撤除dox以允许下调PAX7，这允许下游成肌基因上调，以诱导成肌祖细胞终末分化成肌细胞(图18A)。qRT-PCR分析显示，与乱序gRNA对照相比，在许多条件下在终末分化2周后PAX7表达略微上调。令人吃惊的是，当与表达PAX7 gRNA的对照相比时，MYOD、DMRT1和PAX3这三种TF表现出更高的PAX7表达(图18B)。我们还检查了下游成肌标志物MYOG的表达，并发现它在21种新的TF gRNA命中物中的8种中高表达(图18C)。最后，我们对固定的分化细胞进行了免疫荧光染色，以检测肌球蛋白重链(MHC)阳性肌纤维的存在(图18D)。我们还对PAX7进行了染色，以确定是否有任何新的命中物可以产生可维持PAX7+卫星细胞表型的细胞类型。许多表达MYOG的假定命中物也表现出MHC+肌纤维的存在。DMRT1显示出最高数量的PAX7+细胞核，并且最稳健地产生肌纤维。

讨论。在本研究中，我们使用无偏倚的***性方法来筛选所有TF，以获得成肌祖细胞命运特化。使用PAX7表达作为卫星细胞特化的替代性指标，我们产生了PAX7-2a-GFP人类胚胎干细胞系，以在成肌分化过程中发现新的PAX7上游调控物。使用个体和组合CRISPRa筛选，我们产生了一个21种表现出PAX7激活的假定TF的名单。这些TF中的一部分也表现出将ESC分化成肌纤维的能力。诸如TWIST1和PAX3的命中物并不令人吃惊，因为以前已表征过它们对近轴中胚层发育是重要的。具体来说，PAX3是PAX7的旁系同源物，它们具有作为肌生成的上游调控物的重叠功能。MYOD和MYOG是有趣的命中物，因为它们被认为在肌生成过程中位于PAX7表达的下游。一个可能的解释是，这些成肌因子的过表达将胚胎干细胞推向成肌程序，以产生肌节的初级肌纤维，这然后可以形成一个正反馈回路，以产生更多PAX7衍生的胚胎成肌细胞。在本研究中进行的两个版本的CRISPRa筛选中，SOX9和SOX10是在两者中都作为命中物出现的仅有的TF。SOX9和SOX10两者都是在发育过程中重要的TF，并且SOX因子总的来说参与细胞命运的决定。SOX9的影响跨越从软骨形成到中枢神经***发育，并且还已显示它增强ESC向所有3个胚层的祖细胞的分化。与SOX9和PAX7一样，SOX10在神经嵴发育中也发挥重要作用。与PAX7不同，SOX10不在中胚层中表达；然而，SOX10缺陷胚胎表现出PAX7+肌肉祖细胞的显著减少和肌节形成的减少。将SOX9和SOX10与分化和正确的肌生成联系起来的以前的研究与这些TF在我们的CRa-TF筛选中的出现的组合，巩固了它们在成肌祖细胞特化中的重要性。

在所有被分析的命中物中，一种TF，具体来说是DMRT1，显示出在体外在丰富的肌纤维中产生大量PAX7+细胞的激动人心的能力。DMRT1是一种特别出人意料的命中物，因为它主要被认为是一个性别决定基因。这个基因主要表达在支持细胞中，是睾丸成熟所必需的。有趣的是，PAX7最近被鉴定为是小鼠中具有干细胞样性质的罕见***亚群的标志物。尽管在***发生或肌发生的背景中DMRT1与PAX7之间没有明确的联系，但我们的结果表明，DMRT1能够在PAX7上游发挥作用并激活它的表达，以赋予细胞以干细胞表型。在我们的筛选中使用的中胚层分化的背景中，这会导致成肌祖细胞和肌纤维生成。尽管这个过程可能不是自然发生的现象，但DMRT1过表达可能被用于产生稳健的用于细胞治疗的成肌祖细胞。

总之，我们对所有人类TF进行了强有力的CRISPRa筛选，发现了作为预期、有趣和令人惊讶的组合的命中物。这些结果阐明了我们对卫星细胞发育和PAX7的上游调控物的理解，并且可用于工程化改造成肌祖细胞。本研究中开发的方法对于发现新的TF以加强其他细胞谱系的工程化改造具有广泛的用途。

实施例10

调控软骨形成的转录因子的鉴定

使用与实施例9中详述的相似的高通量CRISPR激活筛选来鉴定软骨细胞特异性基因表达的新的驱动物。使用在胶原中特异性表达的基因作为软骨细胞特异性标志物。鉴定了软骨细胞特异性转录因子。

TF靶向CRISPR激活文库的产生。如前面的实施例中所述从文库提取靶向被注释的TF的gRNA，产生一个包含8,435种gRNA(每种TF大约5种gRNA)的文库。将所述文库扩增，并使用Gibson组装法克隆到含有mCherry-2A-Puro^R表达盒的改良的lenti-CRISPR构建物中。

慢病毒生产和滴定。gRNA文库和VP64-dCas9-VP64表达载体的慢病毒包装，通过使用磷酸钙沉淀法将合并的gRNA文库质粒或VP64-dCas9-VP64质粒(20μg)、pMD2.G(Addgene,12259，6μg)和psPAX2(Addgene,12260，15μg)转染到3E6 HEK 293T中来进行。16小时后更换培养基。在24和48小时后收集病毒上清液，并使用Lenti-X浓缩***(Clonetech)按照制造商的说明书进行浓缩。

含有gRNA文库的慢病毒的滴定，通过在铺板后8小时转导24孔板中密度为60K细胞/cm²的COL2A1-2A-GFP；VP64-dCas9-VP64 hiPSC来进行。向培养基添加浓缩慢病毒的10倍连续稀释液，范围从5E-5至5μL。在转导后16小时更换培养基，并在D3使用BD Accuri C6细胞仪测量mCherry荧光，以确定转导效率。

CRISPR激活物hiPSC细胞系的产生的验证。如前所述将COL2A1-2A-GFP报告hiPSC用慢病毒转导，所述慢病毒带有在N-和C-端均融合到VP64反式激活结构域的dCas9的表达盒。将细胞用100μg/mL杀稻瘟菌素选择5天。通过靶向NGN2的gRNA的转导验证了得到的多克隆细胞系。3天后，将细胞裂解并通过qRT-PCR评估NGN2表达。

基因表达。将单层和沉积细胞用DPBS冲洗。将单层细胞在350μl缓冲液RL(NorgenBiotek,Thorold Canada)中裂解。使用总RNA纯化试剂盒按照制造商的推荐(NorgenBiotek)分离RNA。使用SuperScript^TMVILO^TM主混合物(Thermo Fisher)按照制造商的说明书进行反转录。定量RT-PCR在QuantStudio 3(Thermo Fisher)和CFX96实时***(Biorad,Hercules CA)上，使用Fast SYBR^TM Green主混合物(Thermo Fisher)按照制造商的方案来进行。使用ΔΔC_T法相对于作为参比时间点的hiPSC和作为参比基因的TATA-box结合蛋白(TBP)计算变化倍数。使用下述引物对评估NGN2的基因表达：

F：5’-CAGGCCAAAGTCACAGCAAC–3’(SEQ ID NO：151)

R：5’–CGATCCGAGCAGCACTAACA–3’(SEQ ID NO：152)

TF靶向文库的慢病毒gRNA筛选。为了维持>500倍的文库覆盖率，将5个各自含有4.5x10⁶百万个细胞的15-cm基质胶包被的培养皿用25mL完全mTeSR中的慢病毒gRNA文库以0.2的MOI转导，以确保大多数细胞含有0或1种gRNA。将转导的细胞用0.5μg/mL嘌呤霉素选择3天，并以10K/cm²的密度在4个15-cm基质胶包被的培养皿中传代。在这个时间点取出5x10⁶个细胞的样品，以充当每个平行实验的输入对照。接种后24小时将细胞用嘌呤霉素继续选择2天，以确保完全选择。将细胞如2.4.3中所述向软骨祖细胞分化21天。在这个时间点，除了未分拣的群体之外还收集前/后5百分位数的细胞。在分拣后，收获输入、未分拣、GFP^高和GFP^低群体，用于基因组DNA纯化(Qiagen)。

gRNA文库测序。通过使用Q5热启动聚合物(NEB,M0493L)从分成12个100μL PCR反应的12μg gDNA进行扩增，从每个群体扩增了gRNA文库。我们使用了下述PCR条件：60度退火温度，20”延伸时间，25个循环。使用了下述引物：

F：5’AATGATACGGCGACCACCGAGATCTACACAATTTCTTGGGTAGTTTGCAGTT-3’(SEQ IDNO：153)

R：5’-CAAGCAGAAGACGGCATACGAGAT(NNNNNN)GACTCGGTGCCACTTTTTCAA–3’(SEQ IDNO：154)

其中NNNNNN表示6-bp条形码序列。

使用Agencourt AMPure XP珠子(Beckman Coulter)，使用双重选择对PCR扩增的文库进行纯化以除去大片段和引物二聚体，其中首先添加0.65x PCR体积、然后是1x原始PCR体积的珠子体积。在重悬浮于水中后，使用Qubit dsDNA高灵敏度试剂盒(ThermoFisher)确定每个样品中的文库浓度。将样品合并，并在Illumina Miseq上进行21-bp配对末端测序，使用了下述读出和索引引物：

读出1：5’-GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG-3’(SEQ ID NO：155)

读出2：5’-GTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC-3’(SEQ IDNO：156)

索引：5’-GCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTC–3’(SEQ ID NO：157)

差异gRNA富集的分析。使用Bowtie并使用选项-p 32--端对端--非常灵敏-3 2 -I0 -X 200，将通过MiSeq测序生成的FASTQ文件与自定义索引对齐。然后我们生成了每个被测序群体中每种gRNA的读出数目的计数表。使用R中的DESeq2软件包评估每种gRNA的显著富集。我们将未分拣与GFP^高、未分拣与GFP^低和GFP^高与GFP^低进行了比较；在这里我们仅示出了GFP^高与GFP^低比较的数据。

候选TF的验证。如4.4.3中所述将报告hiPSC用含有SOX9 cDNA的慢病毒转导，同时制备了未转导的对照。在恢复两天后，将细胞按照2.4.2中描述的成软骨方案进行分化，但在生骨节阶段(D6)收获。在这个时间点，使用Accuri C6细胞仪通过流式细胞术来评估成软骨分化。

hiPSC软骨形成的候选调控物的鉴定。为了评估激活的TF对成软骨分化的影响，我们在COL2A1-2A-GFP背景中产生了稳定表达在N-和C-端两端均融合到VP64反式激活结构域的dCas9(VP64-dCas9-VP64)的细胞系(图19A)。对转导的细胞进行选择，以产生多克隆激活细胞系。该多克隆细胞系在转导靶向NGN2的启动子的gRNA后，稳健地激活内源Neurogenin2(NGN2)(图19B)。

为了产生TF靶向CRISPR激活文库，与实施例9中详述的相似，我们从以前描述的可公开获得的基因组尺度的激活文库提取了靶向TF的gRNA。将所述gRNA文库克隆到带有mCherry-2a-Puro^R表达盒的Lenti-CRISPR构建物中，以允许选择转导的细胞系(图20A)。将Lenti-CRISPR文库以低感染复数(MOI)转染到我们的激活/报告细胞系中，以确保每个细胞一种gRNA，并维持足够的文库覆盖率(>500x)。然后将转导的细胞分化(图20A)。gRNA文库的转导在第21天似乎消除了GFP的双峰分布；然而，分拣到GFP^高/低群体(图20B)。我们观察到36种gRNA的显著的(调整后的p-值<0.05)差异富集(图20C)。

值得注意的是，靶向SOX9的两种gRNA在GFP^高群体中显著富集。我们还观察到靶向已知参与肢芽软骨形成的另一种转录因子SOX10的两种gRNA的强烈富集。SOX15和TBR1的作用仍然有待验证和确定。有趣的是，在GFP^低群体中富集了另外几种gRNA。正如预期，靶向在多能状态下强烈表达的TF例如PRDM14和NR5A2的gRNA在该群体中富集。然而，其他常常引用的多能性TF例如NANOG和OCT4没有在该群体中富集。令人吃惊的是，靶向在软骨形成期间诱导的TF例如PITX1、HES1、ID4、SP9和SIX6的gRNA在GFP^低群体中富集。在任一群体中富集超过3倍但不满足显著性标准的gRNA用蓝色着色(图20C)。

通过SOX9过表达初步验证筛选结果。尽管SOX9是一种直接结合到编码软骨基质蛋白的基因的启动子和增强子元件的已知成软骨转录因子，但尚不清楚在我们的分阶段分化的背景中SOX9激活将具有何种影响。来自于时间过程实验的基因表达数据表明SOX9激活发生在该分化方案的D12。为了确定在我们的分化计划的背景中SOX9过表达对软骨形成的影响，我们将编码SOX9 cDNA的慢病毒转导到报告hiPSC，并在分化6天后评估了报告物荧光(图21A)。在这个阶段，细胞尚未暴露于成软骨生长因子BMP-4，并且建立绕过对单层细胞中漫长(6-15天)的成软骨前分化的需要的方案将是有价值的。事实上，我们在我们的成软骨分化方案中观察到的许多变动发生在这个分化阶段。

在使用SOX9过表达的分化6天后并在任何BMP-4处理之前，我们观察到占总群体的大约2-3％的GFP^高群体(图21B)。SOX9转导似乎也将报告物荧光的分布向左侧拓宽。在分化的第21天，通过SOX9过表达产生的这个群体的荧光强度与报告细胞的荧光强度相当，尽管这些细胞的比例低得多(图21C)。

讨论。在这里，我们显示了对所有TF的调控软骨形成的能力进行的高通量筛选。被我们预计将在GFP^高群体中富集的SOX9充当内部对照。已知参与软骨形成的其他因子例如SOX10也在GFP^高群体中富集。已显示SOX10参与肢芽软骨形成并与SOX9和SOX8一起协调成软骨程序，并且可能参与促进软骨细胞的肥大性分化。TBR1和SOX15对软骨形成的潜在作用可能不太清楚；SOX15可能与肌肉再生有关，并且TBR1已知在谷氨酸能神经元中表达。

我们的筛选产生了在GFP^低群体中富集的远远更多的命中物。大多数TF的强烈激活可能在分化的不同阶段阻碍成软骨特化。在该群体中最显著富集的gRNA靶向PRDM14这种天生多能性的调控物。靶向也在多能性中高表达的NR5A2的gRNA，也在该群体中富集。值得注意的是，靶向参与软骨形成并在软骨形成期间激活的TF例如PITX1的gRNA，也在GFP^低中富集。

在我们的在分化的背景中测试SOX9过表达的验证实验中，我们在分化6天后在添加BMP-4之前观察到GFP^高群体的出现，表明TF的外源递送可以绕过分化的成软骨前阶段。似乎hiPSC衍生的生骨节已被适合地准备，以对SOX9做出响应激活COL2A1。对图21B中示出的柱状图的仔细分析揭示出SOX9的过表达除了产生GFP^高之外，似乎还提高柱状图左侧尾部的高度，这表明SOX9的过表达可能也在一部分细胞中抑制成软骨分化。

总之，通过使用COL2A1敲入报告基因来筛选促软骨形成TF，我们证实了高通量hiPSC软骨形成平台的用途。所述筛选成功地富集了靶向已知成软骨TF SOX9的gRNA，并产生了几个其他的有趣命中物。本文中发现的TF可以改进技术以产生hiPSC衍生的软骨或规定各种不同的软骨细胞亚型(例如关节板相比于生长板)。

上面对特定方面的描述如此充分地揭示出本发明的总体性质，使得其他人通过应用本领域技术内的知识，无需过多实验即可容易地修改和/或改编这些特定方面以适应于各种不同的应用，而不背离本公开的总体概念。因此，基于本文中呈现的教导和指导，此类改编和修改旨在落于所公开的方面的含义和等同性范围之内。应该理解，本文中的短语或术语是出于描述而不是限制的目的，使得本说明书的术语或短语应该由专业技术人员根据所述教导和指导来解释。

本公开的广度和范围不应受任何上述示例性方面的限制，而是应该仅根据下面的权利要求书及其等同物来定义。

本申请中引用的所有出版物、专利、专利申请和/或其他文献为所有目的整体通过参考并入本文，其程度如同每个单独的出版物、专利、专利申请和/或其他文献被单独地指明为所有目的通过参考并入本文。

为完整起见，本发明的各个不同方面被阐述在下述编号的条款中：

条款1.一种多核苷酸，其编码(1)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或(2)选自NGN3和ASCL1或其组合的第一神经元特异性转录因子；和选自下述的第二神经元特异性转录因子：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7；(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

条款2.一种用于提高神经元特异性基因的表达的***，所述***包含：(a)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或(b)靶向选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的第一gRNA；和靶向选自下述的第二神经元特异性转录因子的第二gRNA：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7；(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX；和Cas蛋白或融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有选自转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性。

条款3.条款1所述的多核苷酸或条款2所述的***，其中所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2、NKX2-2、HES3和ZFP36L1。

条款4.条款3所述的多核苷酸或***，其中所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2和NKX2-2。

条款5.条款3所述的多核苷酸或***，其中所述第二神经元特异性转录因子选自HES3和ZFP36L1。

条款6.条款2所述的***，其中所述第二神经元特异性转录因子选自：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7，并且其中所述第二多肽结构域具有转录激活活性。

条款7.条款6所述的***，其中所述融合蛋白包含^VP64dCas9^VP64或dCas9-p300。

条款8.条款2所述的***，其中所述第二神经元特异性转录因子选自：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX，并且其中所述第二多肽结构域具有转录阻遏活性。

条款9.条款8所述的***，其中所述融合蛋白包含dCas9-KRAB。

条款10.条款2-9中的任一项所述的***，其中所述第一gRNA和所述第二gRNA各自单独地包含12-22个碱基对的靶DNA序列的互补多核苷酸序列，随后是前间区序列邻近基序，并且任选地其中所述gRNA结合并靶向和/或包含含有选自SEQ ID NO：38-87的序列的多核苷酸，并且任选地其中所述第一gRNA和/或第二gRNA包含crRNA、tracrRNA或其组合。

条款11.一种分离的多核苷酸，其编码条款2-10中的任一项所述的***。

条款12.一种载体，其包含条款11所述的分离的多核苷酸。

条款13.一种细胞，其包含条款11所述的分离的多核苷酸或条款12所述的载体。

条款14.一种提高干细胞衍生的神经元的成熟的方法，所述方法包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

条款15.一种提高干细胞衍生的神经元的成熟的方法，所述方法包括：提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

条款16.一种提高干细胞向神经元的转化的方法，所述方法包括：(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

条款17.一种提高干细胞向神经元的转化的方法，所述方法包括：提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

条款18.一种治疗有需要的对象的方法，所述方法包括：(a)提高所述对象中的干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或(b)提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并提高所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

条款19.一种治疗有需要的对象的方法，所述方法包括：提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并降低所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

条款20.条款14-19中的任一项所述的方法，其中提高所述第一神经元特异性转录因子的水平包括下述至少一者：(a)向所述干细胞给药编码所述第一神经元特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述第一神经元特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第一神经元特异性转录因子的锌指蛋白或靶向所述第一神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第一神经元特异性转录因子的gRNA。

条款21.条款14、16和18中的任一项所述的方法，其中提高所述第二神经元特异性转录因子的水平包括下述至少一者：(a)向所述干细胞给药编码所述第二神经元特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述第二神经元特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。

条款22.条款15、17和19中的任一项所述的方法，其中降低所述第二神经元特异性转录因子的水平包括向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录阻遏活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。

条款23.条款14-22中的任一项所述的方法，其中所述干细胞不经历多能阶段直接转化成神经元。

条款24.条款13所述的细胞或条款14-23中的任一项所述的方法，其中所述干细胞是多能干细胞、诱导多能干细胞或胚胎干细胞。

条款25.一种用于选择具有作为细胞类型特异性转录因子的活性的多核苷酸的***，所述***包含：编码报告蛋白和细胞类型标志物的多核苷酸；融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白，并且第二多肽结构域具有转录激活活性；和指导RNA(gRNA)的文库，每种gRNA靶向不同的假定细胞类型特异性转录因子。

条款26.条款25所述的***，其中所述细胞类型特异性转录因子是神经元特异性转录因子，其中所述细胞类型标志物是神经元标志物，并且其中所述神经元标志物包括TUBB3。

条款27.条款25所述的***，其中所述细胞类型特异性转录因子是肌肉特异性转录因子，其中所述细胞类型标志物是成肌标志物，并且其中所述成肌标志物包括PAX7。

条款28.条款25所述的***，其中所述细胞类型特异性转录因子是软骨细胞特异性转录因子，其中所述细胞类型标志物是胶原标志物，并且其中所述胶原标志物包括COL2A1。

条款29.条款25-28中的任一项所述的***，其中所述报告蛋白包括mCherry。

条款30.一种分离的多核苷酸序列，其编码条款25-29中的任一项所述的***。

条款31.一种载体，其包含条款30所述的分离的多核苷酸序列。

条款32.一种细胞，其包含条款25-29中的任一项所述的***、条款30所述的分离的多核苷酸序列或条款31所述的载体或其组合。

条款33.一种筛选细胞类型特异性转录因子的方法，所述方法包括：用条款25-29中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数细胞各自独立地包括一种gRNA并靶向一种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；并且当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述假定转录因子作为细胞类型特异性转录因子。

条款34.一种筛选一对细胞类型特异性转录因子的方法，所述方法包括：用条款25-29中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数细胞各自独立地包括两种gRNA并靶向两种假定转录因子；确定每个细胞中所述报告蛋白的表达水平；确定每个具有所述报告蛋白的高表达的细胞中所述两种gRNA的水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；并且当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述两种假定转录因子作为一对细胞类型特异性转录因子。

条款35.条款33或34所述的方法，其中每个细胞中所述报告蛋白的表达水平在从转导起约4天后确定。

条款36.条款33-35中的任一项所述的方法，其中每个细胞中所述报告蛋白的表达水平通过流式细胞术来确定。

条款37.条款33-36中的任一项所述的方法，其中每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平通过深度测序来确定。

条款38.条款33-37中的任一项所述的方法，其中相对于非靶向gRNA，所述gRNA将所述细胞中所述报告蛋白的表达提高约2-50％。

条款39.一种多核苷酸，其编码选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子。

条款40.一种用于提高肌肉特异性基因的表达的***，所述***包含：(a)选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子；或(b)融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的锌指蛋白或靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有选自转录激活活性、转录释放因子活性、组蛋白修饰活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性，并且其中当所述第一多肽结构域包含Cas蛋白时，所述***还包括靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的gRNA。

条款41.条款40所述的***，其中所述融合蛋白包含^VP64dCas9^VP64或dCas9-p300。

条款42.一种分离的多核苷酸，其编码条款40-41中的任一项所述的***。

条款43.一种载体，其包含条款42所述的分离的多核苷酸。

条款44.一种细胞，其包含条款42所述的分离的多核苷酸或条款43所述的载体。

条款45.一种提高干细胞向成肌细胞的分化的方法，所述方法包括：提高所述干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。

条款46.一种治疗有需要的对象的方法，所述方法包括：提高来自于所述对象的干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。

条款47.条款45或46所述的方法，其中提高所述肌肉特异性转录因子的水平包括下述至少一者：(a)向所述干细胞给药编码所述肌肉特异性转录因子的多核苷酸；(b)向所述干细胞给药包含所述肌肉特异性转录因子的多肽；和(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述肌肉特异性转录因子的锌指蛋白或靶向所述肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外给药靶向所述肌肉特异性转录因子的gRNA。

序列

SEQ ID NO：1

NGG(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：2

NGA(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：3

NGAN(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：4

NGNG(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：5

NGGNG(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：6

NNAGAAW(W＝A或T；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：7

NAAR(R＝A或G；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：8

NNGRR(R＝A或G；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：9

NNGRRN(R＝A或G；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：10

NNGRRT(R＝A或G；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：11

NNGRRV(R＝A或G；N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：12

NNNNGATT(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：13

NNNNGNNN(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：14

编码酿脓链球菌Cas9的密码子优化的多核苷酸

SEQ ID NO：15

编码酿脓链球菌Cas9的密码子优化的多核苷酸的氨基酸序列

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO：16

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

SEQ ID NO：17

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

SEQ ID NO：18

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

SEQ ID NO：19

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccagagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaggcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggcaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag

SEQ ID NO：20

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

SEQ ID NO：21

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列的氨基酸序列

MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

SEQ ID NO：22

金黄色葡萄球菌Cas9的D10A突变体的多核苷酸序列

SEQ ID NO：23

金黄色葡萄球菌Cas9的N580A突变体的多核苷酸序列

SEQ ID NO：24

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccaaagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaagcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggcaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag

SEQ ID NO：25

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

aagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccaaagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaagcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggc

SEQ ID NO：26

KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

SEQ ID NO：27

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列的编码载体(pDO242)

ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcactatagggcgaattgggtacCtttaattctagtactatgcaTgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGTATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGCCAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGAAGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTGAGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGAAGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTGGAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGGAAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTCAATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAGGCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAACCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGAGATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAACGCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGAAACTGGAATACTATGAGAAGTTCCAGATCATCGAAAACGTGTTTAAGCAGAAGAAAAAGCCTACACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACAAGCACTGGAAAACCAGAGTTCACCAATCTGAAAGTGTATCACGATATTAAGGACATCACAGCACGGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCAGAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATCGAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATCTGATTCTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATCTTTAACCGGCTGAAGCTGGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTCATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGCACAGAAGATGATCAATGAGATGCAGAAACGAAACCGGCAGACCAATGAACGCATTGAAGAGATTATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGCAGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATTCAACTACGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGACAATTCCTTTAACAACAAGGTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTAGTTCAGATTCCAAGATCTCTTACGAAACCTTTAAAAAGCACATTCTGAATCTGGCCAAAGGAAAGGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCCGTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGAATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGGGTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCACCATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGGACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGAAATCGAGACAGAACAGGAGTACAAGGAGATTTTCATCACTCCTCACCAGATCAAGCATATCAAGGATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATGACACCCTGTATAGTACAAGAAAAGACGATAAGGGGAATACCCTGATTGTGAACAATCTGAACGGACTGTACGACAAAGATAATGACAAGCTGAAAAAGCTGATCAACAAAAGTCCCGAGAAGCTGCTGATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACGAGAAGAACCCACTGTATAAGTACTATGAAGAGACTGGGAACTACCTGACCAAGTATAGCAAAAAGGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGACATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGATTCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAAAAAGGAGAACTACTATGAAGTGAATAGCAAGTGCTACGAAGAGGCTAAAAAGCTGAAAAAGATTAGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAACTGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACATCACTTACCGAGAGTATCTGGAAAACATGAATGATAAGCGCCCCCCTCGAATTATCAAAACAATTGCCTCTAAGACTCAGAGTATCAAAAAGTACTCAACCGACATTCTGGGAAACCTGTATGAGGTGAAGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCagcggaggcaagcgtcctgctgctactaagaaagctggtcaagctaagaaaaagaaaggatcctacccatacgatgttccagattacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtagcggccgcCCgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccac

SEQ ID NO：28

mCherry多肽

MVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKPKKKRKVGGPKKKRKV

SEQ ID NO：29

mCherry多核苷酸

atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaagcccaagaagaagaggaaggtgggtggccctaagaaaaagagaaaggtgtga

SEQ ID NO：30

Fwd：5′-AATGATACGGCGACCACCGAGATCTACACAATTTCTTGGGTAGTTTGCAGTT

SEQ ID NO：31

Rev:5′-CAAGCAGAAGACGGCATACGAGAT-(6-bp索引序列)-GACTCGGTGCCACTTTTTCAA

SEQ ID NO：32

读出1：5′-GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG

SEQ ID NO：33

索引：5′-GCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTC

SEQ ID NO：34

读出2：5′-GTTGATAACGGACTAGCCTTATTTAAACTTGCTATGCTGTTTCCAGCATAGCTCTTAAAC

SEQ ID NO：35

tttn(N可以是任何核苷酸残基，例如A、G、C或T中的任一者)

SEQ ID NO：36

VP64-dCas9-VP64蛋白

RADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMVNPKKKRKVGRGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVASRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLI

SEQ ID NO：37

VP64-dCas9-VP64 DNA

cgggctgacgcattggacgattttgatctggatatgctgggaagtgacgccctcgatgattttgaccttgacatgcttggttcggatgcccttgatgactttgacctcgacatgctcggcagtgacgcccttgatgatttcgacctggacatggttaaccccaagaagaagaggaaggtgggccgcggaatggacaagaagtactccattgggctcgccatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggaaaccgccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatgccatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagacagcagggctgaccccaagaagaagaggaaggtggctagccgcgccgacgcgctggacgatttcgatctcgacatgctgggttctgatgccctcgatgactttgacctggatatgttgggaagcgacgcattggatgactttgatctggacatgctcggctccgatgctctggacgatttcgatctcgatatgttaatc

SEQ ID NO：159

人类p300(带有L553M突变)蛋白

MAENVVEPGPPSAKRPKLSSPALSASASDGTDFGSLFDLEHDLPDELINSTELGLTNGGDINQLQTSLGMVQDAASKHKQLSELLRSGSSPNLNMGVGGPGQVMASQAQQSSPGLGLINSMVKSPMTQAGLTSPNMGMGTSGPNQGPTQSTGMMNSPVNQPAMGMNTGMNAGMNPGMLAAGNGQGIMPNQVMNGSIGAGRGRQNMQYPNPGMGSAGNLLTEPLQQGSPQMGGQTGLRGPQPLKMGMMNNPNPYGSPYTQNPGQQIGASGLGLQIQTKTVLSNNLSPFAMDKKAVPGGGMPNMGQQPAPQVQQPGLVTPVAQGMGSGAHTADPEKRKLIQQQLVLLLHAHKCQRREQANGEVRQCNLPHCRTMKNVLNHMTHCQSGKSCQVAHCASSRQIISHWKNCTRHDCPVCLPLKNAGDKRNQQPILTGAPVGLGNPSSLGVGQQSAPNLSTVSQIDPSSIERAYAALGLPYQVNQMPTQPQVQAKNQQNQQPGQSPQGMRPMSNMSASPMGVNGGVGVQTPSLLSDSMLHSAINSQNPMMSENASVPSMGPMPTAAQPSTTGIRKQWHEDITQDLRNHLVHKLVQAIFPTPDPAALKDRRMENLVAYARKVEGDMYESANNRAEYYHLLAEKIYKIQKELEEKRRTRLQKQNMLPNAAGMVPVSMNPGPNMGQPQPGMTSNGPLPDPSMIRGSVPNQMMPRITPQSGLNQFGQMSMAQPPIVPRQTPPLQHHGQLAQPGALNPPMGYGPRMQQPSNQGQFLPQTQFPSQGMNVTNIPLAPSSGQAPVSQAQMSSSSCPVNSPIMPPGSQGSHIHCPQLPQPALHQNSPSPVPSRTPTPHHTPPSIGAQQPPATTIPAPVPTPPAMPPGPQSQALHPPPRQTPTPPTTQLPQQVQPSLPAAPSADQPQQQPRSQQSTAASVPTPTAPLLPPQPATPLSQPAVSIEGQVSNPPSTSSTEVNSQAIAEKQPSQEVKMEAKMEVDQPEPADTQPEDISESKVEDCKMESTETEERSTELKTEIKEEEDQPSTSATQSSPAPGQSKKKIFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDRFVYTCNECKHHVETRWHCTVCEDYDLCITCYNTKNHDHKMEKLGLGLDDESNNQQAAATQSPGDSRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPICKQLIALCCYHAKHCQENKCPVPFCLNIKQKLRQQQLQHRLQQAQMLRRRMASMQRTGVVGQQQGLPSPTPATPTTPTGQQPTTPQTPQPTSQPQPTPPNSMPPYLPRTQAAGPVSQGKAAGQVTPPTPPQTAQPPLPGPPPAAVEMAMQIQRAAETQRQMAHVQIFQRPIQHQMPPMTPMAPMGMNPPPMTRGPSGHLEPGMGPTGMQQQPPWSQGGLPQPQQLQSGMPRPAMMSVAQHGQPLNMAPQPGLGQVGISPLKPGTVSQQALQNLLRTLRSPSSPLQQQQVLSILHANPQLLAAFIKQRAAKYANSNPQPIPGQPGMPQGQPGLQPPTMPGQQGVHSNPAMQNMNPMQAGVQRAGLPQQQPQQQLQPPMGGMSPQAQQMNMNHNTMPSQFRDILRRQQMMQQQQQQGAGPGIGPGMANHNQFQQPQGVGYPPQQQQRMQHHMQQMQQGNMGQIGQLPQALGAEAGASLQAYQQRLLQQQMGSPVQPNPMSPQQHMLPNQAQSPHLQGQQIPNSLSNQVRSPQPVPSPRPQSQPPHSSPSPRMQPQPSPHHVSPQTSSPHPGLVAAQANPMEQGHFASPDQNSMLSQLASNPGMANLHGASATDLGLSTDNSDLNSNLSQSTLDIH

SEQ ID NO：160

人类p300核心效应物蛋白(SEQ ID NO：134的aa 1048-1664)

IFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQD

SEQ ID NO：158

gRNA支架的多核苷酸序列

gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt

Claims

1.一种多核苷酸，其编码：

(1)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或

(2)选自NGN3和ASCL1或其组合的第一神经元特异性转录因子；和选自下述的第二神经元特异性转录因子：

(i)NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2；

(ii)PRDM1、LHX6、NEUROG3、PAX8、SOX3、KLF4、FLI1、FOXH1、FEV、SOX17、FOS、INSM1、SOX2、WT1、SOX18、ZNF670、LHX8、OVOL1、E2F7、AFF1、HMX2、MAZ、RARA、PROP1、FOSL1、PAX5、KLF3；

(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L、E2F7；

(iv)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；

(v)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；

(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

2.一种用于提高神经元特异性基因的表达的***，所述***包含：

(a)选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子；或

(b)第一gRNA，其靶向选自NGN3和ASCL1或其组合的第一神经元特异性转录因子；和第二gRNA，其靶向选自下述的第二神经元特异性转录因子：

(vi)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX；和

Cas蛋白或融合蛋白，

其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、锌指蛋白或TALE蛋白，并且第二多肽结构域具有选自转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性。

3.根据权利要求1所述的多核苷酸或根据权利要求2所述的***，其中所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2、NKX2-2、HES3和ZFP36L1。

4.根据权利要求3所述的多核苷酸或***，其中所述第二神经元特异性转录因子选自LHX8、LHX6、E2F7、RUNX3、FOXH1、SOX2、HMX2和NKX2-2。

5.根据权利要求3所述的多核苷酸或***，其中所述第二神经元特异性转录因子选自HES3和ZFP36L1。

6.根据权利要求2所述的***，其中所述第二神经元特异性转录因子选自：

(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7，并且

其中所述第二多肽结构域具有转录激活活性。

7.根据权利要求6所述的***，其中所述融合蛋白包含^VP64dCas9^VP64或dCas9-p300。

8.根据权利要求2所述的***，其中所述第二神经元特异性转录因子选自：

(i)ZIC2、SPI1、GRHL2、TFAP2C、KLF8、MYB、TCF21、KLF12、TWIST1、SNAI1、RREB1、GCM2、GRHL1、ETS1、BARHL2、GRHL3、ELF3、PTF1A、GSX1、PBX2、NOTO、KLF3、ZNF311、ELMSAN1、ZNF296、PLEK、KMT2A、HES3；

(ii)HES2、SREBF1、CIC、WHSC1、VDR、HES1、ID2、TCF21、SNAI1、RREB1、GCM2、IRF3、FOXA1、GATA5、GRHL1、SOX5、DMRT1、GCM1、BARHL2、SOX13、ZEB1、PITX2、PTF1A、ZNF282、NPAS2、ZNF160、HES7、ZBED4、SALL4、GLIS3、TBX22、ZNF331、EGR4、ZIC5、ZNF710、ZNF697、ZFP36L2、ELMSAN1、ZNF296、ZNF318、ZNF570、ZNF683、ZFP36L1、HES4、ZNF777、HES5、ZIM2、ZNF579、BMP2、CRAMP1L、TOX3、FEZF2、HES3、ZNF791；

(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX，并且

其中所述第二多肽结构域具有转录阻遏活性。

9.根据权利要求8所述的***，其中所述融合蛋白包含dCas9-KRAB。

10.根据权利要求2-9中的任一项所述的***，其中所述第一gRNA和所述第二gRNA各自单独地包含12-22个碱基对的靶DNA序列的互补多核苷酸序列，随后是前间区序列邻近基序，并且任选地其中所述gRNA结合并靶向和/或包含含有选自SEQ ID NO：38-97的序列的多核苷酸，并且任选地其中所述第一gRNA和/或第二gRNA包含crRNA、tracrRNA或其组合。

11.一种分离的多核苷酸，其编码根据权利要求2-10中的任一项所述的***。

12.一种载体，其包含根据权利要求11所述的分离的多核苷酸。

13.一种细胞，其包含根据权利要求11所述的分离的多核苷酸或根据权利要求12所述的载体。

14.一种提高干细胞衍生的神经元的成熟的方法，所述方法包括：

(a)提高所述干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或

(b)提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并且

提高所述干细胞中选自下述的第二神经元特异性转录因子的水平：

(iii)RUNX3、PRDM1、KLF6、PAX2、RFX3、SOX10、GATA1、KLF5、KLF1、ERF、LHX6、PHOX2B、NANOG、NR5A2、ETV3、NEUROG3、SOX4、SOX9、PAX8、IRF5、CDX4、RARA、BHLHE40、SOX3、KLF4、NR5A1、IRF4、ASCL1、GATA6、SPIB、THRB、FOXH1、NEUROD1、SOX17、CDX2、ZEB2、RARG、INSM1、FOSL1、NEUROG1、SOX1、WT1、PAX5、SOX18、POU5F1、RFX4、KLF7、NKX2-2、OVOL2、FOXJ1、PRDM14、VENTX、LHX8、GFI1、KLF17、OVOL1、OLIG3、HMX3、ZNF521、ONECUT3、OVOL3、ZNF362、AFF1、HMX2、ZNF786、GATA5、TBX3、ZNF385A、ATOH1、PROP1、SOX11、JUN、FOXE3、FERD3L和E2F7。

15.一种提高干细胞衍生的神经元的成熟的方法，所述方法包括：

提高所述干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并且

降低所述干细胞中选自下述的第二神经元特异性转录因子的水平：

(iii)ETV1、ZIC2、GSC2、CIC、GRHL2、REST、TFAP2C、SALL1、NFKB1、ELF2、HES1、MYB、KLF12、VSX2、NFE2、SNAI1、TRERF1、RREB1、IRF1、IRF3、KLF2、MYOD1、SOX15、BARX1、GRHL1、SOX5、ETS1、SKIL、BARHL2、SOX13、ERG、GRHL3、ZNF281、ELF3、HESX1、KLF15、PITX2、PTF1A、GSX1、ZNF160、ETV5、MYBL1、NOTO、DPF1、MECOM、GLIS3、KLF3、TBX22、ESX1、ZNF337、ZFP36L2、ELMSAN1、ZNF618、ZNF296、ZNF318、ZNF570、ZNF497、ZFP36L1、HES5、BMP2、CRAMP1L、ZNF821、KMT2A、HES3和BSX。

16.一种提高干细胞向神经元的转化的方法，所述方法包括：

17.一种提高干细胞向神经元的转化的方法，所述方法包括：

18.一种治疗有需要的对象的方法，所述方法包括：

(a)提高所述对象中的干细胞中选自NEUROG3、SOX4、SOX9、KLF4、NR5A1、NEUROD1、SOX17、SMAD1、ATOH1、INSM1、NEUROG1、SOX18、RFX4、KLF7、SP8、OVOL1、NEUROG2、ERF、PRDM1、OLIG3、HIC1、SOX3、FOXJ1、SOX10、KLF6、ASCL1和PLAGL2的第一神经元特异性转录因子的水平，或

(b)提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并且

提高所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：

19.一种治疗有需要的对象的方法，所述方法包括：

提高所述对象中的干细胞中选自NGN3和ASCL1或其组合的第一神经元特异性转录因子的水平；并且

降低所述对象中的干细胞中选自下述的第二神经元特异性转录因子的水平：

20.根据权利要求14-19中的任一项所述的方法，其中提高所述第一神经元特异性转录因子的水平包括下述至少一者：

(a)向所述干细胞给药编码所述第一神经元特异性转录因子的多核苷酸；

(b)向所述干细胞给药包含所述第一神经元特异性转录因子的多肽；和

(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第一神经元特异性转录因子的锌指蛋白或靶向所述第一神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第一神经元特异性转录因子的gRNA。

21.根据权利要求14、16和18中的任一项所述的方法，其中提高所述第二神经元特异性转录因子的水平包括下述至少一者：

(a)向所述干细胞给药编码所述第二神经元特异性转录因子的多核苷酸；

(b)向所述干细胞给药包含所述第二神经元特异性转录因子的多肽；和

(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。

22.根据权利要求15、17和19中的任一项所述的方法，其中降低所述第二神经元特异性转录因子的水平包括向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述第二神经元特异性转录因子的锌指蛋白或靶向所述第二神经元特异性转录因子的TALE蛋白，并且第二多肽结构域具有转录阻遏活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外向所述干细胞给药靶向所述第二神经元特异性转录因子的gRNA。

23.根据权利要求14-22中的任一项所述的方法，其中所述干细胞不经历多能阶段直接转化成神经元。

24.根据权利要求13所述的细胞或根据权利要求14-23中的任一项所述的方法，其中所述干细胞是多能干细胞、诱导多能干细胞或胚胎干细胞。

25.一种用于选择具有作为细胞类型特异性转录因子的活性的多核苷酸的***，所述***包含：

编码报告蛋白和细胞类型标志物的多核苷酸；

融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白，并且第二多肽结构域具有转录激活活性；和

指导RNA(gRNA)的文库，每种gRNA靶向不同的假定细胞类型特异性转录因子。

26.根据权利要求25所述的***，其中所述细胞类型特异性转录因子是神经元特异性转录因子，其中所述细胞类型标志物是神经元标志物，并且其中所述神经元标志物包括TUBB3。

27.根据权利要求25所述的***，其中所述细胞类型特异性转录因子是肌肉特异性转录因子，其中所述细胞类型标志物是成肌标志物，并且其中所述成肌标志物包括PAX7。

28.根据权利要求25所述的***，其中所述细胞类型特异性转录因子是软骨细胞特异性转录因子，其中所述细胞类型标志物是胶原标志物，并且其中所述胶原标志物包括COL2A1。

29.根据权利要求25-28中的任一项所述的***，其中所述报告蛋白包括mCherry。

30.一种分离的多核苷酸序列，其编码根据权利要求25-29中的任一项所述的***。

31.一种载体，其包含根据权利要求30所述的分离的多核苷酸序列。

32.一种细胞，其包含根据权利要求25-29中的任一项所述的***、根据权利要求30所述的分离的多核苷酸序列或根据权利要求31所述的载体或其组合。

33.一种筛选细胞类型特异性转录因子的方法，所述方法包括：

用根据权利要求25-29中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数细胞各自独立地包括一种gRNA并靶向一种假定转录因子；

确定每个细胞中所述报告蛋白的表达水平；

确定每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；并且

当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述假定转录因子作为细胞类型特异性转录因子。

34.一种筛选一对细胞类型特异性转录因子的方法，所述方法包括：

用根据权利要求25-29中的任一项所述的***以约0.2的感染复数(MOI)转导细胞群体，使得大多数细胞各自独立地包括两种gRNA并靶向两种假定转录因子；

确定每个细胞中所述报告蛋白的表达水平；

确定每个具有所述报告蛋白的高表达的细胞中所述两种gRNA的水平，其中所述报告蛋白的高表达被定义为在所述细胞群体内的前5％中；并且

当所述假定转录因子对应于在具有所述报告蛋白的高表达的细胞中富集的至少两种gRNA时，选择所述两种假定转录因子作为一对细胞类型特异性转录因子。

35.根据权利要求33或34所述的方法，其中每个细胞中所述报告蛋白的表达水平在从转导起约4天后确定。

36.根据权利要求33-35中的任一项所述的方法，其中每个细胞中所述报告蛋白的表达水平通过流式细胞术来确定。

37.根据权利要求33-36中的任一项所述的方法，其中每个具有所述报告蛋白的高表达的细胞中所述gRNA的水平通过深度测序来确定。

38.根据权利要求33-37中的任一项所述的方法，其中相对于非靶向gRNA，所述gRNA将所述细胞中所述报告蛋白的表达提高约2-50％。

39.一种多核苷酸，其编码选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子。

40.一种用于提高肌肉特异性基因的表达的***，所述***包含：

(a)选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子；或

(b)融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的锌指蛋白或靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有选自转录激活活性、转录释放因子活性、组蛋白修饰活性、核酸结合活性、甲基化酶活性和脱甲基化酶活性的活性，并且其中当所述第一多肽结构域包含Cas蛋白时，所述***还包括靶向选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的gRNA。

41.根据权利要求40所述的***，其中所述融合蛋白包含^VP64dCas9^VP64或dCas9-p300。

42.一种分离的多核苷酸，其编码根据权利要求40-41中的任一项所述的***。

43.一种载体，其包含根据权利要求42所述的分离的多核苷酸。

44.一种细胞，其包含根据权利要求42所述的分离的多核苷酸或根据权利要求43所述的载体。

45.一种提高干细胞向成肌细胞的分化的方法，所述方法包括：

提高所述干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。

46.一种治疗有需要的对象的方法，所述方法包括：

提高来自于所述对象的干细胞中选自TWIST1、PAX3、MYOD、MYOG、SOX9、SOX10和DMRT1的肌肉特异性转录因子的水平。

47.根据权利要求45或46所述的方法，其中提高所述肌肉特异性转录因子的水平包括下述至少一者：

(a)向所述干细胞给药编码所述肌肉特异性转录因子的多核苷酸；

(b)向所述干细胞给药包含所述肌肉特异性转录因子的多肽；和

(c)向所述干细胞给药融合蛋白，其中所述融合蛋白包含两个异源多肽结构域，其中第一多肽结构域包含Cas蛋白、靶向所述肌肉特异性转录因子的锌指蛋白或靶向所述肌肉特异性转录因子的TALE蛋白，其中第二多肽结构域具有转录激活活性，并且其中当所述第一多肽结构域包含Cas蛋白时，另外给药靶向所述肌肉特异性转录因子的gRNA。