CN118176330A - 用于大规模亚细胞结构剖析的原位的基于总rna的转录物组剖析的方法 - Google Patents

用于大规模亚细胞结构剖析的原位的基于总rna的转录物组剖析的方法 Download PDF

Info

Publication number
CN118176330A
CN118176330A CN202280071172.0A CN202280071172A CN118176330A CN 118176330 A CN118176330 A CN 118176330A CN 202280071172 A CN202280071172 A CN 202280071172A CN 118176330 A CN118176330 A CN 118176330A
Authority
CN
China
Prior art keywords
rna
primer
subcellular
synaptic
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280071172.0A
Other languages
English (en)
Inventor
宗诚航
牛牧淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baylor College of Medicine
Original Assignee
Baylor College of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baylor College of Medicine filed Critical Baylor College of Medicine
Publication of CN118176330A publication Critical patent/CN118176330A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开内容的实施方案包括亚细胞区室或结构的高通量剖析,包括基于小滴的单细胞总RNA‑seq方法,其使得能够剖析定位在特定亚细胞区室或结构中的转录物。在特别的实施方案中,本公开内容提供了单个核的转录物组剖析,其允许仅使用可以应用于细胞类型特异性lncRNA种类的全组织鉴定的长链非编码RNA种类来构建细胞图册。

Description

用于大规模亚细胞结构剖析的原位的基于总RNA的转录物组 剖析的方法
本申请要求2021年9月2日提交的美国临时专利申请系列号63/240339(其通过提及而以其整体合并入本文)的优先权。
技术领域
本公开内容的实施方案至少包括核酸扩增、核酸操纵、遗传学、医学等的领域。
发明背景
突触是在复杂的神经回路中介导神经元之间的信号传输的关键性结构。显微术和电生理学技术的进展已揭示了在独个突触之中存在的形态学和电生理学异质性1-5。为了推动突触异质性的表征和突触转录物组图册的构建,非常希望独个突触小体的高通量转录物组剖析(profiling)方法。然而,为了取得独个突触小体中的基因表达的成功剖析,需要超越现有技术的单细胞RNA(scRNA)-seq平台的转录物组剖析的新技术特征。首先,独个突触小体包含比单个细胞或单个核更小量的RNA分子。因此,想要高灵敏度单亚细胞结构RNA-seq(sssRNA-seq)测定法。第二,在制备了突触小体后,所述材料需要立即固定以防止在下游步骤中RNA分子的重大泄漏。因此,需要与经固定的样品相容的RNA-seq化学。第三,为了表征在突触中局部地经剪接的基因,想要允许同时检测成熟和新生RNA两者的基于总RNA的测定法。
本公开内容满足了本领域中长久以来的对于用于大规模亚细胞结构剖析的转录物组剖析的需求。
发明概述
本公开内容的实施方案总体涉及用于产生代表任何类型的RNA序列(至少包括mRNA、新生RNA和长链非编码RNA)的DNA文库的方法和组合物。在特别的实施方案中,本公开内容涉及原位扩增转录物组序列,例如在经固定的亚细胞结构或颗粒中的转录物组。
在特别的实施方案中,在本文中提供了用于从在生物学和临床样品中的总RNA模板(包括rRNA、mRNA、新生RNA、微小RNA、长链非编码RNA等)(例如转录物模板)原位产生可扩增的cDNA的方法。可以在进一步扩增期间给原位生成的cDNA加上条形码以取得单亚细胞区室转录物组剖析或空间转录物组剖析。本公开内容的方法可适应于任何小的反应体积例如纳升小滴平台或微孔或者其他体积尺度,以生成直至数百万个单亚细胞结构、凝聚物或颗粒的基于总RNA的转录物组。本公开内容的方法可适应于携带具有区域性的特异性条形码的引物的平台,以生成具有空间分辨率的基于总RNA的转录物组。
本公开内容的实施方案包括产生代表与亚细胞结构相关的RNA的文库的方法,其包括下列步骤:(a)固定细胞材料(新鲜的、冷冻的或事先冷冻的),所述细胞材料是或者包含一个或多个亚细胞结构,从而将与所述结构相连结的RNA(包括新生RNA、微小RNA、长链非编码RNA和/或mRNA)系固至所述结构;(b)使所述亚细胞结构和所述RNA经历第一引物以生成与在所述RNA中的一个或多个不同区域互补的第一互补多核苷酸的集合,由此产生在所述RNA和第一互补多核苷酸之间的杂合分子,所述杂合分子与所述亚细胞结构相连结,其中所述第一引物中的至少一个包含随机序列,或仅三种类型的核苷酸的随机序列,或仅两种类型的核苷酸的随机序列,和衔接子;(c)在所述杂合分子中的第一互补多核苷酸的3’末端上生成共同尾序列,其中所述共同尾序列与第二引物互补;(d1)将所述亚细胞结构和RNA包囊在具有颗粒的微观体积或显微体积区室中,所述颗粒包含与之相连结的所述第二引物,所述第二引物还包含一个或多个独特分子标识符序列(UMI)和一个或多个条形码,所述条形码包含使得能够汇集所希望的多核苷酸的已知序列;从所述珠粒上释放所述引物;或者(d2)将所述杂合分子暴露于包含所述第二引物(在一些情况下,其相关于所述亚细胞结构的空间分辨率来说是区域特异性的)的基材,所述第二引物还包含一个或多个独特分子标识符序列(UMI)和一个或多个条形码,所述条形码包含使得能够汇集所希望的多核苷酸的已知序列;从所述结构上释放cDNA;(e)在所述第二引物的至少一部分与所述第一互补多核苷酸的尾杂交后产生第二链合成,由此产生第二互补多核苷酸,其包含所述RNA序列的至少一部分、所述UMI和所述条形码;和(f)任选地,扩增所述第二互补多核苷酸。在特别的实施方案中,对多个第二互补多核苷酸进行扩增和/或测序。可以对所述第二互补多核苷酸进行扩增以产生经扩增的第二互补多核苷酸,随后为对所述经扩增的第二互补多核苷酸中的一个或多个进行测序。所述扩增可以是通过聚合酶链式反应或者一种或多种等温扩增方法或线性扩增方法来进行的,包括随后的任何类型的测序,例如下一代测序。所述固定步骤可以包括使所述细胞材料经历大约0.1%至100%低聚甲醛,并且在所述固定步骤后,可以富集所述亚细胞结构,例如通过流式细胞术或密度梯度离心。在一些情况下,在所述固定步骤后,对所述亚细胞结构进行透化,例如通过一种或多种表面活性剂。
在特别的实施方案中,所述亚细胞区室或结构可以为突触小体、细胞核、细胞器(线粒体、核糖体、溶酶体、内质网、高尔基体)、神经元的极化结构(树突、轴突、突触、郎维耶结、树突棘、轴突起始段)、突触末梢、树突棘和细胞质凝集物;质体、溶酶体或由细胞所分泌的物理结构(例如细胞外囊泡)。
在特别的实施方案中,所述共同尾序列为同聚序列,包括通过末端转移酶被添加至所述第一互补多核苷酸的3’末端的同聚序列。在一些情况下,所述同聚序列包含腺苷,并且所述第二引物至少包含胸苷。在特别的方面,通过逆转录酶的模板转换活性来将所述共同尾序列添加至所述第一互补多核苷酸的3’末端。
在特别的实施方案中,所述微观体积为微升、纳升、皮升或飞升体积的尺度。所述微观体积或显微体积区室可以包含小滴,包括在一些情况下在微孔和微凝胶中。
在一些实施方案中,通过刺激从所述亚细胞结构上释放所述cDNA,例如包括加热、pH变化和/或酶促切割(RNA酶H、RNA酶I或两者)的刺激。
在特别的实施方案中,所述第二引物通过连接体或通过共价键附接至所述珠粒。可以以酶促方式、以化学方式(例如通过紫外辐射和/或还原剂)和/或以物理方式(例如来自于加热)从所述颗粒上释放所述引物。
在所述方法的特别情况下,所述第一引物中的一个或多个与在新生RNA中的内含子序列相结合,或者所述第一引物中的一个或多个与长链非编码RNA相结合。所述长链非编码RNA可以或可以不包含经多腺苷酸化的尾。
上述内容已相当广泛地概述了本发明的特征和技术优点,以便可以更好地理解下面的对于本发明的详细描述。本发明的另外的特征和优点将会在下文中进行描述,其构成本发明的权利要求书的主题。本领域技术人员应当意识到,所公开的概念和具体实施方案可以容易地用作用于修饰或设计其他结构的基础,以实现本发明的相同目的。本领域技术人员还应当认识到,这样的等价建构不背离在所附的权利要求书中所陈述的本发明的精神和范围。被认为对于本发明来说特征性的新特征(无论是关于其组构还是操作方法),与进一步的目标和优点一起,都将会从下面的描述中得到更好理解,当与附图相联系地进行考虑时。然而,应当明确理解的是,附图中每一个仅是为了举例说明和描述的目的来提供,而非意欲作为本发明的限制的定义。
附图简述
为了更完全地理解本发明,现在参考联合附图所进行的下面的描述。
图1a-1i.MATQ-Drop和在物种混合实验中的表现的概观。图1a,MATQ-Drop的反应流程。在经固定的核上进行原位逆转录和polyA加尾,然后将其包囊在具有带条形码的水凝胶珠粒的小滴中。在所述小滴内部,以酶促方式从所述珠粒上释放带条形码的dT20引物以捕获从所述核上释放的cDNA的polyA尾。在完成带条形码的第二链合成后,打破乳状液,并且可以对产物进行扩增和测序。图1b,在物种混合实验中代表真实核的条形码的鉴定。将条形码从最大到最小UMI计数进行排序。在UMI计数对条形码等级的绘制图上,拐点(162,红色虚线)指明了关于真实核的阈值。图1c,所鉴定的162个核的物种注释。图1d,UMI的物种特异性。图1e,在外显子和内含子中的UMI的份额(平均值±SD)。图1f-1g,在UMI计数和基因计数中MATQ-Drop的检测灵敏度。图1h-1i,对于单个NIH/3T3核在MATQ-Drop和其他主要单核RNA-seq方法8,13之间的检测灵敏度的比较(p值通过双侧t-检验来计算)。图版图1d、1f-1i,箱形图:中心线,中值;箱界限,上和下四分位数;须,1.5x四分位数间距;点,离群值。
图2a-2p.人海马突触组(synaptome)图册。图2a,突触制备的工作流程。图2b,用于分离Hoechst-阴性亚神经元结构(P8)的FACS门控策略。图2c,Western印迹,其显示了在经分选的Hoechst-阴性群体中突触标志物(突触小泡蛋白和突触蛋白-1)的富集和非突触标志物(髓鞘质:CNP;星形胶质细胞:GFAP)的缺失(S:经分选的,P:分选之前的粒状沉淀物,H:脑匀浆物)。图2d,人海马的突触小体和神经元-神经胶质连接(junction)亚型的UMAP可视化。图2e-2f,UMAP特征图(feature plot)和小提琴图(violin plot),其显示了在不同聚簇中的亚细胞类型富含的标志物的表达(HI-突触:SYP;CA1兴奋性HI-突触[突触_ExCA1]:FNDC1;CA3兴奋性HI-突触[突触_ExCA3]:TSPAN18;DG兴奋性HI-突触[突触_ExDG]:SEMA5A;抑制性HI-突触[突触_In]:SLC6A1;LO-突触:SHANK1和SHANK3;ODC连接:MBP、PLP1和HIPK2;ASC连接:AQP4和GFAP)。图2g-2h,在UMI计数和基因计数中关于每个聚簇的检测灵敏度。图2i,火山图(volcano plot),其显示了在海马HI-突触和LO-突触之间的DEG。图2j,海马HI-突触富含的和LO-突触富含的基因的途径富集(pathway enrichment)。紧挨着所述点标记出富集倍数。图2k,关于在人海马中的每个突触小体和神经元-神经胶质连接聚簇的内含子UMI的份额。图2l,火山图,其显示了在海马中在N-突触和其他突触之间的DEG。图2m,海马N-突触富含的和其他突触富含的基因的途径富集。紧挨着所述点标记出富集倍数。图2n,火山图,其显示了在ODC-连接和LO-突触之间的差别表达基因。图2o,火山图,其显示了在ASC-连接和LO-突触之间的差别表达基因。图2p,ODC连接富含的和ASC连接富含的基因的途径富集。紧挨着所述点标记出富集倍数。
图3a-3r.人海马的基于新生RNA的细胞图册。图3a,在外显子和内含子中的UMI的份额。图3b,在初步聚类分析中鉴定出的11个细胞群体的UMAP可视化。ExCA:CA兴奋性神经元;ExDG:DG兴奋性神经元;In_A-C:抑制性神经元A-C;ASC1-2:星形胶质细胞1-2;OPC:少突胶质细胞前体细胞;ODC:少突胶质细胞;MG:小神经胶质;T:T细胞。图3c-3d,在UMI计数和基因计数中关于每个海马聚簇的检测灵敏度。图3e,UMAP特征图,其显示了在不同聚簇中的充分建立的细胞类型特异性标志物的经log标准化的表达(兴奋性神经元:SLC17A7;CA神经元:FNDC1;DG神经元:SEMA5A;抑制性神经元:GAD2;ASC:AQP4和GFAP;OPC:CSPG4;ODC:MBP;MG:C3;T:CD96)。图3f,小提琴图,其显示了在不同聚簇中的标志物基因表达水平。图3h,仅使用lncRNA表达矩阵的聚类结果的UMAP可视化,通过基于新生的RNA注释来着色。图3g-3j,火山图,其显示了关于四个神经元亚型在HI-突触和核之间的基于外显子的DEG。图3k-3l,文氏图,其显示了在四个神经元亚型之中突触富含的或核富含的基因的重叠。图3m,共享的突触富含的和核富含的基因的途径富集。图3n,在CA兴奋性神经元的相互比较的HI-突触和核中的平均内含子UMI份额,其中边缘地毯图(marginal rug plot)指明了密度。图3o,在CA兴奋性神经元中的未剪接的突触基因的鉴定。图3p,按基因类型进行分组的未剪接的突触基因的数目。图3q,跨越四个神经元亚型的未剪接的突触基因的文氏图,和在所有四个神经元亚型中检测出的41个蛋白质编码基因的列表。图3r,在经完全剪接的基因中富含的途径,通过基于剪接得分的预分级的GSEA来鉴定的。
图4a-4j.小鼠海马细胞图册和突触组图册。图4a,小鼠海马的突触小体和神经元-神经胶质连接亚型的UMAP可视化。图4b,小提琴图,其显示了在不同聚簇中的亚细胞类型富含的标志物的表达(Syn1:Csmd1、Kcnip4和Nrg3;Syn2:Grin2b;Syn3:Shank1和Camk2a;Syn4:Pclo;Syn5:Zbtb20;Syn6:Chd9;Syn7:Purg;Syn8:Nopchap1;Syn9:Apc;Syn10:Hivep3;Syn11:Kmt2d;Syn12:Ksr;AIS/NR:Ank3和Ank2;ODC连接:Mbp和Mobp;ASC连接:Slc1a2和Atp1a2)。图4c,关于在小鼠海马中的每个突触小体和神经元-神经胶质连接聚簇的内含子UMI的份额。图4d,在初步聚类分析中鉴定出的19个细胞群体的UMAP可视化。ExCA1A-B:CA1兴奋性神经元A-B;ExCA3:CA3兴奋性神经元;ExDG:DG兴奋性神经元;ExSub:下托兴奋性神经元;Ex1-4:其他兴奋性神经元1-4;In1-2:抑制性神经元1-2;ASC1-2:星形胶质细胞1-2;OPC:少突胶质细胞前体细胞;ODC:少突胶质细胞;MG1-3:小神经胶质1-3;成纤维细胞:成纤维细胞。图4e,火山图,其显示了在突触和神经元核之间的基于外显子的DEG。图4f,在突触和核中富含的途径,通过GSEA来鉴定的。图4g,在相互比较的突触和神经元核中的平均内含子UMI份额,其中边缘地毯图指明了密度。图4h,在神经元中的未剪接的突触基因的鉴定。图4i,按基因类型进行分组的未剪接的突触基因的数目。图4j,在未剪接的和经完全剪接的基因中富含的途径,通过基于剪接得分的预分级的GSEA来鉴定的。
图5a-5f.阿尔兹海默病相关的突触病(synaptopathy)。图5a,在5xFAD小鼠和WT之间关于ODG和MG1细胞的细胞频率的比较。T-检验显著性代码:p值(0,0.0001]:****;(0.0001,0.001]:***;(0.001,0.01]:**;(0.01,0.05]:*。图5b,对于不同细胞类型在5xFAD和WT的单核转录物组之间的DEG的功能富集。图5c,热图,其显示了在不同类型的核中在5xFAD和WT之间的基于内含子的DEG的倍数变化(fold change)(abs(log2FC)>log2(1.3),FDR<0.05)。图5d,热图,其显示了在不同的突触小体和神经元-神经胶质连接亚型中在5xFAD和WT之间的DEG的倍数变化((abs(log2FC)>log2(1.3),FDR<0.05)。图5e,相比于WT而言在5xFAD突触中富含的途径。图5f,热图,其显示了由至少6个亚型共享的突触-AD-DEG的倍数变化,和在AD核中的它们的基于内含子的表达倍数变化。
图6a-6l.仅使用lncRNA种类的细胞分型以及在10X Chromium和MATQ-Drop之间的检测灵敏度比较。
图6a,仅使用来自人海马的单核转录物组的lncRNA表达矩阵的聚类结果的UMAP可视化。图6b,热图,其显示了细胞类型特异性lncRNA的经标度的表达水平。图6c,UMAP特征图,其显示了细胞类型特异性lncRNA的经log标准化的表达水平(兴奋性神经元:LY86-AS1;抑制性神经元:DLX6-AS1;ASC:PPP1R9A-AS1;OPC:AC124254.2;ODC:LINC01608;MG:LINC01141)。图6d,仅使用来自小鼠海马的单核转录物组的lncRNA表达矩阵的聚类结果的UMAP可视化。图6c-6e,UMAP特征图,其显示了细胞类型特异性lncRNA的经log标准化的表达水平(CA1兴奋性神经元:4921539H07Rik;CA3兴奋性神经元:Gm32647;DG兴奋性神经元:Gm12339;下托兴奋性神经元:Gm28905;抑制性神经元:Gm45323和Dlx6os1;ASC:Celrr;OPC:6030407O03Rik;ODC:Gm16168;MG:AU020206;成纤维细胞:2610307P16Rik)。图6f-6g,相比于10X Chromium39而言的基于转录物的检测灵敏度(UMI计数和基因计数)。图6h-6i,相比于10X Chromium39而言的基于外显子的检测灵敏度(UMI计数和基因计数)。图6j,相比于10XChromium39而言的LncRNA检测灵敏度(UMI计数)。图6k,在分级的lncRNA基因的轴上UMI的累积份额。图6l,相比于10X Chromium39而言的LncRNA检测灵敏度(基因计数)。T-检验显著性代码:p值(0,0.0001]:****;(0.0001,0.001]:***;(0.001,0.01]:**;(0.01,0.05]:*。
发明详述
与长期存在的专利法惯例相一致,当在本说明书(包括权利要求书)中与单词“包含”相呼应地进行使用时,单词“a”和“an”表示“一个(种)或多个(种)”。本公开内容的一些实施方案可以由或基本上由本公开内容的一个或多个要素、方法步骤和/或方法组成。考虑了在本文中所描述的任何方法或组合物可以相关于在本文中所描述的任何其他方法或组合物来施行。
如在本文中所使用的,术语“大约”或“大致”是指相比于参考量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度而言相差多达30、25、20、25、10、9、8、7、6、5、4、3、2或1%的量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度。在特别的实施方案中,当在数值前面时,术语“大约”或“大致”指明了所述值加或减15%、10%、5%或1%的范围。
如在本文中所使用的,使用术语“或”和“和/或”来描述相互组合或排除的多个组分。例如,“x、y和/或z”可以是指单独的“x”,单独的“y”,单独的“z”,“x、y和z”,“(x和y)或z”,“x或(y和z)”,或者“x或y或z”。特别考虑了,x、y或z可以被从一个实施方案中特别地排除。
在整个本说明书中,除非上下文另有要求,单词“包含”、“含有”和“包含有”将会被理解为暗示包括所陈述的步骤或者要素或者步骤或要素的群组,但并不排除任何其他步骤或者要素或者步骤或要素的群组。“由......组成”意味着包括和局限于在短语“由......组成”后面的无论什么事物。因此,短语“由......组成”表明,所列出的要素是必需的或强制性的,并且不可以存在其他要素。“基本上由......组成”意味着包括在该短语之后所列出的任何要素,并且局限于不干扰或者有助于在本公开内容中对于所列出的要素所指定的活性或作用的其他要素。因此,短语“基本上由......组成”表明,所列出的要素是必需的或强制性的,但是其他要素是任选的并且可以存在或可以不存在,取决于它们是否影响所列出的要素的活性或作用。
在整个本说明书中,提及“一个实施方案”、“一实施方案”、“一个特别的实施方案”、“一个相关的实施方案”、“某一个实施方案”、“另一个实施方案”或“一个进一步的实施方案”或者其组合意味着,与所述实施方案相联系地进行描述的具体的特征、结构或特点被包括在本发明的至少一个实施方案中。因此,在整个本说明书中上述短语在各种地方的出现不一定都是指相同的实施方案。进一步地,所述具体的特征、结构或特点可以在一个或多个实施方案中以任何合适的方式进行组合。
如在本文中所使用的,术语“半扩增子”是指这样的多核苷酸,其是在逆转录后的产物,例如cDNA。如在本文中所使用的,术语“全扩增子”是指这样的多核苷酸,其是第二链合成产物或者是从全扩增子扩增出的分子。扩增子在两端都具有共同的衔接物,其允许进一步的扩增,包括用于PCR扩增。扩增子可以存在于具有其他扩增子的文库中,其组合可以代表所希望的一套RNA模板,例如在亚结构中或与亚结构相连结的RNA。
术语“条形码(barcode)”可以是指已知的多核苷酸序列,其允许所述条形码所与之相连结的多核苷酸的一些特征被鉴定。在一些情况下,待鉴定的多核苷酸的特征为所述多核苷酸所源自的样品。在一些情况下,条形码的长度为至少3、4、5、6、7、8、9、10、11、12、13、14、15或更多个核苷酸。在一些情况下,条形码的长度短于10、9、8、7、6、5或4个核苷酸。寡核苷酸(例如,引物或衔接物)可以包含大约、多于、少于、正好或至少1、2、3、4、5、6、7、8、9或10个不同的条形码。在一些情况下,与一些多核苷酸相连结的条形码具有不同于与其他多核苷酸相连结的条形码的长度。条形码可以具有足够的长度,并且包含这样的序列,其可以是足够不同的以允许基于它们所与之相连结的条形码来鉴定样品。在一些情况下,多个条形码中的每个条形码在一个或多个核苷酸位置(例如(在一些情况下,至少)1、2、3、4、5、6、7、8、9、10或更多个位置)处不同于所述多个条形码中的每个其他条形码。在一些情况下,衔接物包含多个条形码序列中的至少一个。在一些情况下,关于第二衔接物寡核苷酸的条形码独立于关于第一衔接物寡核苷酸的条形码来进行选择。在一些情况下,使具有条形码的第一衔接物寡核苷酸和第二衔接物寡核苷酸进行配对,从而所述对的衔接物包含相同或不同的一个或多个条形码。在一些情况下,在本文中所描述的方法进一步包括鉴定靶多核苷酸所源自的样品,基于所述靶多核苷酸所连接至的条形码序列。条形码可以包含这样的多核苷酸序列,其当被连接至靶多核苷酸时充当所述靶多核苷酸所源自的样品的标识符。
在本文中所使用的术语“细胞材料”是指全细胞或细胞的部分,包括细胞碎片。当所述细胞材料包含少于全细胞的材料时,所述细胞的部分可以是或可以不是天然得到的。在特别的情况下,所述细胞材料包含全体亚细胞结构和/或亚细胞结构的部分。
在本文中所使用的术语“长链非编码RNA(或lncRNA)”是指具有大于大约200个核苷酸的长度的RNA转录物,其不被翻译为蛋白质。
在本文中所使用的术语“新生RNA”是指在转录后加工(例如,加帽、加尾和剪接)之前或者在转录后加工完成之前由RNA聚合酶II合成的RNA。
在本文中所使用的术语“亚细胞结构”是指在细胞内的一个或多个物理结构,例如细胞核、细胞器(线粒体、核糖体、溶酶体、内质网、高尔基体)、神经元的极化结构(树突、轴突、突触、郎维耶结、树突棘、轴突起始段);突触末梢、树突棘和细胞质凝集物;或者由细胞所分泌的物理结构(例如细胞外囊泡)。
****************
本公开内容涉及扩增RNA序列(作为DNA文库中的代表性序列)的方法,当相应的RNA分子为亚细胞结构的一部分或者与之相连结时。根据本公开内容的某些方面,单亚细胞颗粒的RNA分子稳定地附接至亚细胞结构,例如通过固定。所述固态亚细胞体可以包括原始细胞的任何部分,原始核的整体或部分,细胞或亚细胞结构,和合成的颗粒,例如聚合物凝胶珠粒。在本文中可以将它们称为微观生物学颗粒。RNA与固体颗粒的附接可以以物理方式或以化学方式来取得。在一些情况下,可以通过共价键、通过氢键、通过蛋白质-蛋白质相互作用或通过磁力来将RNA附接至固体颗粒。
通过至少一种逆转录酶来进行原位逆转录,以基于附接至微观生物学颗粒的RNA来合成cDNA。在cDNA和RNA模板之间的杂交允许所述cDNA间接地但是稳定地附接至所述亚细胞特异性生物学颗粒。然后,将共同序列原位添加至所述cDNA的3’末端。在一些情况下,所述共同序列为同聚物,其可以通过末端转移酶来进行添加。在一些情况下,所述共同序列可以通过具有模板转换活性的逆转录酶来进行添加。在3’末端处具有共同序列的cDNA可以用至少一种DNA聚合酶来进行扩增。在本文中提供了这和随后的第二链合成以产生文库的细节。
为了满足对于独个亚细胞结构的高通量转录物组剖析方法的特殊技术需求,本公开内容提供了基于微体积的总RNA scRNA/sssRNA seq平台的开发,其称为在小滴中的基于多重退火和加尾的定量RNA-seq(Multiple-Annealing-and-Tailing-based QuantitativeRNA-seq in Droplet)或MATQ-Drop。MATQ-Drop的开发基于MATQ-seq的先前化学6。MATQ-Drop与经固定的样品一起工作,并且其对于新生RNA的有效检测使得它适合于表征在突触小体(作为亚细胞结构的例子)中的局部剪接。虽然商业10X Genomics Chromium平台是广泛易得到的7-10,但是在该平台上的基于SMART-seq的化学11主要是设计由于定量在新鲜和未固定的样品中的成熟RNA水平,因此使得它不适合于单亚细胞区室(例如突触小体)的转录物组剖析。
使用MATQ-Drop平台,发明人进行了人和小鼠脑样品的单突触小体的转录物组剖析。为了方便起见,将突触小体的转录物组称为突触组。在突触组数据中,发明人能够鉴定出各种类型的神经突,包括不同亚型的突触小体和神经元-神经胶质连接。在不同亚型的突触小体中,观察到突触前和突触后聚簇,以及在装配和成熟过程中与突触相关联的特殊亚聚簇。可以容易地检测到在不同亚聚簇之间的转录物组差异。通过新生RNA的有效检测,对于各种突触聚簇表征了内含子保留(intron-retention)的图景。
除了突触组剖析外,还将MATQ-Drop应用于剖析关于相同脑样品的单个核的转录物组。用突触组和单核转录物组两者,发明人能够将突触的亚聚簇与不同类型的神经元相联系。然后,分析在突触和神经元核之间的差别基因表达和剪接。进一步地,剖析了从阿尔茨海默病(AD)小鼠模型中分离的突触小体,并且表征了突触病相关的转录物组,从而导致发现了通过单核转录物组剖析无法检测的新的AD-相关的基因表达变化。
通过总RNA的有效检测,发明人还通过仅使用长链非编码RNA(lncRNA)种类而成功地生成了细胞图册。该结果表明,MATQ-Drop允许细胞类型特异性lncRNA种类的大规模鉴定。进一步地,基于小鼠海马的单核转录物组,发明人还进行了MATQ-Drop和10XChromium之间的基准比较。结果显示,MATQ-Drop显现出相比于10X平台而言2.5-3.7倍的基因检测灵敏度的改善。总之,作为第一个基于总RNA的高通量转录物组平台,MATQ-Drop提供了对于10XChromium平台的备选的高通量高灵敏度SC转录物组平台。基于MATQ-Drop的独个突触小体的转录物组剖析推动了神经科学中的新发现。
在特别的实施方案中,本公开内容涉及使用总RNA-Seq化学的独个突触的基于微体积的高通量转录物组剖析。
I.一般性实施方案
本公开内容的实施方案允许产生代表任何类型的RNA分子的文库,包括至少例如对于mRNA分子、新生RNA、微小RNA和长链非编码RNA。在一些情况下,所述RNA代表在细胞亚结构中(或者与之相连结的)RNA。由于从多种类型的RNA(包括不是仅mRNA)产生文库,人们可以例如基于未剪接的转录物序列获得基因表达信息。这可以在当对所产生的文库分子(其中的至少一些可以映射至内含子区域)进行测序时产生,与对来自仅代表外显子区域的经剪接的转录物的序列进行测序相反。
在适用的情况下,本公开内容的实施方案还包括用于鉴定不同亚型的亚细胞结构的方法。鉴于所公开的方法提供了至少新生RNA的检测,因而人们可以将所述方法应用于在时间和/或空间水平上剖析剪接。例如,人们可以将所述方法应用于分析(甚至在大规模水平上)来自一个(或多个)样品的多个亚细胞结构,其可以显现在所述亚细胞结构之中是否存在转录物组差异,例如来自相似区域的。例如,所述方法可以检测在正进行分析的特定区块中的以梯度方式的或者具有区域差异的亚细胞结构RNA的差异。在特别的情况下,人们可以基于亚细胞结构转录物组的聚类来寻求或鉴定是否存在特殊类型的细胞亚聚簇。
本公开内容的实施方案包括采用一系列步骤来产生代表任何类型的模板RNA(包括经多腺苷酸化和/或未多腺苷酸化的RNA,并且不一定仅mRNA转录物)的扩增子文库的方法。一般而言,将来自包含任何类型的亚细胞结构的任何类型的细胞材料的RNA用作模板来产生代表所述RNA的扩增子,并且所述扩增子可以以任何方式进行测序或处理。在特别的实施方案中,所述方法涉及固定细胞材料,对于所述细胞材料,RNA在任何类型的亚细胞结构中或者与之相连结。将经固定的亚细胞结构/RNA复合物的RNA暴露于充分的原位逆转录条件(并且使用特定类型的引物),随后为相对于所述RNA的新合成的互补多核苷酸分子的3’末端的原位加尾。在所述模板RNA为RNA的情况下,可以将新合成的互补多核苷酸分子称为cDNA。在所述模板RNA为新生RNA、微小RNA或长链非编码RNA的情况下,新合成的互补多核苷酸分子也可以称为互补DNA,或者在一些情况下,称为半扩增子。新合成的互补多核苷酸分子的3’末端的加尾允许在新合成的互补多核苷酸分子之中的共同序列,通过其引物可以进行结合以用于第二链合成,随后至少允许原始RNA模板序列的进一步线性扩增。在希望对特定的新合成的互补多核苷酸分子进行分组的情况下,用于第二链合成的引物可以包含一个或多个条形码。在希望具体地鉴定特定的新合成的互补多核苷酸分子的情况下,用于第二链合成的引物可以包含一个或多个对于每个多核苷酸分子来说独一无二的独特分子标识符序列。所述方法的至少一个结果产生这样的扩增子,其包含代表原始RNA模板的至少一部分(包括代表内含子序列和其他非编码序列,在至少一些情况下)的序列,和条形码,和在至少一些情况下,独特分子标识符。
在所述方法的起始步骤中,获得细胞材料,例如商购获得或者从来自一个或多个个体的生物学或临床样品获得。所述材料的来源可以是新鲜的、冷冻的,或者它事先进行了冷冻。所述细胞材料可以包含全细胞或细胞碎片,并且包含任何类型的亚细胞结构。在特别的实施方案中,所述亚细胞结构为突触小体、细胞核、质体或线粒体。将所述细胞材料/RNA在合适的物理和/或化学条件下以组织学方式进行固定,从而将所述RNA以物理方式和/或以化学方式连接至所述细胞材料,包括亚细胞结构。在特别的实施方案中,将所述细胞材料/RNA通过一种或多种交联固定剂化合物来进行固定,所述交联固定剂化合物例如为在所述RNA和所述细胞材料(包括亚细胞结构)之间生成共价化学键的那种。所述固定剂可以为一种或多种醛,例如低聚甲醛、甲醛、戊二醛或其组合;一种或多种醇,例如使蛋白质变性的甲醇、乙醇和/或丙酮;一种或多种氧化剂,例如四氧化锇、重铬酸钾、铬酸和/或高锰酸钾;一种或多种锌固定剂,例如乙酸锌和/或氯化锌;或者其组合。在特别的实例中,所述固定剂在大约0.1-100、0.1-50、0.1-25、0.1-10、0.1-5、0.1-1、1-100、1-50、1-25、1-10、1-5、5-100、5-50、5-25、5-10、10-100、10-50、10-25、25-100、25-50或50-100%的范围内。
在固定后,使所述细胞材料/RNA复合物经历适当的原位逆转录条件,其使用某些引物。所述方法的实施方案使用在通过引物的结合和延伸后推动互补多核苷酸的产生的引物。在特别的情况下,所述互补多核苷酸在原位逆转录后产生,在所述原位逆转录中在足够量的包含随机序列并且可以结合所述RNA的引物存在下将所述RNA暴露于至少一种逆转录酶。在特别的实施方案中,所述引物包含允许它们在无论何处结合到mRNA、新生RNA或长链非编码RNA上的随机序列。所述引物允许从一个或多个细胞的总RNA产生双链互补DNA(cDNA)。根据所公开的扩增方法而产生的双链cDNA适合于进一步扩增,无论是否通过非线性方式。
在一个特别的实施方案中,存在多个引物与同一RNA分子的退火。在将引物暴露于核酸后,这生成包含与引物退火的核酸模板的混合物。在特别的实施方案中,相对于模板RNA分子(mRNA、新生RNA、长链非编码RNA)的互补多核苷酸的产生采用鸟枪覆盖方法,其中多个引物将会在单个RNA模板分子上杂交,并且这将会跨越多个RNA分子发生,无论所述RNA是经多腺苷酸化的还是未多腺苷酸化的。所述引物总体上可以与内含子、外显子、RNA的5’末端和RNA的3’末端杂交,虽然特定的引物可能能够与内含子和外显子两者杂交,例如跨越剪接点。因此,启动逆转录的引物组合可以覆盖单个RNA分子,并且那个组合可以包括2、3、4、5或更多个引物(虽然在备选的实施方案中,仅一个引物结合特定的RNA分子)。在特别的实施方案中,所述引物的序列设计允许它们在低温下与RNA转录物杂交,而不相互杂交,从而避免引物二聚体的产生。
在特别的实施方案中,在第一多个中的引物是大约40%-60%富G的或大约40%-60%富C的,虽然不是同时地。在特别的实施方案中,所述引物包含下述公式:5’-XnYmZp-3’,其中n大于2(或者大于4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、33、34或35),并且X是或是大约40%-60%富G的(包括大约40%-60%、40%-55%、40%-50%、40%-45%、45%-60%、45%-55%、45%-50%、50%-60%、50%-55%、55%-60%)或者是或是大约40%-60%富C的(包括大约40%-60%、40%-55%、40%-50%、40%-45%、45%-60%、45%-55%、45%-50%、50%-60%、50%-55%、55%-60%),其中Y为任何核苷酸并且m为5-8个核苷酸(包括5-8、5-7、5-6、6-8、6-7或7-8个核苷酸,并且包括5、6、7或8个核苷酸),并且其中Z为T或G,当X是富G的时候;或者Z为C,当X是富C的时候,其中p为大约2-20(包括2-20、2-28、2-26、2-14、2-12、2-10、2-8、2-6、2-4、4-40、4-18、4-16、4-14、4-12、4-10、4-8、4-6、6-20、6-18、6-16、6-14、6-12、6-10、6-8、8-20、8-18、8-16、8-14、8-12、8-10、10-20、10-18、10-16、10-14、10-12、12-20、12-18、12-16、12-14、14-20、14-18、14-16、16-20、16-18或18-20)个核苷酸。在特别的实施方案中,n为大约20-35、20-32、20-30、20-28、20-26、20-25、20-24、20-22、22-35、22-34、22-32、22-30、22-28、22-26、22-25、22-24、24-35、24-34、24-32、24-30、24-28、24-26、24-25、25-35、25-34、25-32、25-30、25-28、25-26、26-35、26-34、26-32、26-30、26-28、28-35、28-34、28-32、28-30、30-35、30-34、30-32、32-35、32-34或34-35个核苷酸。在一些情况下,n可以为大约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸的长度。在特别的情况下,对所述多个引物进行设计以避免它们之间的串扰。
在关于引物的特别情况下,5′-XnYmZp-3′的公式可以为5′DnYmZp 3′或5′-HnYmZp-3′,其中D表示G或A或T,并且H表示C或A或T。在特别的情况下,n为大约20至大约35个核苷酸,包括大约20-35、20-32、20-30、20-28、20-26、20-25、20-24、20-22、22-35、22-34、22-32、22-30、22-28、22-26、22-25、22-24、24-35、24-34、24-32、24-30、24-28、24-26、24-25、25-35、25-34、25-32、25-30、25-28、25-26、26-35、26-34、26-32、26-30、26-28、28-35、28-34、28-32、28-30、30-35、30-34、30-32、32-35、32-34或34-35个核苷酸。在一些情况下,n可以为20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸的长度。
在特别的实施方案中,对于Xn、Hn或Dn,各自的G或C碱基很好地分散在X序列中,包括以避免相同碱基的任何簇集。在特别的情况下,G或C被3、4、5、6或更多个碱基隔开。
根据一个方面,使用于在原位逆转录中产生互补多核苷酸的反应混合物经历促进引物-模板退火的条件。在至少一些情况下,这牵涉使混合物的温度降低至允许在引物的3’末端处的随机核苷酸与RNA退火以形成杂合双链体的温度。在特别的情况下,所述温度可以低至0℃并且可以高至大约60℃。因此,在特别的实施方案中,用于原位逆转录的温度为大约0-60、0-50、0-40、0-30、0-20、0-10、10-60、10-50、10-40、10-30、10-20、20-60、20-50、20-40、20-30、30-60、30-50、30-40、40-60、40-50或50-60℃。
在杂合双链体形成后,在反应混合物中存在的一种或多种逆转录酶在合适的温育时间段期间从第一引物的3’末端起延伸cDNA链,以产生在RNA和cDNA之间的杂合分子。杂合双链体形成和cDNA延伸的过程重复至少2次,虽然它可以发生3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或者更多次。在该步骤的重复中,不使反应经历解链温度。在至少一些情况下,在通过逆转录酶进行第一链cDNA合成后,可以使反应混合物经历这样的条件,其中未退火的引物和模板RNA被消化并且使得在反应中存在的酶失活。在特别的情况下,在消化模板RNA之前消化引物。引物的消化可以通过任何方式发生,但是在特别的实施方案中,它用核酸酶来发生。在本公开内容的实施方案中,提供了可以有效地去除预先存在的引物以允许第一链cDNA的有效加尾的方法。在没有引物的有效消化的情况下,残留引物的加尾胜过半扩增子的加尾并且导致在随后步骤中扩增失败。因此,在某些方面,人们可以使用T4 DNA聚合酶或者其他在低于30℃或更低的低温下具有核酸外切酶活性的聚合酶,和核酸外切酶I或者其他仅消化未退火的引物的核酸外切酶。所述酶可以是经热失活的。
在产生与RNA互补的多核苷酸后,使混合物经历原位加尾。所述互补多核苷酸的3’末端可以用这样的序列进行加尾,所述序列是已知的和在互补多核苷酸之中是共同的,并且与用于第二链合成和进一步的线性扩增的引物(和其是带条形码的,在特别的实施方案中)互补。在特别的实施方案中,所述加尾步骤在大约10-45℃的温度范围下发生,例如大约10-45、10-40、10-35、10-30、10-25、10-20、10-15、15-45、15-40、15-35、15-30、15-25、15-20、20-45、20-40、20-35、20-30、20-25、25-45、25-40、25-35、25-30、30-45、30-40、30-35、35-45、35-40或40-45℃。3’末端的加尾可以通过任何方法发生,但是在特别的实施方案中,它通过末端转移酶发生。所述加尾可以是同聚的(具有单一核苷酸),并且在特别的实施方案中,所述多核苷酸为A、T、C或G、但是在特别的情况下,它为A。也就是说,在特别的实施方案中,3’末端加尾可以在末端脱氧核苷酸转移酶存在下用集中的A碱基来进行,其中用于加尾的碱基将会是与条形码引物互补的。所述尾的长度可以是任何长度,但是特别地可以在1-3000、1-2000、1-1000、1-500、1-100、100-3000、100-2000、100-1000、100-500、500-3000、500-2000、500-1000、1000-3000、1000-2000或2000-3000个碱基的范围内。
在其他实施方案中,所述互补多核苷酸的3’末端可以用已知的和在互补多核苷酸之中共同的序列进行加尾,但是所述方法使用逆转录酶的模板转换活性,而非使用末端转移酶。在该实例中,人们可以使用合适水平的一种或多种模板转换寡核苷酸以及逆转录酶,和所述亚细胞结构/在RNA和cDNA之间的杂合分子。
在所述方法的特别的实施方案中,使用允许识别某些亚组的引物来进一步线性扩增经加尾的互补多核苷酸,并且至少在一些情况下,这生成文库以用于所述文库中的一些或全部的随后非线性扩增从而用于进一步分析。在特别的实施方案中,至少所述第二链合成步骤以微观体积(微升、纳升、皮升或飞升体积,和在一些情况下,不大于微升、纳升、皮升或飞升体积)的尺度发生。在特别的情况下,所述微观体积在区室或基材内,虽然在备选的情况下,它不在区室中。在某些方面,所述微观体积或显微体积区室包含小滴,并且所述小滴可以在微孔或者油或芯片装置(例如在聚二甲基硅氧烷(PDMS)或玻璃材料上的微孔)中。
在特别的实施方案中,将作为经固定的与亚细胞结构的复合物的一部分的RNA/cDNA杂合体包囊在微观体积或显微体积区室中。所述微观体积或显微体积区室可以或可以不已经包含具有与之相连结的(例如通过连接体或通过脱氧尿苷附接的)条形码引物的颗粒(例如珠粒,包括凝胶珠粒)。在所述方法的某些方面,生成连接有引物的珠粒,例如按照所述条形码引物的设计。所述连接有引物的珠粒可以由使用者生成或者以化学方式获得,在一些情况下。
在特别的实施方案中,所述方法的某些步骤可以以下述的次序实例来实施:(1)产生cDNA,其中所述RNA仍然固定至所述亚细胞结构;(2)将所述RNA/cDNA杂合体与所述亚细胞结构一起包囊在具有颗粒(例如,珠粒)的小滴中;(3)从所述珠粒上释放带条形码的引物;(4)从所述亚细胞结构上释放cDNA;和(5)使用所述带条形码的引物从所述cDNA产生扩增子(即,第二链合成)。
在小滴包囊后,通过刺激(例如,刺激包括加热、pH变化和/或酶促切割(RNA酶H、RNA酶I或两者)),从所述亚细胞结构上释放所述cDNA。所述小滴包含合适的试剂以允许经加尾的cDNA的尾与所述引物的杂交和第二链合成(下面所讨论的)。
在第二链合成之前,可以通过物理或化学手段从所述颗粒(例如,珠粒)上释放所述引物。所述引物可以通过酶促手段来释放。当所述引物通过脱氧尿苷附接至所述颗粒时,所述引物可以通过尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂合酶核酸内切酶VIII(例如,USERTM酶)的混合物来释放。
在备选的情况下,将所述RNA/cDNA杂合分子暴露于包含所述条形码引物的基材,而不是与连接有条形码引物的颗粒(例如,珠粒)相关联地发生第二链合成。
对于第二链合成,将反应混合物暴露于至少一种DNA聚合酶和多个条形码引物,其包含条形码,所述条形码具有已知的序列并且使得能够对具有相同或相似的(在序列同一性方面,>大约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大)条形码的特定多核苷酸进行分组。在特别的情况下,所述条形码引物可以具有XnYmZpTq序列基序,其中n大于2,并且X是大约40%-60%富G的或大约40%-60%富C的,Y为DNA条形码序列,作为独特样品索引(具有5、6、7或8个碱基的特异的DNA序列,m在5-8的范围内),并且Z为5N或6N或7N或8N的随机序列(p在5-8的范围内),作为单个分子的独特索引;T为胸腺嘧啶碱基,其中q值范围为16至32,用于捕获cDNA的polyA尾。在任何情况下,对所述条形码引物进行设计以避免它们之间的串扰和避免引物二聚体。在特别的实施方案中,第二cDNA的生成在大约42-72℃的范围内的温度下发生,例如大约42-72、42-65、42-60、42-55、42-40、42-45、45-72、45-65、45-60、45-55、45-50、48-72、48-65、48-60、48-55、48-50、50-72、50-65、50-55、55-72、55-65、55-60、60-72、60-65或65-72℃。
使反应混合物经历促进在所述条形码引物和所述cDNA分子(其在原位逆转录后产生和随后进行加尾)之间的杂交的条件。在杂合体形成后,在反应混合物中存在的一种或多种聚合酶在温育时间段期间从第一引物的3’末端起延伸第二cDNA链。所产生的分子包含代表原始RNA模板的序列和条形码序列。可以发生关于原始模板RNA的经加尾的互补多核苷酸的多次第二链合成,并且可以发生这些所生成的第二链的多次互补链合成,等等。因此,在特别的实施方案中,所述方法在所述条形码引物的至少一部分与所述RNA-互补多核苷酸的尾杂交后产生第二链合成,由此产生包含所述模板RNA序列的至少一部分、所述UMI和所述条形码的多核苷酸。在第二合成完成后,可以打破小滴以释放文库扩增子分子。在一些情况下,储存所述文库的部分或全部,而在其他情况下,使用所述文库的部分或全部,例如通过扩增,任选地随后为测序。所述文库可以在扩增后进行储存。
在特别的实施方案中,所产生的分子为代表模板RNA分子的文库。在一些情况下,可以将所述文库配置成用于商业或研究用途。在特别的实施方案中,所述文库的部分或全部可以通过合适的方法来进行扩增。在仅扩增所述文库的部分的情况下,所述部分可以或可以不包括包含某一或某些条形码的多核苷酸的汇集,例如为了排除缺乏所述某一或某些条形码的多核苷酸。可以扩增具有某些UMI的多核苷酸。
文库分子的扩增可以通过任何合适的方法,包括通过热扩增方法或等温扩增方法。在扩增后和/或在扩增前可以对所述文库分子进行测序。在特别的实施方案中,所述扩增通过聚合酶链式反应,并且扩增出的分子可以通过下一代测序或其他测序平台来进行测序。
在特别的实施方案中,在第二合成完成后,可以打破小滴并且可以进行PCR反应,例如为了扩增所述文库以用于下一代测序。
II.条形码
PCR扩增偏倚是在RNA测序中的重大挑战,因为扩增效率的小差异可以导致在数据中的重大人工信号。为了解决这个问题,人们可以将随机“条形码”(具有可变长度的随机DNA序列,例如NNNNNN,其中N表示四种标准核苷酸之一,在特别的实施方案中)引入到引物中,其将会为每一个独特的所产生的双链cDNA产物编索引。在测序后,和在一个实例中,通过用条形码为读段中的每一个编索引,人们可以区分高拷贝基因(高度表达的基因)与具有高扩增效率的扩增子(例如,具有许多独特条形码的高拷贝基因,相比于仅具有一个条形码的高拷贝基因而言)。这样的应用显著地改善了测序数据的准确性并且捕捉了在生物学上有意义的信息,例如亚结构的基因表达分析和表征。所公开的方法提供了关于使用条形码从测序数据中使基因表达标准化的解决办法。
III.本公开内容的方法的示例性应用
可以在研究、临床和/或其他应用中使用本公开内容的方法。在特别的实施方案中,例如在对于个体的诊断和/或预后和/或一种或多种疗法的监测中使用本公开内容的方法。在一些情况下,制备文库的团队可以是或可以不是进行文库扩增的团队,并且也可以是或可以不是进行文库分析的团队,无论所述文库是否进行了扩增。应用来自经扩增的文库的分析的信息的团队可以是或可以不是施行制备文库和/或扩增其部分或全部的方法的同一团队。
在一个应用一种或多种本公开内容的方法的实例中,所述方法用于检定一种或多种与来自个体的亚结构相关的核酸的含量或表达水平的一个或多个变化;所述变化可以是或可以不是相关于已知的标准物(例如,亚结构的特定核酸的相应的野生型序列)而言的。含量的变化可以包括相比于野生型而言的一个或多个核苷酸差异,例如置换、缺失、倒位等等。表达的变化可以包括相比于特定的已知或确定的标准物的正常表达水平而言的上调或下调。所述标准物可以包含在已知在基因型和/或表型方面正常的细胞中的正常核酸含量或表达水平的含量。
在特别的实施方案中,就下列方面中的一个或多个来分析经扩增的文库扩增子中的一个或多个:亚结构相关基因(例如,鉴定性标志物),癌突变,基因融合产物,剪接变体,癌基因的表达,肿瘤阻抑基因的表达丧失,肿瘤特异性抗原的表达,和/或所有经表达的基因的表达。
在特别的情况下,正进行检定的核酸获得自来自具有医学状况或者疑似具有医学状况或者处于具有医学状况的风险中或者正经历关于医学状况的疗法的个体的样品。所述样品可以是任何类型的,只要可以从来自所述样品的一个或多个细胞中直接或间接获得核酸,并且所述核酸可以指示细胞亚结构的存在或类型。在特别的实施方案中,所述核酸获得自来自所述个体的样品的一个或多个细胞。所述样品可以为血液、组织、毛发、活组织检查物、尿、***抽吸物、羊水、面颊刮削碎屑、粪便物或胚胎。
获得来自所述个体的合适样品,并且本公开内容的方法可以由获得了所述样品的个体直接地或间接地施行,或者所述方法可以由另一个团队或另一些团队来施行。
在一些情况下,为了获得足够的核酸以用于测试,抽取至少1、2、3、4、5、10、20、25、30、35、40、45或50mL的血液体积。在一些情况下,所述起始材料为外周血。可以就特定细胞类型(例如,单核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞;NK细胞等)来富集所述外周血细胞。也可以使所述外周血细胞选择性地耗竭特定细胞类型(例如,单核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞;NK细胞等)。
在特别的实施方案中,所述起始材料包括这样的细胞材料,其包含对于其特别想要进行RNA分析的亚细胞结构。在一些情况下,所述起始材料可以为包含固体组织的组织样品(和可以是活组织检查物),非限制性例子包括脑、神经元、肝脏、肺、肾、***、卵巢、脾、***(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食管和胃。在其他情况下,所述起始材料可以为包含核酸的细胞、免疫细胞,和特别是免疫细胞。在一些情况下,所述起始材料可以为包含核酸的样品,来自从其中可以获得遗传材料的任何生物。在一些情况下,样品为液体,例如,血液、唾液、淋巴液或尿。
在一些情况下,样品可以取自具有状况的受试者。在一些情况下,从其中取得样品的受试者可以为患者,例如具有神经变性疾病(或疑似具有神经变性疾病)的患者,或者癌症患者或疑似具有癌症的患者。所述受试者可以为哺乳动物,例如人,并且可以是任何性别的。在一些情况下,所述受试者可以是女性并且是怀孕的。在一些情况下,所述受试者可以正在接受疗法以治疗状况。在一些情况下,所述疗法可以是用于治疗癌症。在一些情况下,所述疗法可以为免疫疗法。所述样品可以为肿瘤活组织检查物。所述活组织检查可以由例如健康护理提供者(包括医师、医师助理、护士、兽医、牙医、按摩技师、急救医士、皮肤科医师、肿瘤科医师、胃肠科医师或外科医师)来进行。
在特别的应用中,希望在来自个体的样品中知晓一个或多个特定核酸序列。所述个体可以是任何年龄的。所述个体可以经历常规测试并且可以具有关于进行测试的特别愿望或医学理由。所述个体可以疑似具有特定的医学状况,例如具有一个或多个与所述医学状况相关联的症状,和/或具有与所述医学状况相关联的个人或家族史。所述个体可以处于具有医学状况的风险中,例如具有患所述医学状况的家族史,或者具有一个或多个已知的关于所述医学状况的风险因素,例如高胆固醇(对于心脏病),为吸烟者(对于各种各样的医学状况),具有高血压(对于心脏病或中风),具有与所述医学状况相关联的遗传标志物,等等。在特别的实施方案中,所述医学状况为神经变性疾病。
在特别的情况下,所述个体为胎儿,并且所述胎儿可以或可以不疑似具有相比于野生型而言的特定核酸序列或核酸表达变化,与医学状况相关联的此类序列含量或表达变化。在一些情况下,所述胎儿例如由于家族史或环境风险(即,辐射)或高龄妊娠而处于特定医学状况的风险中,虽然所述胎儿可以为了常规目的而需要进行测试。在希望从胎儿中知晓特定序列含量或表达水平的此类情况下,取包含一个或多个胎儿细胞的样品。所述样品可以为来自胎儿的活组织检查物,虽然在特别的情况下,所述样品可以为羊水或母血或处于发育早期阶段的胚胎。
在本公开内容的一个方面,获得来自怀孕母亲的羊水并且从其中分离一个或多个胎儿细胞。所述胎儿细胞分离可以通过本领域中的常规方法来发生,例如通过利用在胎儿细胞表面上的标志物来区别胎儿细胞与母亲细胞。在母体循环中可以存在三种类型的胎儿细胞:滋养层细胞、白细胞和胎儿红细胞(具核红细胞)。在某些实施方案中,最有前景的用于富集的细胞为胎儿红细胞,其可以通过大小柱选择和随后的CD71-抗体染色或ε-珠蛋白链免疫分型和然后基于荧光强度的扫描或分选来鉴定。
一旦分离出了胎儿细胞,就可以从其中提取核酸,例如通过本领域中的常规方法。使来自所述胎儿细胞的核酸经历本公开内容的方法以产生覆盖至少部分、大部分或全部RNA(例如,所述胎儿细胞的转录物组)的经扩增的cDNA。在扩增后,可以进一步扩增所述扩增子的一个或多个序列并且也可以对其进行测序(至少部分地)或者可以使其经历微阵列技术。在特别的实施方案中,例如,对SNV进行检定,并且在确定相应的胎儿是否具有特定医学状况或易于具有特定医学状况中使用所述检定的结果。在特别的情况下,例如,所述胎儿可以就所述医学状况进行治疗或者可以经历防止或延迟所述医学状况开始的方法,并且这可以在子宫内和/或在出生后发生。
虽然所述胎儿样品可以就SNV的存在来进行检定,但是在特别的实施方案中,所述胎儿样品就与任何特定医学状况相关联的基因突变来进行检定。可以进行检定的与出生前医学状况相关联的基因的例子包括下列各项中的一个或多个:ACAD8、ACADSB、ACSF3、C7或f10、IFITM5、MTR、CYP11B1、CYP17A1、GNMT、HPD、TAT、AHCY、AGA、PLOD2、ATP5A1、C12或f65、MARS2、MRPL40、MTFMT、SERPINF1、FARS2、ALPL、TYROBP、GFM1、ACAT1、TFB1M、MRRF、MRPS2、MRPS22、MRPL44、MRPS18A、NARS2、HARS2、SARS2、AARS2、KARS、PLOD3、FBN1、FKBP10、RPGRIP1、RPGR、DFNB31、GPR98、PCDH15、USH1C、CERKL、CDHR1、LCA5、PROM1、TTC8、MFRP、ABHD12CEP290、C8或f37、LEMD3、AIPL1、GUCY2D、CTSK、RP2、IMPG2、PDE6B、RBP3、PRCD、RLBP1、RGR、SAG、FLVCR1、ZNF513、MAK、NDUFB6、TMLHE、ALDOA、PGM1、ENO3、LARS2、ATP7A、ATP7B、TNFRSF11B、LMBRD1、MTRR、FAM123B、FAM20C、ANKH、TGFB1、SOST、TNFRSF11A、CA2、OSTM1、CLCN7、PPIB、TCIRG1、SLC39A13.COL1A2、TNFSF11、SLC34A1、NDUFAF5、FOXRED1、NDUFA2、NDUFA8、NDUFA10、NDUFA11、NDUFA13、NDUFAF3、SP7、NDUFS1、NDUFV3、NUBPL、TTC19、UQCRB、UQCRQ、COX4I1、COX4I2、COX7A1、TACO1、COL3A1、SLC9A3R1、CA4、FSCN2、BCKDHA、GUCA1B、KLHL7、IMPDH1、PRPF6、PRPF31、PRPF8、PRPF3、ROM1、SNRNP200、RP9、APRT、RD3、LRAT、TULP1、CRB1、SPATA7、USH1G、ACACB、BCKDHB、ACACA、TOPORS、PRKCG、NRL、NR2E3、RP1、RHO、BEST1、SEMA4A、RPE65、PRPH2、CNGB1、CNGA1、CRX、RDH12、C2或f71、DHDDS、EYS、IDH3B、MERTK、PDE6A、FAM161A、PDE6G、TYMP(ECGF1)、POLG(POLG1、POLGA)、TK2、DGUOK(dGK)、SURF1、SCO2(SCO1L)、SCO1、COX10、BCS1L、ACADM、HADHA、ALDOB、G6PC(GSD1a)、PAH(PH)、OTC、GAMT、SLC6A8、SLC25A13、CPT2、PDHA1、SLC25A4(ANT1)、C10或f2(TWINKLE)、SDHA、SLC25A15、LRPPRC、GALT、PMM2、ATPAF2(ATP12)、GALE、LPIN1、ATP5E、B4GALT7、ATP8B1(ATPIC、PFIC)、ABCB11(ABC16、PFIC-2、PGY4)、ABCB4(GBD1、MDR2、PFIC-3)、MPV17(SYM1)、TIMM8A(DDP、MTS)、CPS1、NAGS、ACADVL、SLC22A5(OCTN2)、CPT1A(CPT1-L、L-CPT1)、CPT1B、SUCLA2、POLG2(HP55、MTPOLB)、ACADL、SUCLG1、MCEE、GAA、PDSS1(COQ1、TPT)、PDSS2(bA59I9.3)、COQ2(CL640、FLJ26072)、RRM2B(p53R2)、ARG1、SLC25A20(CACT)、MMACHC(cblC)、FAH、MPI、GATM、OPA1、TFAM、TOMM20(MAS20P、TOM20)、NDUFAF4(HRPAP20、C6或f66)、NDUFA1(CI-MWFE、MWFE)、SLC25A3(PHC)、BTD、OPA3(FLJ22187、MGA3)、GYS2、NDUFAF2(B17.2L、MMTN)、HLCS(HCS)、COX15、FASTKD2、NDUFS4、NDUFS6、NDUFS3、MMAA(cblA)、MUT、NDUFV1、MOCS1、NDUFS7(PSST)、TAZ(BTHS、G4.5、XAP-2)、MOCS2、COX6B1(COXG)、HADHB、MCCC1(MCCA)、MCCC2(MCCB)、TSFM(EF-TS、EF-Tsmt)、PUS1、ISCU、AGL、SDHAF1、IVD、GCDH、ADSL、DARS2、RARS2、TMEM70、ETHE1、PC、JAG1、MRPS16、PCCA、PCCB、COQ9、LDHA、PYGL、GALK1、PYGM、PGAM2、TUFM、TRMU、PFKM、GBE1、SLC37A4、GYS1、ETFDH、NDUFS8、CABC1(ADCK3)、ETFA、ETFB、DBT、SLC25A19、MMADHC、PDP1、PDHB、ACAD9、AUH、DLAT、PDHX、ACADS、NDUFS2、FBP1、NDUFAF1(CIA30、CGI65)、YARS2、SUCLG2、TCN2、CBS、PHKB、PHKG2、PHKA1、PHKA2、LIPA、ASL、HPRT1、OCRL、PNP、TSHR、ADA、ARSB、ALDH5A1、PNP、AMT、DECR1、HSD17B10、IYD、IL2RG、MGME1、HMGCL、IQCB1、OTX2、KCNJ13、CABP4、NMNAT1、ALG2、DOLK、ABCD4、ALDH4A1、ALG1、GPR143、UBE3A、ARX、GJB2(CX26、NSRD1)、APC、HTT、IKBKG(NEMO)、DMPK、PTPN11、MECP2、MECP2、RECQL4、ATXN1、ATXN10、RMRP、CDKL5、PLP1、GLA、DMD、RUNX2、PLP1、CHD7、ASS1、AIRE、EIF2B、LDLR、HPRT1、RPS19、LMX1B、COL10A1、CRTAP、LEPRE1、PORCN、ASL、CFTR、ARSA、IDUA、IDS、MYO7A、GLANS、GALC、KRAS、SOS1、RAF1、AR、PTEN、BLM、SLC9A6、HRAS、GJC2(GJA12)、NPC1、NPC2、FMR1、FMR1、PLOD1、COL2A1、COL5A1、COL5A2、ABCA4、FOXG1、TINF2、USH2A、CDH23、CLRN1、CREBBP、ABCA4、POU3F4、NRAS、CHRNA7、FOXF1、MEF2C、DHCR7、RAI1、VHL、TYR(OCAIA)、OCA2(BEY、BEY1、BEY2、EYCL)、TYRP1(b-PROTEIN、CATB、GP75、SLC45A2(AIM-1)、PCDH19、SHOC2、BRAF、MAP2K1、MAP2K2、HEXA、STXBP1、ALDH7A1、SLC2A1、WDR62、MAGEL2、SDHB和FH。
IV.本公开内容的样品处理和来自亚细胞材料的核酸
可以通过任何合适的手段来获得一个或多个来自正用本公开内容的方法进行测试的个体的包含亚细胞材料的样品。在某些实施方案中可以在用于提取核酸的步骤之前处理所述样品。所述样品可以在提取核酸之时是新鲜的,或者所述样品在提取核酸之时已经经历固定或其他处理技术。
所述样品可以是任何类型的。在其中目的细胞材料被包含在样品中的实施方案中,可以基于所希望的细胞或亚细胞结构的独特特征,例如在细胞表面上表达的或者与亚细胞结构相关联的蛋白质,来分离所述亚细胞材料。在其中基于细胞标志物来分离胎儿细胞的实施方案中,所述细胞标志物可以为CD71或ε-珠蛋白链等。在其中基于癌症标志物来分离癌细胞的实施方案中,所述细胞标志物可以为ER/PR、EGFR、KRAS、BRAF、PDFGR、UGT1A1、EphA2、HER2、GD2、磷脂酰肌醇蛋白聚糖-3、5T4、8H9、αvβ6整联蛋白、B细胞成熟抗原(BCMA)B7-H3、B7-H6、CAIX、CA9、CD19、CD20、CD22、κ轻链、CD30、CD33、CD38、CD44、CD44v6、CD44v7/8、CD70、CD123、CD138、CD171、CS1、CEA、CSPG4、EGFR、EGFRvIII、EGP2、EGP40、EPCAM、ERBB3、ERBB4、ErbB3/4、FAP、FAR、FBP、胎儿AchR、叶酸受体α、GD3、HLA-AI、HLA-A2、IL11Ra、IL13Ra2、KDR、λ、Lewis-Y、MCSP、间皮素、Muc1、Muc16、NCAM、NKG2D配体、NY-ESO-1、PRAME、PSCA、PSC1、PSMA、ROR1、Sp17、存活蛋白、TAG72、TEM1、TEM8、癌胚抗原、HMW-MAA、VEGF受体、MAGE-A1、MAGE-A3、MAGE-A4、CT83、SSX2、XIAP、cIAP1、cIAP2、NAIP、Livin等。
分离的亚细胞结构可以通过在具有表面活性剂(即,Trion-X100、tweet-20、NP-40等)、还原剂(即,二硫苏糖醇等)和RNA酶抑制剂(即,RNaseOUT等)的无RNA酶裂解缓冲液中温育细胞来进行裂解。进一步地,可以在所公开的方法中所描述的引物存在下裂解细胞或亚细胞结构。
V.本公开内容的试剂盒
可以将在本文中所描述的或与之相似的组合物中的任一种包含在试剂盒中。在一个非限制性例子中,可以将一种或多种用于在用于扩增核酸的方法中使用的试剂包含在试剂盒中。此类试剂可以包括酶、缓冲液、核苷酸、盐、引物等。在合适的容器工具中提供试剂盒组分。在一些实施方案中,细胞材料(至少包括亚细胞结构)是所希望的类型的并且被提供在所述试剂盒中。
所述试剂盒的一些组分可以要么在水性介质中要么以冻干形式进行包装。所述试剂盒的容器工具通常将会包括至少一个小瓶、试管、烧瓶、瓶子、注射器或其他容器工具,向其中可以放置组分,并且优选地,适当地等分的。当在所述试剂盒中存在多于一种组分时,所述试剂盒通常还将会包含第二个、第三个或其他额外的容器,向其中可以分开地放置所述额外的组分。然而,可以在小瓶中包含组分的各种组合。本发明的试剂盒还将会典型地包括用于紧密密封地包含所述组分以用于商业销售的工具。此类容器可以包括注射或吹制成型的塑料容器,在其中保持所希望的小瓶。
当在一种和/或多种液体溶液中提供所述试剂盒的组分时,所述液体溶液为水性溶液,其中无菌水性溶液是特别有用的。在一些情况下,所述容器工具可以本身是注射器、移液管和/或其他诸如此类的器械,或者可以是用于所希望的反应的具有多个区室的基材。
所述试剂盒的一些组分可以作为经干燥的粉末来提供。当作为干粉末来提供试剂和/或组分时,可以通过添加合适的溶剂来对粉末进行重构。想象到,所述溶剂也可以提供在另一个容器工具中。所述试剂盒还可以包含第二个容器工具,用于包含无菌的可接受的缓冲液和/或其他稀释剂。
在特别的实施方案中,试剂和材料包括用于扩增所希望的序列的引物、核苷酸、合适的缓冲液或缓冲试剂、盐等,并且在一些情况下,所述试剂包括用于分离特定的所希望的细胞的器械或试剂。
在特别的实施方案中,在所述试剂盒中存在一个或多个器械,其适合于从个体中提取一个或多个样品。所述器械可以为注射器、细针、解剖刀等。
实施例
下面的实施例被包括用于证明本发明的优选的实施方案。本领域技术人员应当意识到,在下面的实施例中所公开的技术代表了被发明人发现在本发明的实施中很好地起作用的技术,并且因此可以被认为是对于其实施的优选模式。然而,按照本公开内容,本领域技术人员应当意识到,可以在所公开的特别的实施方案中进行许多变化,并且仍然获得相像或相似的结果,而不背离本发明的精神和范围。
实施例1
一般性实施方案
突触是在复杂的神经回路中介导神经元之间的信号传输的关键性结构,并且它们展示出相当大的形态学和电生理学异质性。迄今为止还不存在有用于剖析在独个突触之中的分子异质性的高通量方法。本公开内容提供了基于小滴的SC和SSS总RNA-seq方法,其允许独个神经突(主要由突触小体组成)的转录物组剖析。单个突触小体的转录物组在本文中被称为突触组。在人和小鼠脑样品的突触组剖析中,在突触小体之中检测到不同的亚聚簇,并且鉴定出了在突触小体亚聚簇和神经元亚型之间的关联。另外,还表征了在突触中发生的局部剪接的图景。将所述突触组剖析进一步扩展至在阿尔茨海默病(AD)小鼠模型中的突触病。结果,发明人发现了通过单核转录物组剖析无法检测的新的AD-相关的突触基因表达变化。总之,结果显示,该平台,在本文中被称为在小滴中的基于多重退火和加尾的定量scRNA-seq(MATQ-Drop),提供了一种高通量单突触小体转录物组剖析工具,其将会推动神经科学中的未来发现。
实施例2
MATQ-Drop的化学
在MATQ-Drop的化学(图1a)中,首先施加3%低聚甲醛(PFA)以固定核。在交联后,使核膜透化,并且进行十个循环的与MALBAC引物的多次退火6,12,其允许与转录物的内部区域的有效杂交(图1a)。结果,除了在转录物的3’末端处从经多腺苷酸化的尾开始启动的逆转录外,逆转录的重大部分也在转录物的内部区域处启动,这保证了有效的总RNA捕获。在逆转录步骤后,洗掉过量的MALBAC引物。然后,对于cDNA分子进行原位多腺嘌呤加尾,这被称为dA-加尾步骤。接下来,洗涤经处理的核,并且将微流体平台用于将单个核与带条形码的dT20水凝胶珠粒一起包囊在小滴中以用于多路第二链合成。遵循在inDrop平台中所描述的操作程序10来制备所述带条形码的dT20水凝胶珠粒。
值得注意的是,不同于在inDrop平台中从珠粒上带条形码的寡聚物的由UV触发的释放,在此发明人引入了酶促释放化学。在该化学中,将脱氧尿苷碱基引入到接近带条形码的寡聚物的5’末端的序列中。在用于第二链合成的小滴反应缓冲液中,包括了USER酶,其可以在脱氧尿苷位点处切割寡聚物。结果,在小滴包囊后,具有细胞条形码的dT20寡聚物从珠粒上有效地释放。接下来,进行RNA消化,随后为热去交联以从核上释放cDNA。然后,带条形码的dT20引物与cDNA分子的polyA尾杂交以启动第二链合成。在第二链合成完成后,打破小滴并且收集水相,随后进行PCR反应以扩增所述文库以用于下一代测序。
为了验证在MATQ-Drop中成功的单细胞加条形码,发明人进行了标准物种混合实验,作为对照。混合相等数目的新鲜人HEK293T和小鼠NIH/3T3细胞,然后裂解成核。用经固定的核,如上面所描述那样来进行MATQ-Drop测定法。在此,使用一小等份的小滴来生成用于技术评价的测序文库。如在图1b中所显示的,鉴定出了162个独特的高品质细胞条形码。基于物种特异性,发明人毫不含糊地将它们分配至81个人293T核、76个小鼠3T3核和5个碰撞事件(图1c)。对于每个经分配的细胞条形码,存在高的UMI的物种特异性,如在图1d中所显示的(99.7%,对于293T核;和99.4%,对于3T3核)。另外,这162个细胞条形码覆盖了89%的所有经独特映射的读段,这确证了极低的交叉条形码污染率。对于通过MATQ-Drop所生成的单细胞总RNA-seq数据,没有显著的UMI膨胀。
相比于基于成熟mRNA的平台例如10X Genomics Chromium而言,MATQ-Drop的主要技术优点是人们可以通过使用映射至内含子区域的读段来有效地检测新生RNA(图1e)。关于基因检测灵敏度,在~70,000个原始读段/单核的平均测序深度下,存在有关于单个293T核的21,192个UMI和6,575个基因,和关于单个3T3核的11,286个UMI和4,220个基因的中值(图1f-g)。如在图1h-i中所显示的,MATQ-Drop的基因检测显著高于其他单核RNA-seq方法8,13的灵敏度。为了进一步扩展关于用组织样品进行细胞图册构建的在MATQ-Drop和10XGenomics Chromium之间的基准比较,还使用小鼠海马样品进行了同等基点比较,如下面所描述的。
人海马和额叶前皮质的突触组剖析检测出突触的亚型
迄今为止,在突触的转录物组剖析中的主要方法基于大块样品14。值得注意的是,使用经显微解剖的神经突来剖析位于大鼠海马样品的特定区域处的突触的转录物组15。在此,通过MATQ-Drop的开发,人们可以剖析独个突触小体的转录物组,这与大块式方法相反。
所述测试使用冷冻的人脑样品。为了从人脑样品中分离突触小体,发明人首先使用Dounce匀浆器磨碎冷冻的脑组织。然后,进行FACS以富集具有小于5μm的尺寸的Hoechst-阴性亚细胞结构(图2a-b)。为了验证突触小体分离操作程序,发明人通过使用Western印迹确证了在Hoechst-阴性亚细胞结构中突触蛋白质突触小泡蛋白和突触蛋白-1的富集(图2c)。另外,使用突触前标志物突触小泡蛋白和突触后标志物PSD95对于Hoechst-阴性颗粒进行免疫染色。使用流式细胞术分析,60.1%的Hoechst-阴性颗粒是突触小泡蛋白阳性的,和38.1%是PSD95-阳性的。接下来,分选出双阳性颗粒(34.6%)并且进行转录物组剖析。当将其转录物组数据与同一样品的总Hoechst-阴性颗粒的转录物组数据相组合时,在Hoechst-阴性颗粒和双阳性颗粒之间存在完全的重叠,这表明Hoechst-阴性颗粒的绝大多数是突触小体和神经元-神经胶质连接。神经元-神经胶质连接被报道表达突触蛋白质16,因此它们富集在突触小泡蛋白和PSD95双阳性群体中。
另一方面,发明人还分选出双阴性颗粒(36.4%)并且进行了转录物组剖析。结果,相应的转录物组具有极低的RNA丰度/颗粒,等价于4%的RNA产率,相比于双阳性群体而言。因此,当剖析所有Hoechst-阴性颗粒的转录物组时,通过RNA丰度截止值有效地过滤出双阴性颗粒并且其不对突触组做出贡献。因此,Hoechst-阴性群体的无偏倚剖析真正地代表了突触小体和神经元-神经胶质连接的转录物组。
在特别的实施方案中,关于进行突触小体的这种快速分离的主要原因是保留RNA数量和品质。相比于快速分离操作程序而言,进行使用分离自标准的基于梯度离心的富集方法(在下面的小鼠海马数据中所描述的)的突触小体的突触组剖析。结果,观察到基因检测的显著降低,这导致突触小体聚类的差的分辨率。
对于两个人海马样品,发明人生成了10,428个单亚细胞结构的转录物组(图2d),并且我们观察到11个相应于不同类型的神经突结构的主要聚簇。样品之间的批次效应是无法检测到的。发明人特别要求海马样品的齿状回区域。在图2e-f中,他们将这些聚簇注释为突触和神经元-神经胶质连接的亚型,基于众所周知的在那些亚细胞结构中富含的分子标志物。总之,分配了6个突触相关的聚簇:四个具有高RNA丰度的突触聚簇(以“HI-突触”表示),一个具有较低RNA丰度的突触聚簇(以“LO-突触”表示)(图2g-h),和另一个包含相对较高的新生转录物的突触聚簇(以“N-突触”表示)(图2k)。
当将所述突触组特性谱与单核转录物组特性谱(下面所描述的)进行比较时,可以将所述四个HI-突触聚簇分别与兴奋性神经元(在CA1、CA3和DG区域中)和抑制性神经元相关联。通过另外的亚聚类分析可以将该抑制性HI-突触聚簇(“突触_In”,在图2d中)进一步分类成三个亚型。当剖析两个人额叶前皮质(PFC)样品的突触组时,观察到相似的HI-突触、LO-突触和N-突触的聚簇。也可以将HI-突触聚类为兴奋性和抑制性亚型。
在不同亚型的突触聚簇之间的差别基因表达
接下来,进行差别表达基因(DEG)分析以鉴定关于海马突触组(图2i)和PFC突触组的在HI-突触和LO-突触之间的转录物组差异。发明人分别在海马和PFC中鉴定出了1,272个和807个HI-突触富含的基因(abs(log2FC)>log21.3,FDR<0.05),两者都包括充分建立的突触囊泡基因(SYT1、SYP、SV2A和SORT1)17。接下来,分别在海马和PFC中鉴定出了1,179个和855个LO-突触富含的基因。在LO-突触中的所富含的基因之中,注意到树突标志物基因MAP218,众所周知的突触后支架基因SHANK1、SHANK3和DLG419,以及突触后基因SYT320。差别标志物基因显示出在HI-突触中突触前转录物组特征的富集和在LO-突触中突触后转录物组特征的富集。在HI-突触聚簇的所富集的功能和途径中,在海马(图2j)和PFC中都存在突触信号传导和轴突发生。对于LO-突触聚簇,富集了蛋白质合成和mRNA分解代谢相关途径(图2j),这暗示在突触后中存在高的蛋白质合成活性和周转率。
有趣的是,虽然绝大多数的突触展示出低的内含子份额(平均7.85%),但是一个聚簇(N-突触)展现出显著更高的内含子份额(平均30.79%,图2k)。通过在N-突触和其余突触之间的DEG分析(图2l),在N-突触中富含的基因在突触装配和突触组构基因集中占比过多(图2m)。相反,在突触信号传导中所牵涉的基因在其他突触聚簇中占比过多(图2m)。结果表明,N-突触代表了处于装配和成熟过程中的未成熟突触。在N-突触中的显著更高百分比的内含子读段也支持未剪接的新生RNA和相关的局部剪接在突触装配和成熟过程中的重要作用。
人海马和额叶前皮质的突触组剖析检测出神经元-神经胶质连接
除了突触小体的聚簇外,在神经元和神经胶质细胞之间还形成两种主要的细胞间连接:神经元-少突胶质细胞连接(ODC连接),和神经元-星形胶质细胞连接(ASC连接),在海马(图2d)和PFC中。非致密髓鞘质基因CNP以及致密髓鞘质基因PLP1和MBP均在ODC连接中高表达(图2n)。值得注意的是,在ODC连接中的上调的基因在髓鞘化过程中富集(图2p),这与众所周知的与髓鞘化过程相关的轴突-ODC信号传导21,22相一致。更重要的是,在所述数据中在ODC连接中的转录物的检测暗示了在髓鞘化期间在ODC处的局部翻译的重要性。局部翻译的这一指示也与Wake等人的近期研究23相一致。
在ASC连接中,存在ASC-特异性基因(例如,GFAP、ATP1A2、AQP4和SLC1A3)的局部富集(图2o)。这些上调的基因在细胞粘附、增殖和神经递质摄取途径中富集(图2p)。与在ASC连接中富含的转录物的观察结果相一致,最近也在星形胶质细胞外周过程中观察到局部翻译24。总之,神经元-神经胶质连接的转录物组剖析允许在神经元和神经胶质细胞之间的细胞间连接中的局部翻译的基因的全面鉴定。这些基因的功能作用值得未来研究。
使用新生RNA来有效构建关于人海马和额叶前皮质的细胞图册
为了鉴定在不同亚型的突触小体和不同亚型的神经元之间的联系,接下来,发明人应用MATQ-Drop来对于分离自两个经解剖的冷冻人海马的8,112个单核剖析基于总RNA的转录物组。首先,在单核转录物组数据中,在脑样品中代表新生RNA的读段部分比在细胞系样品中的那种显著更高(图3a)。发明人观察到,在脑样品中78%的UMI被映射至内含子区域(图3a),这与在细胞系中63%的内含子读段(图1e)形成对比。接下来,计算基因表达矩阵,其仅基于具有映射至内含子区域的读段的未剪接的转录物序列,这不同于通常使用的具有映射至外显子区域的读段的经剪接的转录物。
使用基于新生RNA的基因表达矩阵,评价其在构建发明人所剖析的关于人海马样品的细胞图册中的表现。在此使用标准的Seurat基于k-最近邻图的无监督聚类25。在图3b中在海马核中鉴定了下列10个主要聚簇:分别来自阿蒙角区域(ExCA)和齿状回(ExDG)的2个兴奋性神经元亚型;3个抑制性神经元亚型(In_A、ln_B、ln_C);4个神经胶质细胞类型,包括两个亚型的星形胶质细胞(ASC1-2)、少突胶质细胞前体细胞(OPC)、少突胶质细胞(ODC)和小神经胶质(MG)。未观察到批次间变化。关于检测灵敏度,在图3c-d中显示了UMI和基因检测。每个聚簇的标志物也与充分建立的细胞类型特异性标志物一致(图3e-f),这暗示了使用基于新生转录物的基因表达矩阵的稳固的细胞分型。
与海马相似,对于相同个体的人PFC样品构建细胞图册。通过剖析939个单核,以高置信度鉴定了15个主要聚簇,其包括6个兴奋性神经元亚型(Ex1-6)、4个抑制性神经元亚型(In1-4)、4个神经胶质细胞类型(包括星形胶质细胞(ASC)、少突胶质细胞前体细胞(OPC)、少突胶质细胞(ODC)和小神经胶质(MG))和内皮细胞(END)。每个聚簇的标志物也与标准的细胞类型特异性标志物相一致。基于以前报道的层特异性标志物的表达26,将所述六个兴奋性神经元亚型分配至不同的皮质层。在来自这两个区域的抑制性神经元之中,我们用另外的亚聚类分析鉴定出了8个亚型。在抑制性神经元的亚型中检测到标志物基因的独特组合。
在人样品中在突触和相关联的核之间的差别表达基因分析
现在用来自突触组的相同组织的单核转录物组数据,发明人能够基于共享的标志物基因将在突触组中的亚聚簇与不同的神经元核类型相联系(图2d)。可以将三个HI-突触聚簇与在海马CA1、CA3和DG区域中的兴奋性神经元相联系,并且可以将另一个HI-突触聚簇与抑制性神经元相联系(图2d)。接下来,在突触聚簇和相关联的核之间调查了RNA表达的差别样式。考虑到在突触中成熟的mRNA的优势,在此发明人使用基于外显子的基因表达矩阵以用于在突触和核之间的DEG分析。
总之,鉴定出了平均2,126个突触富含的基因和2,548个核富含的基因(图3g-j)。在图3k-l中,检查了在不同神经元亚型之间重叠的基因。存在有总共4,099个突触富含的基因和总共4,848个核富含的基因。549个突触富含的基因和755个核富含的基因分别由所有四个神经元亚型所共享(图3k-l)。接下来,在功能分析中,所述549个共享的突触富含的基因在与突触信号传导直接相关的途径中占比过多(图3m)。相反,所述755个核富含的基因在表观遗传学调控和RNA加工途径中占比过多(图3m)。
在不同亚型的突触小体中的局部剪接图景
研究已显示,具有保留的内含子的基因对于转录物的神经元内转运来说是关键性的27。进一步地,突触可变剪接对于突触功能的快速调节来说也是至关重要的28-31。接下来,基于在MATQ-Drop数据中的新生RNA检测,对于不同的突触聚簇表征了内含子保留。因此,人们可以确定突触剪接样式跨越不同的突触聚簇是否是相同的。对于在HI-突触中的所有四个聚簇,都观察到具有内含子保留的清楚证据的离群值的长尾(图3n)。值得注意的是,84.5%的突触转录物是已经经剪接的(内含子百分比<5%)。接下来,对于每个基因在突触和核之间比较内含子百分比并且基于其剪接Z得分来进行分级(图3o)。然后,发明人用通过剪接Z得分进行预分级的基因进行了GSEA。基本细胞功能例如翻译、蛋白质折叠和代谢在经完全剪接的基因中显著富集(图3r)。该结果确证,在突触中检测到的经完全剪接的基因主要负责基础细胞功能。基于剪接Z得分,鉴定出了具有统计学显著性的未剪接的基因,并且总共检测到256个来自不同HI-突触亚型的基因,包括49个lncRNA、11个假基因和196个蛋白质编码基因(图3p)。有趣的是,所有4个突触亚聚簇共享仅41个未剪接的蛋白质编码基因(图3q)。这个结果表明,重大部分的局部突触剪接独特地与特定的突触类型相关联。
新鲜制备的小鼠海马的突触组剖析
人脑样品常常具有长的死后间隔(对于我们测序的两个脑样品,分别为12和13小时),这可以导致转录物的衰变并且扭曲突触聚簇。为了避免这种潜在的样品偏差,接下来发明人应用MATQ-Drop来对于新鲜制备的小鼠脑样品剖析突触组和单核转录物组。剖析了小鼠海马的突触组,并且使用用于人样品的相同的无监督聚类管线来进行分析。有趣的是,鉴定出了15个主要聚簇,其中12个聚簇是突触相关的(图4a-b)。相反,在人海马样品中仅观察到6个突触相关的聚簇。对于该观察结果的潜在原因是,小鼠脑样品是在处死小鼠后立即新鲜制备的。因此,在小鼠样品中突触状态可能被更好地得到保存。
在所述12个突触相关的聚簇之中,Syn1聚簇相比于其余的突触而言展现出新生RNA比例的3.5倍增加(平均内含子份额29.9%比8.5%,图4c),因此该聚簇可能是人N-突触的小鼠对应物。在Syn2和Syn4聚簇中,发明人观察到Grin2b、Pclo和Bsn(Pclo和Bsn是已知的突触前支架基因)的上调,与在人HI-突触中观察到的富含的基因相似。相反,在Syn3聚簇中,存在突触后基因的上调,包括Shank1和Shank3,与在人LO-突触中观察到的富含的基因相似(图4c和2d)。
除了在Syn2和Syn4聚簇中突触前特征占比过多和在Syn3聚簇中突触后特征占比过多外,还观察到通过特异性标志物所定义的另外的突触亚聚簇:Syn5:Zbtb20,Syn6:Chd9,Syn7:Purg,Syn8:Nopchap1,Syn9:Apc,Syn10:Hivep3,Syn11:Kmt2d,Syn12:Ksr2(图4a-b)。在其标志物基因之中,在Zbtb20中的突变已显示出通过改变在亚神经元区室中ZBTB20蛋白定位来影响突触结构32;Purg(在Syn7中检测到)被报道在原代小鼠海马神经元中的突触发生期间展示出强且早期的上调33;Ksr2(在Syn12中检测到)有贡献于由钙介导的ERK信号传导34。除了突触相关的聚簇外,还观察到轴突起始段和郎维耶结(AIS/NR聚簇),以及神经元-神经胶质连接,包括ODC连接和ASC连接(图4a-b)。
与在人脑中检测到的在HI-突触与LO-突触之间的RNA丰度的明显差异相反,我们在小鼠脑中未观察到这样的迥异。在一个实施方案中,它由在人和小鼠之间的物种差异引起,或者由在突触前和突触后之间的不同的RNA衰变速率引起。如果突触后具有比突触前高得多的RNA衰变速率,那么由于关于所使用的人样品的长的死后间隔,在它们可以被MATQ-Drop捕获之前,重大部分的在突触后中的RNA可能已经衰变了。
使用通过基于密度梯度的方法而富集的突触小体的小鼠海马突触组
接下来,发明人使用新鲜制备的小鼠样品作为对照以比较不同的突触小体分离操作程序对于突触组剖析的影响。突触组剖析通过使用从标准的基于蔗糖密度梯度的超离心实验方案分离的突触小体来进行。相比于基于直接分选的操作程序而言,发明人观察到53%更少的检测到的基因/突触小体(中值,146个基因对306个基因),这可能归因于在没有PFA固定的情况下在大的加工时间期间的RNA衰变和泄漏。虽然对于几个聚簇(包括Syn1(Kcnip4)、Syn6(Chd9)和Syn8(Nopchap1))存在有区域分布的一些证据,但是整体聚类结果具有低的分辨率,有着某些含糊不清。
将突触聚簇与神经元亚型相联系
为了比较突触组与核转录物组,接下来发明人对于相同的小鼠海马进行单核转录物组剖析。基于新生RNA表达矩阵,鉴定出了来自不同亚区域的9个亚型的兴奋性神经元、2个亚型的抑制性神经元、星形胶质细胞、少突胶质细胞祖细胞、少突胶质细胞、小神经胶质和成纤维细胞(图4d),并且可以将平均83%的检测到的UMI归因于内含子。
与对于人样品所做的相似,接下来发明人比较单核转录物组与突触组以鉴定在突触聚簇和神经元亚型之间的联系。有趣的是,未鉴定出在统计学上显著的联系。该结果支持发明人用从新鲜小鼠脑样品制备的突触小体捕获了不同的突触状态。人们可以调查在不同的突触状态(突触聚簇)之中是否可以鉴定出与神经元亚型相关联的亚聚簇。为了这样做,人们可以使用跨越神经元核高度可变的基因作为关于监督聚类分析的坐标。观察到在突触小体的分布和不同的神经元亚型之间的明显关联。然而,亚聚簇较少被分离,可能因为它们共享相同突触状态的特征。基于小鼠突触组数据,存在两层的突触异质性:第一层与突触状态相关联,和第二层与神经元亚型相关联。
在突触和相关联的核之间的差别表达基因分析和在小鼠海马中的局部剪接图景
接下来,发明人进行在突触和核之间的DEG分析,并且鉴定出了3,609个突触富含的基因和3,992个核富含的基因(图4e)。与在人样品中的观察结果相一致,关于突触信号传导和蛋白质合成途径,突触富含的基因占比过多。相反,关于基因调控、RNA加工和DNA修复途径,核富含的基因占比过多(图4f)。
对于突触转录物剪接样式,进行与人突触组相同的内含子保留分析,并且仅观察到小百分比的未剪接的突触转录物(2015中的81,4%),包括79个蛋白质编码基因和2个lncRNA(图4g-i)。当发明人对于通过剪接Z得分进行预分级的基因进行GSEA时,在富集的一端,对于基础细胞活性例如蛋白质合成和代谢富集了经剪接的转录物;在富集的另一端,对于突触装配、组构和神经元迁移途径富集了未剪接的转录物,这暗示了局部剪接在突触发生中的重要作用(图4j)。
通过突触组剖析来在阿尔茨海默病(AD)中表征突触病
作为AD的标志特点,还已知β-淀粉样斑块损害突触功能并且诱导突触病。已显示β-淀粉样斑块可以诱导炎症反应,其激活小神经胶质去修剪突触35,36并且阻断突触后NMDA受体并因此抑制跨突触信号传导37。目前的与AD相关联的转录物组变化的剖析仅用单核RNA-seq来进行38,39。在此为了表征在AD中的突触组变化和检查不同的突触亚型是否具有不同的对于β-淀粉样斑块的应答,发明人剖析了分离自两只野生型和两只5xFAD小鼠的6,989个单核和20,456个单Hoechst-阴性颗粒的转录物组。
从单核转录物组数据中,在细胞类型组成方面,存在相比于WT而言少突胶质细胞的2.3-倍占比过多。该结果可能归因于对于轴突脱髓鞘作用的应答(图5a)。在5xFAD小鼠中存在主要小神经胶质亚型(MG1)的5.4-倍增加,这表明经激活的炎症反应(图5a)。这些变化与以前的研究相一致38,39。接下来,对于每个神经元亚型和神经胶质细胞类型,发明人分别基于新生RNA(图5c)和成熟RNA鉴定了与AD相关联的DEG。特别地,小神经胶质始终展示出最高的DEG数目,这暗示相比于其他细胞类型而言这些细胞在疾病应答中的更灵敏的作用(图5c),这也是与以前的研究相一致的40。当发明人应用GSEA时,跨越各种细胞类型在AD中富集了髓鞘化和多种炎症反应途径,包括细胞杀伤、补体激活和趋化因子产生(图5b)。值得强调的是,虽然对于不同的细胞类型在GSEA中富集了相似的途径(图5b),但是对于不同的细胞类型DEG不是相同的,这暗示在不同的细胞类型之中存在不同的对于淀粉样病理学状况的应答机制。
接下来,在海马突触组中鉴定在5xFAD和野生型小鼠之间的突触和神经元-神经胶质连接的每个聚簇的DEG(图5d)。总之,在不同聚簇之中鉴定出了410个具有显著DEG(abs(log2FC)>log21.3,FDR<0.05)的基因,其中42个基因被超过一半的突触聚簇共享,并且246个基因是对于单个聚簇来说独特的(图5d)。与单核结果相符,神经炎症反应、补体激活和髓鞘化途径在AD突触小体中显著富集(图5e),这表明与β-淀粉样斑块相关联的一般性炎症应激。另外,发明人还观察到细胞连接解装配和胞吐作用负调节途径的富集,这表明了突触损失和降低的突触功能。
对于42个被所有突触亚型所共享的AD DEG,在图5f中绘制了在核中的相应的基因表达变化(基于新生RNA的DEG,顶部:核,底部:突触)。值得注意的是,从核转录物组数据中无法检测出24个突触AD DEG。进一步地,8个基因展现出与基于核转录物组数据的DEG变化相反的失调方向。有趣的是,三种补体组分,C1qa、C1qb和C1qc,在突触中都显著上调但是在核中不显著,这表明了这些组分的局部翻译在由补体介导的突触修剪中的潜在作用。希望的是揭示这些补体组分转录物如何被转运至需要修剪的异常突触。存在有两个钙/钙调蛋白依赖性蛋白激酶II(CaMKII)基因即Camk2a和Camk2d(图5f,经红色标记的基因)的分叉表达,这暗示了在AD中CaMKII同种型的转换,其潜在地影响突触可塑性41
使用仅lncRNA种类来有效地构建细胞图册
不同于基于成熟RNA的小滴平台,MATQ-Drop的基于总RNA的化学允许长链非编码RNA(lncRNA)的有效检测。接下来,检查人们是否可以通过仅使用lncRNA表达矩阵来成功地鉴定细胞类型。仅使用lncRNA种类的细胞图册的成功构建将会表明,存在细胞类型特异性lncRNA种类或lncRNA种类的细胞类型特异性组成。如在图6a中所显示的,通过无监督聚类稳固地构建了关于人海马的细胞图册。所述聚类结果也与基于新生转录物的聚类相一致。还成功地构建了人PFC的基于lncRNA的细胞图册。通过MATQ-Drop可以***地鉴定细胞类型特异性lncRNA标志物(图6b-c)。
对于小鼠海马,仅使用lncRNA种类构建了细胞图册(图6d)。所述聚类结果在基于lncRNA和基于新生RNA的聚类之间高度一致(图3b)。结果,***地鉴定了细胞类型特异性lncRNA标志物(图6e)。值得注意的是,具有经多腺苷酸化的尾的lncRNA也可以在Fluidigm平台上通过使用SMARTer化学来检测42。然而,MATQ-Drop化学允许检测lncRNA的完全谱(包括具有经多腺苷酸化的尾的那些和没有经多腺苷酸化的尾的那些)。进一步地,在鉴定细胞类型特异性lncRNA种类中所述小滴平台提供比Fluidigm平台更高的通量。
基于小鼠海马的单核转录物组剖析的在MATQ-drop和10XChromium平台之间的基准比较
接下来,用小鼠海马的基于MATQ-Drop的单核转录物组数据和最近的在10XChromium平台上生成的小鼠海马单核转录物组数据39,发明人进行了在MATQ-drop和10XChromium平台之间的同等基点基准比较。当基于转录物进行计数时,MATQ-Drop检测到下述中值:对于单个神经元核的16,593个UMI和4,186个基因,和对于神经胶质核的9,525个UMI和3,043个基因。两者都显著高于10XChromium数据(中值为对于单个神经元核的1,390个UMI和886个基因,或对于单个神经胶质核的1,142个UMI和779个基因,图6f-g)。甚至当使用基于外显子的基因表达矩阵来与10X Chromium进行比较时,存在UMI检测的2.4-3.6倍增加,和基因检测的2.5-3.7倍增加(MATQ-Drop中值:神经元核2,670个UMI和1,640个基因,神经胶质核1,615个UMI和1,059个基因;10X Chromium中值:神经元核738个UMI和449个基因,神经胶质核673个UMI和424个基因,图6h-i)。
在lncRNA的检测中,在检测到的UMI数目方面,10X平台的灵敏度仅稍微低于MATQ-Drop(图6j)。然而,当发明人详细检查10XChromium数据时,单个lncRNA基因,Malat1,贡献了总UMI计数的70%(图6k)。该偏倚的检测可能是由于在该基因中的很大部分的富AT序列,因此允许比其他基因更有效的通过oligo(dT)引物的内部杂交。相反,在MATQ-Drop中未观察到由一个基因产生的重大贡献。总之,在lncRNA基因检测方面,MATQ-Drop显示出相对于10X平台的2.1-2.6倍改善(MATQ-Drop中值:神经元核119个基因,神经胶质核83个基因;10XChromium中值:神经元核46个基因,神经胶质核40个基因,图6l)。在MATQ-Drop中lncRNA的该无偏倚的检测对于如在上面所描述的那样仅使用lncRNA种类进行成功的细胞分型来说也是至关重要的。
某些实施方案的重要意义
在MATQ-Drop的化学和灵敏度的支持下,首次以高通量剖析了独个突触的转录物组。成功地检测到了不同亚型的突触小体和在神经元和非神经元细胞之间的其他类型的连接。还观察到了在突触小体亚型之间不同功能途径的富集,这支持了在不同突触小体之间表型异质性的存在。可以将不同的突触小体亚型与不同类型的神经元相联系。除了突触组剖析外,MATQ-Drop还可以用于构建细胞图册。更重要地,显示出人们可以仅使用lncRNA种类来成功地构建细胞图册。总之,MATQ-Drop平台允许突触异质性的有效表征和大规模细胞图册构建。在未来,MATQ-Drop可以容易地应用于其他神经学疾病和神经变性疾病,并且为理解突触生物学提供了新的见解。它也可以用作新工具以构建脑连接组(connectome)。
实施例2
材料和方法的例子
微流体装置设计和制造
以前描述了水凝胶珠粒生成装置和细胞包囊装置的设计和制造43
带条形码的珠粒合成
水凝胶珠粒产生和条形码合成操作程序基于Zilionis等人的工作43。在水凝胶珠粒产生中引入两个修改。首先,经acrydite修饰的寡核苷酸被设计成包含脱氧尿苷碱基,代替光可裂解部分。因此,所述引物可以通过USER酶(NEB)而不是UV暴露来释放。消除了阶梯式昏暗光照(step dim illumination)。第二,将经acrydite修饰的DNA引物的浓度降低至在丙烯酰胺-引物混合物中的40μM。
在水凝胶珠粒产生后,进行两轮的分开-和-汇集以进行条形码合成。在每一轮中,将水凝胶珠粒分开到144个孔中;每个孔包含具有独特条形码的引物作为模板。将Bst2.0warm-start DNA聚合酶用于条形码延伸。将反应设定为对于第一轮的分开-和-汇聚在55℃下3小时,和对于第二轮在52℃下3小时。在每一个延伸步骤后,用1.5个体积的25mMEDTA猝灭该反应,并且按照实验方案将剩余的模板寡核苷酸通过碱来进行变性并且洗掉。进行核酸外切酶I消化以去除具有失败的条形码延伸的引物。
细胞培养
使HEK293T和NIH/3T3细胞在具有10%胎牛血清(FBS,Gibco)的DMEM/高葡萄糖培养基(Gibco)中进行生长。每2-3天对细胞培养物进行传代。
小鼠
从Jackson实验室(Bar Harbor,ME)获得C57BL/6WT和5xFAD小鼠。将小鼠以每笼四只安置在无病原体的小鼠设备中,可随意获取食物和水,在12-小时光照/黑暗循环下。将雌性小鼠用于所有实验。所有操作程序都遵循国立卫生研究所(National Institutes ofHealth;NIH)指导方针和贝勒医学院实验动物管理和使用委员会(Baylor College ofMedicine Institutional Animal Care and Use Committee)的批准来进行。
小鼠海马解剖
用***(300mg/kg)-赛拉嗪(30mg/kg)溶液以腹膜内(i.p)方式深度麻醉大约9月龄小鼠,并且用盐水进行灌注。从颅骨中取出脑,并且将成年小鼠脑半球分成两半;从每个半球中分离出海马并且立即在液氮中冷冻。
细胞系核制备
将细胞进行胰蛋白酶处理并且用磷酸盐缓冲盐水(PBS)洗涤两次。混合相等数目的HEK293T细胞和NIH/3T3细胞,然后通过与冰冷的裂解缓冲液(10mM Tris-HCl,pH7.5,10mM NaCl,3mM MgCl2,0.1% NP-40,0.1% Tween-20)一起在冰上温育5分钟来将其裂解为核。在固定之前,将核用洗涤缓冲液(10mM Tris-HCl,pH7.5,10mM NaCl,3mM MgCl2,0.1% Tween-20)洗涤三次。对于每次洗涤,首先将核在4℃下以500g离心3分钟,吸去上清液,并且将核粒状沉淀物重悬浮在洗涤缓冲液中。在第三次洗涤后,我们将核重悬浮在固定缓冲液(10mM Tris-HCl,pH7.5,10mM NaCl,3mM MgCl2,0.2% Tween-20,3% PFA)中并且在端对端旋转器上在室温下温育10分钟以固定核。通过与3/20个体积的2.5M甘氨酸进行混合来猝灭固定。将经固定的核用洗涤缓冲液洗涤两次,然后通过40μm细胞滤过器。
从冷冻的样品制备人脑核
遵循由Krishnaswami等人44所开发的实验方案来从冷冻的脑样品中分离核。简而言之,用0.1% Triton X-100用Dounce匀浆器将组织匀浆,随后为在室温下3% PFA固定10分钟。在猝灭和洗掉残留的PFA后,用Hoechst对匀浆物进行染色。进行荧光激活核分选(FANS)以无偏倚地收集Hoechst-阳性的单核。
从冷冻的样品制备人脑突触小体
用于突触小体制备的方法与核制备相似,但是有两个主要差异:1)在匀浆缓冲液中省去Triton X-100;2)通过FACS分选出具有小于5μm的直径的Hoechst-阴性群体。详细操作程序描述如下。首先,将~2mm3冷冻脑组织切片切碎并且在匀浆缓冲液(250mM蔗糖,25mMKCl,5mM MgCl2,10mM Tris-HCl pH 8.0,1μM DTT,1X Halt蛋白酶抑制剂混合物(ThermoFisher),0.2U/μl RNasein核糖核酸酶抑制剂(Promega))中漂洗。然后,将组织转移至Dounce匀浆器(Wheaton),并且通过用松杵的五个冲程和用紧杵的十个冲程来进行匀浆。使匀浆物通过40-μm细胞滤过器并且在4℃下以1,500g离心10分钟。将粒状沉淀物立即重悬浮在内25mL的固定缓冲液(10mM Tris-HCl,pH7.5,10mM NaCl,3mM MgCl2,3% PFA)中并且在室温下温育10分钟。通过与3/20个体积2.5M甘氨酸相混合猝灭固定。将经固定的亚神经元结构用洗涤缓冲液(10mM Tris-HCl,pH7.5,10mM NaCl,3mM MgCl2,0.1% Tween-20)洗涤一次,通过另一个40-μm细胞滤过器,并且用Hoechst进行染色。然后,进行FACS以富集直径小于5μm(使用标准珠粒来进行校准)的Hoechst-阴性突触小体群体。
脑突触小体的免疫染色
将经固定的亚神经元结构在冰上用在PBS中的0.2% Triton X-100透化10分钟,然后通过在4℃下以3,000g离心5分钟来形成粒状沉淀物。非特异性结合的封闭通过将样品与在PBS中的5% BSA一起在室温下旋转温育30分钟来进行。使用下列的一抗来进行免疫染色:兔抗突触小泡蛋白(Invitrogen,MA5-14532,1:60)和小鼠抗-PSD95(Invitrogen,MA1-045,1:400)。一抗结合通过在端对端旋转器上在室温下与在PBS中的0.5% BSA一起温育80分钟来进行。将样品用1mL具有0.5% BSA的PBS洗涤3次。二抗结合通过在端对端旋转器上在室温下与在PBS中的0.5% BSA一起温育40分钟来进行,其中用下列的二抗:山羊抗兔-Alexa Fluor 647(Invitrogen,A21244,1:1667)和山羊抗小鼠-Cy3(Invitrogen,A10521,1:1667)。将亚神经元结构洗涤3次,用Hoechst 33342进行染色,然后进行流式细胞术。
Western印迹
为了从经固定的样品中回收蛋白质,我们将样品重悬浮在固定裂解缓冲液(500mMTris-HCl,pH7.4,2% SDS,25mM EDTA,100mM NaCl,1% Triton X-100,1% NP-40,和1XHalt蛋白酶抑制剂混合物(ThermoFisher))中并且在90℃下加热2小时。通过Biorad DC蛋白质测定法来定量蛋白质浓度,并且加载0.5μg总蛋白质以用于每个Western印迹(使用标准实验方案)。在该研究中使用下列的一抗:突触小泡蛋白(Invitrogen,MA5-14532,1:200)、突触蛋白-I(Cell Signaling Technology,5297,1:1000)、CNPase(Millipore,MAB326R,1:500)、GFAP(Millipore,MAB360,1:1000)和β-肌动蛋白(Sigma-Aldrich,A1978,1:2000)。
透化
对于有效的引物杂交来说需要对经PFA固定的亚细胞结构进行透化。为了透化亚细胞结构,我们用冰冷的具有1% Triton X-100的PBS重悬浮它们并且将它们在冰上温育5分钟。将经透化的亚细胞结构用冰冷的包含0.2% Triton X-100的PBS洗涤两次,然后在进行逆转录之前调整至~2,300个亚细胞结构/μl的浓度。
MATQ-Drop操作程序
原位逆转录
对于~25,000个亚细胞结构,我们制备了下面的原位逆转录混合物:4μl 5X第一链缓冲液(Invitrogen),1μl 0.1M DTT,1μl 1.8%Triton X-100,0.5μl 10mM dNTP,0.5μlRNaseOUT(Invitrogen),2μl 11.5μM MALBAC引物混合物,1μl Superscript III逆转录酶(Invitrogen),和11μl重悬浮在PBS中的经固定的亚细胞结构。进行十个循环的从8℃爬升至50℃的多次退火以进行有效的引物杂交和逆转录。
原位polyA加尾
首先洗掉残留的引物和任何引物二聚体,并且将亚细胞结构重悬浮在14.5μl具有0.2% Triton X-100的PBS中。接下来,随后向亚细胞结构悬浮液添加1μl 1mM dATP(混合有3μM ddATP)、2μl 10X末端转移酶缓冲液(NEB)、2μl 2.5mM CoCl2和0.5μl末端转移酶(NEB)。将原位polyA加尾反应在37℃下温育4小时并且用1.6μl 0.5M EDTA猝灭。在该反应中,我们掺入了1/333的ddATP以防止polyA尾生长得过长,代价是损失1-(332/333)20=6%的其polyA尾过短(<20)的扩增子来用于有效的第二链合成。
带条形码的第二链合成
洗涤经固定的携带经polyA加尾的cDNA的亚细胞结构。并且,如以前所描述的43,使用微流体平台,将独个亚细胞结构与带条形码的dT20水凝胶珠粒和2X反应混合物一起进行包囊。在小滴包囊后,首先将反应在37℃下温育45分钟以通过USER酶(NEB)从珠粒上释放引物;同时,由于通过RNA酶H(NEB)和RNA酶If(NEB)消化的RNA消化,从RNA模板上释放cDNA。接下来,在72℃下进行3小时温育以使允许cDNA扩散出核。进行十个循环的[48℃2分钟,72℃1分钟]以允许所述带条形码的dT20引物与释放出的cDNA的polyA尾杂交,并且Deep Vent(exo-)DNA聚合酶(NEB)将会起始从所述带条形码的dT20引物开始的延伸并且完成第二链合成。值得注意的是,该操作程序不牵涉解链步骤,因此每个扩增子仅可以被转变为一个双链DNA片段。
加条形码后的清理
在完成带条形码的第二链合成后,通过下述方式来打破小滴乳状液:在EDTA存在下将所述乳状液与1H,1H,2H,2H-全氟-1-辛醇(PFO,Sigma-Aldrich)相混合,EDTA在小滴破裂后立即猝灭聚合酶活性并且因此防止条形码串扰。通过离心来去除在水相中的剩余的水凝胶珠粒,并且将上清液用1X AMPure XP珠粒(Beckman)进行纯化并且洗脱在37.5μl无核水中。
未使用的珠粒引物的ddTTP封闭处理
为了使在扩增步骤中的条形码串扰最小化,关键的是通过ddTTP来猝灭残留的带条形码的珠粒引物。使用下面的ddTTP封闭处理混合物:37.5μl经纯化的产物,0.5μl 10mMddTTP、5μl 10X末端转移酶缓冲液(NEB)、5μl 2.5mM CoCl2和1μl末端转移酶(NEB);并且将其在37℃下温育3小时。所述产物用1X AMPure XP珠粒(Beckman)进行纯化并且洗脱在41μl无核水中。
文库扩增
通过添加5μl 10X ThermoPol缓冲液(NEB)、2.5μl 10μlM GAT27引物(GTG AGTGAT GGT TGA GGA TGT GTG GAG)、1μl 10mM dNTP和0.5μl Deep Vent(exo-)DNA聚合酶(NEB)来进行PCR,以扩增41μl的经纯化的产物。使用下面的PCR程序:95℃2分钟,16-18个循环的[95℃20秒,63℃20秒,72℃2分钟],和72℃3分钟。扩增出的产物用0.9X AMPure XP珠粒(Beckman)进行纯化,并且通过Qubit(Invitrogen)来定量产率。
MATQ-Drop文库的测序
对文库制备物进行测序
对于每个MATQ-Drop文库,将10ng扩增出的产物与5μl标记切割(tagmentation)DNA缓冲液(Illumina)、0.6μl标记切割DNA酶2(TDE2,Illumina)相混合,并且通过添加无核酸酶水将体积带至10μl。将该转座混合物在55℃下温育15分钟。接下来,通过添加0.4μl0.5M EDTA来猝灭该反应,并且通过50℃加热30分钟来释放转座酶。
为了引入i5索引,制备下面的38.25μl的反应混合物并且将其添加至每个管:4μl10X ThermoPol缓冲液(NEB)、2μl 0.1M MgSO4、1μl 10mM dNTP、1.75μl 10μM IlluminaNextera N5XX带索引的引物(AAT GAT ACG GCG ACC ACC GAG ATC TAC AC[i5索引]TCGTCG GCA GCG TC)(SEQ ID NO:1)、1.75μl 10μMMATQ-P700引物(ACG TGT GCT CTT CCG ATCTCG CCG AAG ATG GTT GAG GAT GTG TGG AGA TA)(SEQ ID NO:2)、0.7μlDeep Vent(exo-)DNA聚合酶(NEB)和28.8μl无核酸酶水。将该反应置于热循环仪上,采用下面的程序:65℃1分钟,72℃4分钟,95℃2分钟,7个循环的[95℃20秒,57℃30秒,72℃1分钟],和72℃2分钟。所述产物用0.9X AMPure XP珠粒(Beckman)进行纯化,并且洗脱在16μl无核酸酶水中。
为了引入i7索引,我们制备了下面的PCR反应:16μl经预扩增的产物、2μl 10XThermoPol缓冲液(NEB)、0.5μl 10μM P5-22b引物(AAT GAT ACG GCG ACC ACC GAG A)(SEQID NO:3)、0.5μl 10μM P7-i7-MATQ带索引的引物(CAA GCA GAA GAC GGC ATA CGA GAT[i7索引]GTG ACT GGA GTT CAG ACG TGT GCT CTT CCG ATC T)(SEQ ID NO:4)、0.4μl 10mMdNTP和0.3μlDeep Vent(exo-)DNA聚合酶(NEB)。将该反应置于经预热的热循环仪上,采用下面的程序:95℃2分钟,5个循环的[95℃20秒,61℃20秒,72℃1分钟],和72℃2分钟。所述产物用0.85X AMPure XP珠粒(Beckman)进行纯化,并且洗脱在20μl无核酸酶水中。
测序
将文库汇集并且遵循Illumina手册进行定量,并且用150循环测序试剂盒在Illumina Nextseq 500平台上对所汇集的文库进行测序。遵循Illumina手册使用CustomRead 2引物(CGC CGA AGA TGG TTG AGG ATG TGT GGA GAT A)(SEQ ID NO:5)。测序循环为:Read 1:110个循环;Index 1:6个循环;Index 2:6个循环;Read 2:45个循环;或者Read1:76个循环;Index 1:8个循环;Index 2:8个循环;Read 2:45个循环。
MATQ-Drop原始数据处理
用cutadapt45 v3.1配对读取模式在Read 1上修整cDNA的3’polyA尾,采用下述读段长度过滤标准:--minimum-length=30--pair-filter=any。接下来,使用自定义Python脚本以将Read 2细胞条形码序列分配给预先规定的Barcode1和Barcode2序列的组合,其中对于条形码的每个区段允许最大两个错配。使用Umi_tools46(v1.0.1)“extract”命令来提取具有成功分配的细胞条形码的读段。用STAR47 v2.5.3a将所提取的Read 1映射至hg19基因组(或者hg19和mm10的组合基因组),并且将具有不小于250的映射得分的经独特映射的读段用于下游分析。用合适的Gencode注释gtf文件通过featureCounts48 v2.0.1将经过滤的读段分配至基因,并且所述分配基于具有strandness(-s 2)的转录物特征(-t转录物)。对于具有明确分配的基因特征的读段,使用umi_tools“count”命令来生成基于转录物的数字基因表达矩阵(参数:--per-gene--gene-tag=XT--per-cell-method=directional)。
为了确定代表真实核而非背景串扰的细胞条形码,我们绘制出(UMI计数)对(通过UMI的条形码等级)图,并且将拐点确定为关于真实核的阈值(在图1b中例示)。接下来,使用代表真实细胞的细胞条形码来生成关于真实核的基于转录物的基因表达矩阵。
为了生成基于外显子的基因表达矩阵,发明人首先过滤出具有明确分配的基于转录物的基因特征的读段。然后,发明人用仅外显子特征(-t外显子)和strandness(-s 2)重新运行了featureCounts分配,随后为umi_tools计数。通过从基于转录物的基因表达矩阵中减去基于外显子的基因表达矩阵而得出基于内含子的基因表达矩阵。
聚类分析
数据过滤
排除具有高于5%的线粒体UMI百分比的核以进行下游分析。在突触组数据中,排除具有低于5%的线粒体UMI百分比的突触以进行下游分析。然后,从基因表达矩阵中去除线粒体和核糖体基因。排除具有少于200个内含子基因的低品质核,并且还去除具有在前0.5%分位数中的UMI的核。排除具有少于100个内含子基因的低品质Hoechst-阴性亚神经元结构,并且还去除具有在前0.5%分位数中的UMI的那些。
无监督聚类
将具有SCTransform标准化的标准Seurat4整合管线用于聚类分析49,50。简而言之,基于正则化负二项回归(regularized negative binomial regression)来使基于内含子(对于核)或基于转录物(对于突触)的基因表达矩阵标准化。通过R软件包DoubletFinder51来鉴定双联态(doublet),以严格估计的双联态率(5%)。接下来,遵循Seurat scRNA-seq整合vignette来整合不同生物学样品的数据集。用经整合的数据槽(data slot)来进行主要组分分析(principal component analysis;PCA)和基于图的聚类。聚类的可视化用UMAP来完成。通过嵌入Seurat软件包中的MAST52算法来鉴定关于每个聚簇的标志物,采用下列参数:only.pos=TRUE,min.pct=0.25,logfc.threshold=0.5(对于核),或logfc.threshold=0.25(对于突触)。基于在聚簇标志物和规范的细胞类型特异性标志物之间的重叠根据经验来分配细胞类型。上面的管线也应用于亚聚类和基于lncRNA的聚类分析,除了由于我们仅使用通过上面所描述的“单态(singlet)”过滤器的核而跳过双联态鉴定和去除步骤外。
双联态去除
通过R软件包DoubletFinder51来鉴定和去除双联态,以严格估计的双联态率(5%)。
通过嵌入Seurat软件包中的MAST52算法来鉴定关于每个聚簇的标志物,采用下列参数:only.pos=TRUE,min.pct=0.25,logfc.threshold=0.5。基于聚簇标志物和规范的细胞类型特异性标志物的表达根据经验来分配细胞类型。
相同的管线应用于亚聚类和基于lncRNA的聚类分析,除了由于我们仅使用通过上面所描述的“单态”过滤器的核而跳过双联态鉴定和去除步骤外。对于基于lncRNA的聚类,仅将前1,000个可变特征用于PCA。
差别表达基因分析
对于目的聚簇群体,通过汇总总UMI计数来对于每个生物学样品装配pseudobulk计数矩阵。接下来,用edgeR53来鉴定大量DEG。如果abs(log2(倍数变化))>log2(1.3)并且Benjamini-Hochberg FDR<0.05,那么将基因定义为“差别表达的”。值得注意的是,相比于单细胞方法而言,当两个数据集显示出大的在UMI检测方面的差异(例如,核vs突触)时,pseudobulk方法产生稳固的倍数变化计算。将基于转录物的基因表达矩阵用于在不同亚神经元结构之中的DEG分析,而将基于外显子的基因表达矩阵用于在突触和核之间的DEG分析。使用关于注释、可视化和综合发现的数据库(Database for Annotation,Visualization,and Integrated Discovery;DAVID)来进行DEG的基因本体论富集分析,并且发明人使用共享的表达出的基因(CPM>2)作为背景列表。用pseudobulk在log2(CPM+1)矩阵上进行基因集富集分析(gene set enrichment analysis;GSEA)。
未剪接的基因的鉴定
对于每个类型的亚细胞结构,如果在至少5%的亚细胞结构中被检测到,那么将基因定义为“表达的”。对于每个神经元类型,仅保留由突触前和核所共享的表达出的基因用于分析。分别计算在突触前(pct_内含子syn)和核(pct_内含子)中的转录物的平均内含子百分比,并且将在突触处的剪接得分(SS)定义为:
对于在突触处完全未剪接的转录物,SS=0,而对于在突触处完全经剪接的转录物,SS=1。对于每个神经元类型,分布显示出在1处的峰,具有朝向0的长尾。因此,我们将SS变换为Z得分,并且如果剪接z得分<-2.58(等价于p值<0.01)和pct_内含子核>0.25,那么认为基因是未剪接的。在预分级的GSEA中使用剪接得分测量学。
数据可得性
原始测序文件在Gene Expression Omnibus(GEO)数据库中可得,登录号为GEO:GSE199346。
代码可得性
为MATQ_Drop测序数据定制的分析代码在Github网站处是可得的,使用Zonglab/MATQ_Drop。
参考文献
在本说明书中所提及的所有专利和出版物均指示了本发明所属于的领域中的技术人员的水平。所有专利和出版物均通过提及以其整体合并入本文,如同每个独个出版物被特别地和独个地指出通过提及而合并一样。
1.Gupta,A.,Wang,Y.&Markram,H.Organizing principles for adiversity ofGABAergic interneurons and synapses in the neocortex.Science 287,273-278(2000).
2.Husi,H.,Ward,M.A.,Choudhary,J.S.,Blackstock,W.P.&Grant,S.G.Proteomic analysis of NMDA receptor-adhesion protein signalingcomplexes.Nat Neurosci 3,661-669(2000).
3.Ibanez-Sandoval,O.等人,Electrophysiological and morphologicalcharacteristics and synaptic connectivity of tyrosine hydroxylase-expressingneurons in adult mouse striatum.J Neurosci 30,6999-7016(2010).
4.Cizeron,M.等人,A brainwide atlas of synapses across the mouse lifespan.Science 369,270-275(2020).
5.Zhu,F.等人,Architecture of the Mouse Brain Synaptome.Neuron99,781-799e710(2018).
6.Sheng,K.,Cao,W.,Niu,Y.,Deng,Q.&Zong,C.Effective detection ofvariation in single-cell transcriptomes using MATQ-seq.Nat Methods 14,267-270(2017).
7.Macosko,E.Z.等人,Highly Parallel Genome-wide Expression Profilingof Individual Cells Using Nanoliter Droplets.Cell 161,1202-1214(2015).
8.Habib,N.等人,Massively parallel single-nucleus RNA-seq with DroNc-seq.Nat Methods 14,955-958(2017).
9.Zheng,G.X.等人,Massively parallel digital transcriptional profilingof single cells.Nat Commun 8,14049(2017).
10.Klein,A.M.等人,Droplet barcoding for single-cell transcriptomicsapplied to embryonic stem cells.Cell 161,1187-1201(2015).
11.Ramskold,D.等人,Full-length mRNA-Seq from single-cell levels ofRNA and individual circulating tumor cells.Nat Biotechnol 30,777-782(2012).
12.Zong,C.,Lu,S.,Chapman,A.R.&Xie,X.S.Genome-wide detection ofsingle-nucleotide and copy-number variations of a single human cell.Science338,1622-1626(2012).
13.Hu,P.等人,Dissecting Cell-Type Composition and Activity-DependentTranscriptional State in Mammalian Brains by Massively Parallel Single-Nucleus RNA-Seq.Mol Cell 68,1006-1015e1007(2017).
14.Hafner,A.S.,Donlin-Asp,P.G.,Leitch,B.,Herzog,E.&Schuman,E.M.Localprotein synthesis is a ubiquitous feature of neuronal pre-and postsynapticcompartments.Science 364(2019).
15.Cajigas,I.J.等人,The local transcriptome in the synaptic neuropilrevealed by deep sequencing and high-resolution imaging.Neuron 74,453-466(2012).
16.Hughes,A.N.&Appel,B.Oligodendrocytes express synaptic proteinsthat modulate myelin sheath formation.Nat Commun 10,4125(2019).
17.Koopmans,F.等人,SynGO:An Evidence-Based,Expert-Curated KnowledgeBase for the Synapse.Neuron 103,217-234e214(2019).
18.Caceres,A.,Banker,G.,Steward,O.,Binder,L.&Payne,M.MAP2 islocalized to the dendrites of hippocampal neurons which develop inculture.Brain Res 315,314-318(1984).
19.Naisbitt,S.等人,Shank,a novel family of postsynaptic densityproteins that binds to the NMDA receptor/PSD-95/GKAP complex andcortactin.Neuron 23,569-582(1999).
20.Awasthi,A.等人,Synaptotagmin-3drives AMPA receptor endocytosis,depression of synapse strength,and forgetting.Science 363(2019).
21.Hines,J.H.,Ravanelli,A.M.,Schwindt,R.,Scott,E.K.&Appel,B.Neuronalactivity biases axon selection for myelination in vivo.Nat Neurosci 18,683-689(2015).
22.Mensch,S.等人,Synaptic vesicle release regulates myelin sheathnumber of individual oligodendrocytes in vivo.Nat Neurosci 18,628-630(2015).
23.Wake,H.等人,Nonsynaptic junctions on myelinating glia promotepreferential myelination of electrically active axons.Nat Commun 6,7844(2015).
24.Sakers,K.等人,Astrocytes locally translate transcripts in theirperipheral processes.Proc Natl Acad Sci U S A 114,E3830-E3838(2017).
25.Stuart,T.等人,Comprehensive Integration of Single-Cell Data.Cell177,1888-1902e1821(2019).
26.Lake,B.B.等人,Neuronal subtypes and diversity revealed by single-nucleus RNA sequencing of the human brain.Science 352,1586-1590(2016).
27.Buckley,P.T.等人,Cytoplasmic intron sequence-retaining transcriptscan be dendritically targeted via ID element retrotransposons.Neuron 69,877-884(2011).
28.Glanzer,J.等人,RNA splicing capability of live neuronaldendrites.Proc Natl Acad Sci U S A 102,16859-16864(2005).
29.Bell,T.J.等人,Cytoplasmic BK(Ca)channel intron-containing mRNAscontribute to the intrinsic excitability of hippocampal neurons.Proc NatlAcad Sci U S A 105,1901-1906(2008).
30.Bell,T.J.等人,Intron retention facilitates splice variantdiversity in calcium-activated big potassium channel populations.Proc NatlAcad Sci U S A 107,21152-21157(2010).
31.Aoto,J.,Martinelli,D.C.,Malenka,R.C.,Tabuchi,K.&Sudhof,T.C.Presynaptic neurexin-3alternative splicing trans-synaptically controlspostsynaptic AMPA receptor trafficking.Cell 154,75-88(2013).
32.Jones,K.A.等人,Neurodevelopmental disorder-associated ZBTB20 genevariants affect dendritic and synaptic structure.PLoS One13,e0203760(2018).
33.Frese,C.K.等人,Quantitative Map of Proteome Dynamics duringNeuronal Differentiation.Cell Rep 18,1527-1542(2017).
34.Dougherty,M.K.等人,KSR2 is a calcineurin substrate that promotesERK cascade activation in response to calcium signals.Mol Cell34,652-662(2009).
35.Hong,S.等人,Complement and microglia mediate early synapse loss inAlzheimer mouse models.Science 352,712-716(2016).
36.Roy,E.R.等人,Type I interferon response drives neuroinflammationand synapse loss in Alzheimer disease.J Clin Invest130,1912-1930(2020).
37.Shankar,G.M.等人,Natural oligomers of the Alzheimer amyloid-betaprotein induce reversible synapse loss by modulating an NMDA-type glutamatereceptor-dependent signaling pathway.J Neurosci27,2866-2875(2007).
38.Mathys,H.等人,Single-cell transcriptomic analysis of Alzheimer'sdisease.Nature 570,332-337(2019).
39.Habib,N.等人,Disease-associated astrocytes in Alzheimer'sdiseaseand aging.Nat Neurosci 23,701-706(2020).
40.Zhou,Y.等人,Human and mouse single-nucleus transcriptomics revealTREM2-dependent and TREM2-independent cellular responses in Alzheimer'sdisease.Nat Med 26,131-142(2020).
41.Zalcman,G.,Federman,N.&Romano,A.CaMKII Isoforms in Learning andMemory:Localization and Function.Front Mol Neurosci 11,445(2018).
42.Liu,S.J.等人,Single-cell analysis of long non-coding RNAs in thedeveloping human neocortex.Genome Biol 17,67(2016).
43.Zilionis,R.等人,Single-cell barcoding and sequencing using dropletmicrofluidics.Nat Protoc 12,44-73(2017).
44.Krishnaswami,S.R.等人,Using single nuclei for RNA-seq to capturethe transcriptome of postmortem neurons.Nat Protoc 11,499-524(2016).
45.Martin,M.Cutadapt removes adapter sequences from high-throughputsequencing reads.EMBnet J 17,3(2011).
46.Smith,T.,Heger,A.&Sudbery,I.UMI-tools:modeling sequencing errorsin Unique Molecular Identifiers to improve quantification accuracy.Genome Res27,491-499(2017).
47.Dobin,A.等人,STAR:ultrafast universal RNA-seqaligner.Bioinformatics 29,15-21(2013).
48.Liao,Y.,Smyth,G.K.&Shi,W.featureCounts:an efficient generalpurpose program for assigning sequence reads to genomicfeatures.Bioinformatics 30,923-930(2014).
49.Hao,Y.等人,Integrated analysis of multimodal single-cell data.Cell184,3573-3587e3529(2021).
50.Hafemeister,C.&Satija,R.Normalization and variance stabilizationof single-cell RNA-seq data using regularized negative binomialregression.Genome Biol 20,296(2019).
51.McGinnis,C.S.,Murrow,L.M.&Gartner,Z.J.DoubletFinder:DoubletDetection in Single-Cell RNA Sequencing Data Using Artificial NearestNeighbors.Cell Syst 8,329-337e324(2019).
52.Finak,G.等人,MAST:a flexible statistical framework for assessingtranscriptional changes and characterizing heterogeneity in single-cell RNAsequencing data.Genome Biol 16,278(2015).
53.Robinson,M.D.,McCarthy,D.J.&Smyth,G.K.edgeR:aBioconductor packagefor differential expression analysis of digital gene expressiondata.Bioinformatics 26,139-140(2010).
虽然已详细地描述了本公开内容及其优点,但是应当理解,可以在此进行各种变化、替换和改变,而不背离由所附的权利要求书所定义的设计的精神和范围。此外,本申请的范围并不意欲局限于在本说明书中所描述的过程、机器、制造、物质组成、手段、方法和步骤的特定实施方案。正如本领域技术人员将会从本公开内容中容易地意识到的,根据本公开内容,可以使用执行与在本文中所描述的相应实施方案实质上相同的功能或取得与在本文中所描述的相应实施方案实质上相同的结果的、目前存在或以后开发的过程、机器、制造、物质组成、手段、方法或步骤。因此,所附的权利要求书意欲在其范围内包括此类过程、机器、制造、物质组成、手段、方法或步骤。

Claims (33)

1.产生代表与亚细胞区室或结构相关的RNA的文库的方法,其包括下列步骤:
(a)固定细胞材料,所述细胞材料是或者包含一个或多个亚细胞区室或结构,从而将与所述结构相连结的RNA系固至所述结构;
(b)使所述亚细胞区室或结构和所述RNA经历第一引物以生成与在所述RNA中的一个或多个不同区域互补的第一互补多核苷酸的集合,由此产生在所述RNA和第一互补多核苷酸之间的杂合分子,所述杂合分子与所述亚细胞区室或结构相连结,其中所述第一引物包含随机序列,或仅三种类型的核苷酸的随机序列,或仅两种类型的核苷酸的随机序列,和衔接子;
(c)在所述杂合分子中的第一互补多核苷酸的3’末端上生成共同尾序列,其中所述共同尾序列与第二引物互补;
(d1)将所述亚细胞区室或结构和RNA包囊在具有颗粒的微观体积或显微体积区室中,所述颗粒包含与之相连结的所述第二引物,所述第二引物还包含一个或多个独特分子标识符序列(UMI)和一个或多个条形码,所述条形码包含使得能够汇集所希望的多核苷酸的已知序列;
从所述珠粒上释放所述引物;或者
(d2)将所述杂合分子暴露于包含所述第二引物的基材,所述第二引物还包含一个或多个独特分子标识符序列(UMI)和一个或多个条形码,所述条形码包含使得能够汇集所希望的多核苷酸的已知序列;
从所述结构上释放cDNA;
(e)在所述第二引物的至少一部分与所述第一互补多核苷酸的尾杂交后产生第二链合成,由此产生第二互补多核苷酸,其包含所述RNA序列的至少一部分、所述UMI和所述条形码;和
(f)任选地,扩增所述第二互补多核苷酸。
2.根据权利要求1所述的方法,其中对多个第二互补多核苷酸进行扩增和/或测序。
3.根据权利要求2所述的方法,其中对所述第二互补多核苷酸进行扩增以产生经扩增的第二互补多核苷酸,随后为对所述经扩增的第二互补多核苷酸中的一个或多个进行测序。
4.根据权利要求2或3所述的方法,其中所述扩增是通过聚合酶链式反应或者一种或多种等温扩增方法来进行的。
5.根据权利要求2-4中任一项所述的方法,其中所述通过扩增是通过聚合酶链式反应、一种或多种等温扩增方法或者一种或多种线性扩增方法来进行的。
6.根据权利要求5所述的方法,其中所述扩增是通过聚合酶链式反应来进行的,随后为下一代测序。
7.根据权利要求1-6中任一项所述的方法,其中用于固定的细胞材料是新鲜的、冷冻的或事先冷冻的。
8.根据权利要求7所述的方法,其中所述固定包括使所述细胞材料经历大约0.1%至100%低聚甲醛。
9.根据权利要求1-8中任一项所述的方法,其中在所述固定步骤后,富集所述亚细胞区室或结构。
10.根据权利要求9所述的方法,其中所述亚细胞区室或结构通过流式细胞术或密度梯度离心来富集。
11.根据权利要求1-10中任一项所述的方法,其中在所述固定步骤后,对所述亚细胞区室或结构进行透化。
12.根据权利要求11所述的方法,其中所述亚细胞区室或结构通过一种或多种表面活性剂来进行透化。
13.根据权利要求1-12中任一项所述的方法,其中所述亚细胞区室或结构为突触小体、细胞核、线粒体、质体、溶酶体、核糖体、溶酶体、内质网、高尔基体、树突、轴突、突触、郎维耶结、树突棘、轴突起始段、突触末梢、树突棘或细胞外囊泡。
14.根据权利要求1-13中任一项所述的方法,其中所述共同尾序列为同聚序列。
15.根据权利要求14所述的方法,其中通过末端转移酶来将所述同聚序列添加至所述第一互补多核苷酸的3’末端。
16.根据权利要求14或15所述的方法,其中所述同聚序列包含腺苷,并且所述第二引物至少包含胸苷。
17.根据权利要求1-16中任一项所述的方法,其中通过逆转录酶的模板转换活性来将所述共同尾序列添加至所述第一互补多核苷酸的3’末端。
18.根据权利要求1-17中任一项所述的方法,其中所述微观体积为微升、纳升、皮升或飞升体积。
19.根据权利要求1-18中任一项所述的方法,其中所述微观体积或显微体积区室包含小滴。
20.根据权利要求19所述的方法,其中所述小滴在微孔中。
21.根据权利要求1-20中任一项所述的方法,其中通过刺激从所述亚细胞结构上释放所述cDNA。
22.根据权利要求21所述的方法,其中所述刺激包括加热、pH变化和/或酶促切割。
23.根据权利要求22所述的方法,其中所述酶促切割为RNA酶H、RNA酶I或两者。
24.根据权利要求1所述的方法,其中在(d2)中,所述第二引物相关于所述亚细胞结构的空间分辨率来说是区域特异性的。
25.根据权利要求1-24中任一项所述的方法,其中所述引物通过连接体或通过共价键附接至所述珠粒。
26.根据权利要求1-24中任一项所述的方法,其中以酶促方式、以化学方式和/或以物理方式从所述颗粒上释放所述引物。
27.根据权利要求26所述的方法,其中所述化学释放是通过紫外辐射和/或还原剂来进行的。
28.根据权利要求26或27所述的方法,其中所述物理释放来自于加热。
29.根据权利要求1-26中任一项所述的方法,其中所述第一引物中的一个或多个与在新生RNA中的内含子序列相结合。
30.根据权利要求1-26中任一项所述的方法,其中所述第一引物中的一个或多个与长链非编码RNA相结合。
31.根据权利要求28所述的方法,其中所述长链非编码RNA包含经多腺苷酸化的尾。
32.根据权利要求28所述的方法,其中所述长链非编码RNA缺乏经多腺苷酸化的尾。
33.根据权利要求1-32中任一项所述的方法,其中与所述结构相连结的RNA包括新生RNA、微小RNA、长链非编码RNA和/或mRNA。
CN202280071172.0A 2021-09-02 2022-09-01 用于大规模亚细胞结构剖析的原位的基于总rna的转录物组剖析的方法 Pending CN118176330A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163240339P 2021-09-02 2021-09-02
US63/240,339 2021-09-02
PCT/US2022/075835 WO2023034913A2 (en) 2021-09-02 2022-09-01 Methods of in situ total rna-based transcriptome profiling for large-scale subcellular structure profiling

Publications (1)

Publication Number Publication Date
CN118176330A true CN118176330A (zh) 2024-06-11

Family

ID=85413124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280071172.0A Pending CN118176330A (zh) 2021-09-02 2022-09-01 用于大规模亚细胞结构剖析的原位的基于总rna的转录物组剖析的方法

Country Status (2)

Country Link
CN (1) CN118176330A (zh)
WO (1) WO2023034913A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116497105B (zh) * 2023-06-28 2023-09-29 浙江大学 基于末端转移酶的单细胞转录组测序试剂盒及测序方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030175749A1 (en) * 2001-12-08 2003-09-18 Jong-Yoon Chun Annealing control primer and its uses
EP3436581B1 (en) * 2016-04-01 2020-10-14 Baylor College of Medicine Methods of whole transcriptome amplification
US11788120B2 (en) * 2017-11-27 2023-10-17 The Trustees Of Columbia University In The City Of New York RNA printing and sequencing devices, methods, and systems
CN114774527A (zh) * 2022-05-20 2022-07-22 良渚实验室 一种高通量单细胞转录组测序方法及其应用

Also Published As

Publication number Publication date
WO2023034913A2 (en) 2023-03-09
WO2023034913A3 (en) 2023-06-01

Similar Documents

Publication Publication Date Title
US11162134B2 (en) Methods of whole transcriptome amplification
US11566279B2 (en) Droplet-based method and apparatus for composite single-cell nucleic acid analysis
Denker et al. The second decade of 3C technologies: detailed insights into nuclear organization
US11047001B2 (en) Methods of linearly amplifying whole genome of a single cell
CN105925675B (zh) 扩增dna的方法
US20220411783A1 (en) Method for extracting nuclei or whole cells from formalin-fixed paraffin-embedded tissues
US20120045771A1 (en) Method for analysis of nucleic acid populations
Bliss et al. Gene expression profiling of avian macrophage activation
US20200018746A1 (en) Three-Dimensional Human Neural Tissues for CRISPR-Mediated Perturbation of Disease Genes
CN114729349A (zh) 条码化核酸用于检测和测序的方法
CN118176330A (zh) 用于大规模亚细胞结构剖析的原位的基于总rna的转录物组剖析的方法
JP2023153732A (ja) Dna配列の標的特異的rna転写のための方法
Fang et al. Interactions among non-coding RNAs and mRNAs in the trigeminal ganglion associated with neuropathic pain
CN109280696B (zh) Snp检测技术拆分混合样本的方法
US20160040228A1 (en) Sequencing strategies for genomic regions of interest
KR20180118454A (ko) Cot-1 DNA의 대량 생산 방법
Davies et al. Current cellular and molecular biology techniques for the orthopedic surgeon-scientist
Ling et al. The First Insight into the Epigenetic Fusion Gene Landscape of Acute Myeloid Leukemia
EP4373957A1 (en) Method for the identification of the whole sequence of the variable region of the heavy and light chains of immunoglobulins
WO2024033411A1 (en) Methods for determining the location of a target sequence and uses
Ingebrigtsen Developing a platform for the study of multifactorial diseases
Campbell et al. DNA technology and genomics
WO2002036764A1 (fr) Procede de fabrication de banques d&#39;adn moyenne et de reseaux d&#39;adn moyenne

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication