CN116097360A - 用于组织样品中核酸的局部检测的材料和方法 - Google Patents

用于组织样品中核酸的局部检测的材料和方法 Download PDF

Info

Publication number
CN116097360A
CN116097360A CN202180062321.2A CN202180062321A CN116097360A CN 116097360 A CN116097360 A CN 116097360A CN 202180062321 A CN202180062321 A CN 202180062321A CN 116097360 A CN116097360 A CN 116097360A
Authority
CN
China
Prior art keywords
substrate
spatial
capture
cluster
tissue sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180062321.2A
Other languages
English (en)
Inventor
李濬熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Michigan
Original Assignee
University of Michigan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Michigan filed Critical University of Michigan
Publication of CN116097360A publication Critical patent/CN116097360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及用于空间检测组织样品或其一部分中的核酸的材料和方法。特别地,本文提供了用于检测RNA以获得关于组织样品中基因的定位、分布或表达的空间信息的材料和方法。在一些实施方式中,本文提供的材料和方法能够检测在单细胞中的基因表达。

Description

用于组织样品中核酸的局部检测的材料和方法
关于相关申请的声明
本申请要求于2020年7月17日提交的美国临时申请号63/053,238和于2021年1月25日提交的美国临时申请号63/141,254的优先权,其各自的全部内容通过援引并入本文。
技术领域
本公开涉及用于空间检测组织样品或其一部分中的核酸的材料和方法。特别地,本文提供了用于检测RNA以获得关于组织样品中基因的定位、分布或表达的空间信息的材料和方法。在一些实施方式中,本文提供的材料和方法允许以单一细胞分辨率来检测基因表达以及基因组信息、染色质状态、蛋白表达和发育谱系信息。在一些实施方式中,本文提供的材料和方法允许以亚细胞分辨率来检测基因表达(例如RNA)。
背景技术
用于确定组织样品中基因表达的空间位置的方法,称为“空间转录组学”,最近已被开发出来。然而,目前的空间转录组学方法受到分辨率低、低通量测序或可扩展性有限的限制。因此,需要用于以高分辨率和高通量来确定组织样品中基因表达的空间位置的改善方法。
发明内容
在某些方面,本文提供了空间检测在组织样品中的核酸的基板。基板包括固定在基板表面上的多个捕获探针。在一些实施方式中,每个捕获探针包括捕获域和空间条形码。多个捕获探针可以被布置成簇,每个簇包括多个捕获探针。在一些实施方式中,簇中的每个捕获探针包括相同的空间条形码,并且每个簇的空间条形码是唯一的。
在一些实施方式中,每个簇包括至少200个捕获探针。在一些实施方式中,每个簇包括至少500个捕获探针。在一些实施方式中,每个簇包括至少800个捕获探针。
在一些实施方式中,每个簇具有200-1200nm的平均直径。例如,每个簇可以具有1μm的平均直径。作为另一种实例,在一些实施方式中,基板每1mm2的表面包括80-120万个簇。例如,基板每1mm2的表面可以包括约100万个簇。在一些实施方式中,每个簇具有400-800nm的平均直径。在一些实施方式中,基板每1mm2的表面包括120-200万个簇。
基板可以包括任何合适的表面。基板可以是多孔或非多孔的。基板可以是平面或非平面的。在一些实施方式中,基板的表面包括选自以下的材料:玻璃、硅、聚-L-赖氨酸涂覆的材料、硝酸纤维素、聚苯乙烯、环烯烃共聚物(COC)、环烯烃聚合物(COP)、聚丙烯、聚乙烯和聚碳酸酯。
在一些实施方式中,每个捕获探针的捕获域是相同的。在一些实施方式中,捕获域包括含有至少10个脱氧胸苷残基的多聚T寡核苷酸。在一些实施方式中,捕获域包括与靶核酸的核苷酸序列互补的DNA序列。在一些实施方式中,单个簇可以具有多种不同的捕获域来捕获不同的序列。在一些实施方式中,不同的簇具有不同的捕获域。
在一些实施方式中,每个捕获探针进一步包括测序条形码。在一些实施方式中,每个捕获探针进一步包括一个或多个填充(filler)序列。在一些实施方式中,每个捕获探针进一步包括裂解域。例如,裂解域可以包括限制性内切核酸酶的结合位点。在一些实施方式中,每个捕获探针进一步包括唯一分子标识符条形码(unique molecular identifierbarcode)。
在一些实施方式中,在组织样品中检测到的核酸是RNA。在一些实施方式中,在组织样品中检测到的核酸是DNA,其可以是天然或合成的。
在一些方面,本文提供了用于复制本文所述基板的方法。在一些实施方式中,本文提供的方法包括将如本文所述的基板复制到第二介质以产生第二基板。例如,基板可以用作用于复制到多个第二基板上的模板基板。
第二基板可以用于通如过本文所述的方法检测在组织样品中的核酸。
在一些方面,本文提供了用于空间检测在组织样品中的RNA的方法。该方法包括将如本文所述的基板与组织样品接触,并且允许组织样品的RNA分子与捕获探针的捕获域结合。该方法进一步包括从结合的RNA分子生成cDNA分子,并对cDNA分子进行测序。
在一些实施方式中,该方法进一步包括在基板与组织样品接触之前确定在基板上每个捕获探针簇的位置。
在一些实施方式中,确定每个簇的位置包括确定在每个簇中至少一个捕获探针的空间条形码的序列,并将该序列分配到在基板上的位置。在一些实施方式中,通过下一代测序来确定空间条形码的序列。在一些实施方式中,该方法进一步包括将每个测序的cDNA分子的空间条形码的序列与具有相应空间条形码的在基板上的捕获探针簇的位置相关联。
在一些实施方式中,该方法进一步包括在生成cDNA分子之前或之后对组织成像。在一些实施方式中,该方法进一步包括通过将在基板上的捕获探针簇的位置与在组织样品内的相应位置相关联来确定在组织样品内RNA分子的空间位置。
在一些方面,本文提供用于对在组织样品中的核酸进行空间检测的方法。所述方法包括使本文所述的基板与组织样品接触,并且允许组织样品的核酸分子结合捕获探针的捕获域。该方法进一步包括对结合的核酸分子进行测序。在一些实施方式中,该方法进一步包括在使基板与组织样品接触之前确定在基板上的每个捕获探针簇的位置。在一些实施方式中,确定每个簇的位置包括确定在每个簇中至少一个捕获探针的空间条形码的序列,并将该序列分配到在基板上的位置。在一些实施方式中,通过下一代测序来确定空间条形码的序列。在一些实施方式中,该方法进一步包括将每个测序的核酸分子的空间条形码序列与具有相应空间条形码的在基板上的捕获探针簇的位置相关联。
在一些实施方式中,这些方法进一步包括在对核酸分子测序之前或之后对组织进行成像。在一些实施方式中,这些方法进一步包括通过将在基板上的捕获探针簇的位置与在组织样品内的相应位置相关联来确定在组织样品内核酸分子的空间位置。
在一些方面,本文提供包括本文所述的基板的试剂盒。
在一些方面,本文提供了如本文所述的基板用于确定在组织样品内的核酸分子的空间位置的用途。核酸分子可以是RNA分子。
在一些方面,本文提供了确定在组织样品中的单一细胞中的RNA表达的方法。这些方法包括使组织样品与如本文所述的基板接触。
附图说明
图1示出了可以用于如本文所述的示例性基板的代表性捕获探针。探针包含空间条形码(例如高密度分子识别符,HDMI)和捕获域(例如寡聚dT(oligo-dT))。如图所示出,捕获探针可以额外包含裂解域(例如Xba1结合位点或DraI结合位点),P7序列(ILLUMINA)和P5序列(ILLUMINA)。P7和P5序列(例如接头)使捕获探针与基板上相应的表面探针结合,并随后生成簇(例如通过桥式扩增)。
图2示出了如本文所述用于制造基板的合适方法的示意图。基板表面包括多个表面探针,使得该探针与捕获探针中的相应区域结合,并且通过桥式扩增生成簇。产生的基板包括数百万个簇,每个簇都包含相同的空间条形码(例如HDMI序列)。
图3示出了用于确定在基板上每个簇的位置的合适方法的示意图。捕获探针与基板结合,并且生成簇(例如,通过桥式扩增)。P5域可以从基板上裂解,并且可以进行一个或多个洗涤步骤,只留下具有与基板结合的P7域的捕获探针。请注意,这只是示例性的,在替代的实施方式中,P7域可以从基板上裂解,并且可以进行一个或多个洗涤步骤,只留下具与基板结合的有P5域的捕获探针。可以添加合适的一种或多种引物,并且可以确定剩余捕获探针的序列。特别地,可以确定每个簇的空间条形码的序列。可以使用荧光图像将每个簇分配到在基板上的特定位置。
图4A示出了用于制备用于RNA捕获的结合捕获探针的合适方法的示意图。捕获探针可以包含裂解域,其可以保护捕获域在基板制造期间免受损坏/降解。在簇生成、测序和将基板上的位置分配给每个簇之后(如在图2-3中所示出),可以进行一个或多个消化和洗涤步骤,以切割裂解域并暴露结合域。得到的基板(“HR-载玻片(Slide)”)包含捕获探针的簇,每个簇具有唯一空间条形码和在基板上的已知位置,并且每个簇包含具有暴露的结合域的多个捕获探针,使得RNA可以与捕获探针结合。
图4B是用于制备具有唯一分子标识符(UMI)的RNA捕获探针的替代方法的示意图。在这种方法中,捕获探针序列由两个独立的寡核苷酸编码:HDMI-寡核苷酸和UMI-寡核苷酸。HDMI-寡核苷酸用于簇生成和测序过程,如上文图4A中所述。在簇生成和测序之后,HDMI-寡核苷酸被裂解(1)并附接到UMI-寡核苷酸(2)。得到的基板包含捕获探针的簇,每个簇都具有唯一空间条形码(HDMI)和在基板上的已知位置,并且每个簇包含具有暴露的结合域以及不同的UMI序列的多个捕获探针。
图4C示出了可以复制包含HDMI编码的簇的方法的示意图。通过覆盖附着有适当PCR引物(例如聚合物结构)的介质并进行固相PCR,可以将HDMI编码的簇复制到新的介质中,同时保留捕获探针的空间信息。新的介质可以被处理以生成与上述原始基板(例如“HR-载玻片”)相似的基板。生成的基板在本文中被称为“第二基板”或“复制基板”。第二基板可以用于RNA的捕获,而原始基板可以被回收用于复制基板的重复生成。
图5示出了适合在组织样品中进行RNA表达的空间检测的方法的示意图。冰冻的组织切片(例如,冷冻切片)可以与基板(例如,“HR-载玻片”)接触。在组织中的RNA的多聚A尾与捕获探针的寡聚dT(oligo-dT)结合域结合,并且通过逆转录生成第一链cDNA。
图6示出了在第一链cDNA生成后可以进行的适当步骤的实例,包括随机引物延伸(例如,第二链cDNA合成)、第二链分离、第二链扩增和第二链纯化。也可以利用构建cDNA文库的其他标准化步骤,诸如模板转换或转座酶诱导的标签化。
图7示出了捕获多聚A mRNA并且生成Cy3标记的cDNA的示例性载玻片的Cy3荧光。该载玻片是如通过本文所述的方法制造的,以包含捕获探针的簇,并且确定簇探针的序列和空间位置。捕获探针的寡聚dT尾被暴露出来,并且在荧光标记的脱氧核苷酸(Cy3-dCTP)的存在下,用从小鼠肝脏纯化的1ug总RNA对载玻片进行逆转录(RT)反应。在RT反应期间,将Cy3-dCTP掺入到在HDMI分子上合成的cDNA序列中。这导致在所有的HDMI簇中非常明亮的Cy3染色(下面附上图片),表明这些簇确实能够合成cDNA。
图8示出了本文所述方法的一种实施方式的概述。(A)HDMI-寡核苷酸文库结构的示意图。使用这个文库作为1st-Seq的输入,在以下的(B)和(C)中描述。P5/P7,PCR接头;TR1,TruSeq Read 1;HDMI,高清图位置标识符;HR1,HDMI Read 1。(B)不同HDMI-寡核苷酸分子在流通池表面上的固相扩增。在1st-Seq期间,来自HDMI-寡核苷酸文库的单个“种子(seed)”分子形成包含唯一HDMI序列的寡核苷酸簇。(C和D)Illumina边合成边测序(SBS)确定每个簇的HDMI序列和XY坐标(C)。然后,将HDMI寡核苷酸簇修饰以暴露出寡聚dT,即RNA捕获域(D)。(E-I)HDMI-阵列捕获从叠加冰冻切片中释放的RNA(E)。然后,通过与寡聚dT域杂交的mRNA逆转录来生成cDNA足迹(F)。之后,使用随机引物法在HDMI-cDNA嵌合分子上合成二级链(G)。最后,接头PCR(H)生成用于2nd-Seq(I)的测序文库,其中使用TR1和TR2的双端测序显示了cDNA序列和其匹配的HDMI条形码。TR2,TruSeq Read 2;UMI,唯一分子标识符。(J)HDMI-阵列在100μm2的区域内包含最多达150个HDMI簇。每个簇具有带有唯一HDMI序列的超过1,000个RNA捕获探针。
图9示出了本文所述方法的示例性工作流。(A和B)用于在1st-Seq(A)中生成HDMI-阵列的化学工作流,并且使用HDMI-阵列构建2nd-Seq的文库(B)。2nd-Seq文库在Illumina和BGI平台中进行了标准的下一代测序工作流。有关详细信息,请参阅实验程序。(C-E)用于估计组织边界的生物信息学工作流(C),可视化和分析空间基因表达模式(D),以及确定细胞核和细胞质区域(E)。有关详细信息,请参阅实验程序。(F)用于在1st-Seq中生成UMI编码的HDMI-阵列的化学工作流。(G)基于随机引物(UMI_随机引物(Randomer))或阵列编码(UMI_阵列)的UMI编码方法的评价。通过基于UMI_随机引物或UMI_阵列的折叠方法,有效地减少了具有多个读长计数的HDMI的数量。
图10.从组织来源的RNA生成和分析空间cDNA足迹。(A)从Illumina序列分析查看器中检索到的在HDMI阵列中的HDMI簇的代表图像。上小图显示在1st-Seq SBS的第1次循环的“A”强度,其中33%的HDMI簇呈现荧光。下小图显示在1st-Seq SBS的第33次循环的“A”,其中超过97%的HDMI簇呈现荧光。在左小图中的黄色方块被在右小图中被放大。(B)来自破碎的肝脏切片的H&E染色及其相应的Cy3-dCTP标记的荧光图像。大体的组织边界(虚线)在底层的cDNA足迹中得到了很好的保护。在右小图中的方框插图突出了cDNA足迹中的单细胞样图案。(C)H&E染色及其相应的HDMI发现图,由1st-Seq和2nd-Seq输出的分析得出。HDMI发现图中颜色越亮,说明从相应的像素面积发现的HDMI数量越多。(D和E)在跨肝脏(上)和结肠(下)数据集的指示的块(tile)中发现的UMI计数的数量(D,左;n计数)和基因特征的数量(D,右;n特征),使用10μm的方形网格进行分箱。为这些块设置350(肝脏)或500(结肠)的截留,分离出由组织区域覆盖的网格像素(E,左),网格像素的每一个呈现大约1000个UMI(E,右)。(F-K)不同ST解决方案的性能比较。这些值来自每个像素(F和H–K)或网格区域(G)。nUMI,UMI的数量;nGene,基因特征的数量;SeqScope(L)和SeqScope(C),肝脏和结肠Seq-Scope数据。
图11示出了本文所述方法的各种性能指标。(A)从Illumina序列分析查看器中检索到的在HDMI阵列中的HDMI簇的代表图像。每张图片在1st-Seq SBS的第21次循环处可视化“A”强度,其中超过97%的HDMI簇呈现荧光。(B)滴定HDMI-寡核苷酸文库加载浓度以获得最大数量的测序簇。在指示的1st-Seq条件下,呈现出总簇数量(红色)和测序簇数量(蓝色)。将数据呈现为平均值±SEM。(C)描绘MiSeq v3常规流通池底部表面的块排列的示意图。(D和E)示意图显示了附接在指定肝脏(D,顶部)或结肠(E,顶部)组织上的块。在底部,呈现了H&E染色图像(上)和其相应的HDMI发现图(下)。(F和G)膝状图描绘了从2nd-Seq发现的所有HDMI的分布和每个HDMI分子发现的UMI的数量(nUMI)。对肝脏(F)和结肠(G)两者的数据集进行了分析。(H和I)网格化数据集的空间密度图,描绘了从指示的10μm方形网格中发现的UMI的数量。(J-O)描绘基因特征数量(n特征)在跨10μm方形网格中的分布的小提琴状图(J和L)。为这些块设置250(肝脏)或480(结肠)的截留,分离出由组织区覆盖的网格像素(K和M),每个块呈现600至1200个UMI(N和O)。对肝脏(J、K和N)和结肠(L、M和O)两者的数据集都进行了分析。(P)肝脏(红色)和结肠(蓝色)的数据集的饱和度分析。对于所有空间图,成像区域的宽度和高度分别为800μm和1mm。(Q)1st-Seq的HDMI测序结果。肝脏(左)和结肠(右)的1st-Seq中的HDMI序列的每个位置的碱基掺入率(%)在线图中呈现。请注意,我们使用标准的机械混合来制作随机寡核苷酸。在这种方法中,尽管A:C:G:T是按25:25:25:25分配的,但由于碱基的化学特性不同,随机碱基有可能与指定的比率有差异(在这种情况下,A>C>G>T)。在超过99%的测序簇中,1st-Seq的序列模式与预期序列(NNNNNBNNBNNBNNBNNBNN)一致。(R)在MiSeq平台上,HDMI(标准25-mer)和HDMI32(延伸32-mer)的重复率。HDMI的重复率非常低,为约0.05%,并且在用于Seq-Scope分析之前,所有重复已经从1st-Seq白名单数据集中移除。数据以平均值±SD表示,带有个体数值。(S)HDMI空间映射的交互错位分析(Reciprocal misassignment analysis)。将肝脏2nd-Seq数据集与肝脏1st-Seq数据集(L至L)或结肠1st-Seq数据集(L至C)进行分析,并且将结肠2nd-Seq数据集与结肠1st-Seq数据集(C至C)或肝脏1st-Seq数据集(C至L)进行分析。使用STARsolo的默认错误纠正算法(默认(Default))或不使用任何错误纠正实施(w/o纠正(Correction))进行比对。将从测序仪的不同泳道获得的肝脏和结肠2nd-Seq数据集选择用于这些分析以消除两个数据集之间的潜在干扰。(T)每个HDMI像素的UMI数量(nUMI)(左),每个HDMI像素的基因特征数量(n基因)(中),以及每个像素的nUMI/nGene比率(右)以小提琴状图呈现。(U)示例性的拆卸的MiSeq流通池的外观(左)和SYBR金染色图案(右)
图12.亚细胞空间转录物组的可视化。(A)描述不同RNA物种在亚细胞区室分布的示意图。(B-D)所有未拼接和拼接的转录物、以及已知在肝脏组织中定位于细胞核的RNA物种的空间图(靶向核;Malat1、Neat1和Mlxipl)(B)。还分析了由线粒体基因组(Mt编码)编码的RNA物种(C)。这些转录物强度之间的皮尔逊相关性(r)以热图呈现(D)。(E)在三个独立的基因子集(基因子集1-3)中未拼接和拼接的转录物的空间图。这些转录物强度之间的皮尔逊相关性(r)以热图呈现。S1-3,拼接的1-3;U1-3,未拼接的1-3。(F)显示未拼接RNA发现、H&E组织学和基于组织学的细胞分隔边界的图像。第一小图中的插图在右小图中被放大。(G)通过局部最大值检测来鉴定转录组的细胞核中心(黄色十字)。(H)鉴定细胞核富集的RNA物种。示出了前10个细胞核富集的RNA。
图13.细胞核/线粒体/细胞质亚细胞结构的可视化。(A)所有未拼接和拼接转录物、以及已知定位于肝脏组织中细胞核的RNA物种的空间图(靶向核;Malat1、Neat1和Mlxipl)。(B)所有未拼接和拼接转录物的空间图,以及由线粒体基因组(Mt编码)编码的RNA物种。(C)在指示的转录物强度之间的皮尔逊相关性(r)以热图呈现。(D)三个独立的基因子集(基因子集1-3)中未拼接和拼接的转录物的空间图。这些转录物强度之间的皮尔逊相关性(r)以热图呈现。S1-3,拼接的1-3;U1-3,未拼接的1-3。对于所有空间图,成像区域的宽度和高度分别为800μm和1mm。(E)一些分区的肝细胞区域没有呈现出细胞核/未拼接RNA富集区域的潜在原因。切片可能不包含细胞的细胞核(左)。切片中的细胞核位置可能不适合未拼接RNA的捕获(中)。转录不活跃的细胞核可能表达降低水平的未拼接RNA(右)。
图14.在正常肝脏中不同的细胞类型和亚型的鉴定。(A-D)从用10μm方形网格分箱的正常肝脏数据集中,使所有簇可视化的UMAP图(A),使跨整个网格像素的指示的基因表达可视化的UMAP图(B),以及使肝脏带区(C)和细胞类型(D)标志物的对簇具有特异性表达可视化的点图。(E和F)坐标空间上指示的转录物的空间图。(G-J)将在跨肝脏数据集的指示的块上的基因特征的数量(G,n特征)和UMI计数的数量(H,n计数;在以120截留的n特征之后)进行计算,使用7μm的方形网格进行分箱。从这个数据集,呈现了使所有簇可视化的UMAP图(I),使指示基因在跨网格化像素上的表达可视化的UMAP图(J),使分配的细胞类型的簇可视化的UMAP图(K)及其相关的空间图(L)。提供了网格数量,以及每个网格像素的平均值和中位值UMI计数(L)。(M-R)将在跨肝脏数据集的指示的块上的基因特征的数量(M,n特征)和UMI计数的的数量(N,n计数;在以100截留的n特征之后)进行计算,使用5μm的方形网格进行分箱。从这个数据集,呈现了使所有簇可视化的UMAP图(O),使指示的基因在跨网格化像素上的表达可视化的UMAP图(P),使分配的细胞类型的簇可视化的UMAP图(Q)及其相关的空间图(R)。提供了网格数量,以及每个网格像素的平均值和中位值UMI计数(R)。对于所有空间图,成像区域的宽度和高度分别为800μm和1mm。
图15.Seq-Scope在正常小鼠肝脏中进行空间单细胞分析。A-D)通过组织学指导的肝细胞分割对Seq-Scope数据进行空间单细胞分析。(A)基于H&E染色的单肝细胞分割。(B)Seq-Scope单细胞输出与从MARS-Seq和Drop-Seq得到的输出的比较。(C)细胞类型聚类显示了多层的肝细胞带区(Hep_PC1-3和Hep_PP1-3),以及少量的非实质(NPC)和损伤(Hep_损伤)转录物组表型。PC,中心周围;PP,门静脉周围。示出了UMAP(上)和热图(下)的分析。(D)用H&E染色覆盖的不同肝细胞簇的空间图(左)和细胞分割图像(右)。PV,门静脉;CV,中央静脉。(E)通过空间图分析检查呈现出不同的对区具有特异性的表达模式的基因谱。对PC具有特异性的基因用暖色(红色-橙色-黄色)描绘,而对PP具有特异性的基因用冷色(蓝色-紫色)描绘。(F-I)通过用10-mm网格的组织学诊断性分割检测NPC转录物组。(F)示意图描绘了正常肝脏的细胞组分和它们在组织切片中的表现。(G和H)UMAP(G)和空间图(H)可视化了代表指示的细胞类型的10-mm网格的簇。(I)将基于10-mm网格的M4和ENDO映射数据(第一和第二小图)与对簇具有特异性的标志物的空间图数据(第三小图)、H&E(第四)和分割的H&E(第五)数据进行比较。
图16.肝脏损伤和炎症的Seq-Scope分析。(A-F)TD肝脏Seq-Scope数据集通过用边长10mm方形网格的数据分箱来进行分析。(A)描绘了在跨10mm方形网格中发现的UMI的数量的空间密度图。(B)描绘了在跨10mm方形网格上的基因特征的数量(n特征)的小提琴状图。设置250的截留,分离出由组织区域所覆盖的网格单元(C),网格单元的每一个包含约700个UMI(D)。使所有簇可视化的UMAP图(E)和使对簇具有特异性的标志物的表达可视化的点图(F)。(G)使亚细胞结构可视化的未拼接、拼接和线粒体转录物的空间图。(H)使用空间绘图检查正常和TD肝脏中氧化应激响应基因Gpx3和Sepp1的表达。肝细胞带区在底部小图中绘制作为参考。Gpx3和Sepp1在TD肝脏的PP肝细胞中被特异性诱导。(I)使用具有5mm和2mm间隔的滑动窗口进行多尺度细胞类型映射分析。(J-O)使在TD肝脏中指示的细胞类型标志物基因的表达可视化的空间图。
图17.Seq-Scope在显微镜和转录组的尺度内检查肝脏组织病理学。通过Seq-Scope检查遭受严重的肝脏损伤和炎症的Tsc1Dhep/Depdc5Dhep(TD)小鼠的肝脏(Cho etal.,2019)。(A-C)使10-mm网格的细胞类型簇可视化的UMAP(A)和空间图(C,左)。NPC和损伤反应的群用较深的颜色突出显示,并且其代表性的细胞类型特异性标志物基因在(B)中总结。H&E图像(C,右)对应于在(C,左)中的方框区域。黄色星号标记损伤区域。(D-O)死亡肝细胞(D-G)和纤维化病变(H-O)周围的肝脏组织病理学的转录组结构。(D、H和M)使用具有5-mm(左)和2-mm(右)间隔的滑动窗口进行细胞类型映射分析。(E、I和N)在组织学坐标平面上表明细胞类型特异性基因的空间绘图。(F)M4-炎症细胞(绿色)、M4-Kupffer细胞(蓝色)、Hep_损伤细胞(红色)和其他细胞(灰色)在死亡肝细胞(带黄色星号的黑色头骨)周围的排列示意图。
图18.Seq-Scope鉴定来自结肠壁组织的各种细胞类型。使用Seq-Scope分析结肠壁的空间转录物组。分析了10-mm网格数据集。(A–I)Seq Scope通过转录物组聚类揭示了主要组织学层(A–C)、上皮细胞多样性(D–F)和非上皮细胞多样性(G–I)。(A、D和G)结肠壁结构示意图。在UMAP流形(B、E和H)和组织学空间(C、F和I)中可视化了与指示的细胞类型相对应的簇。(J)在点阵图分析中检查了对簇具有特异性的标志物。DCSC,深部隐窝分泌细胞;EEC,肠内分泌细胞;SOM神经元,表达生长抑素的神经元细胞。
图19.结肠空间转录物组的Seq-Scope分析。通过用边长10mm方形网格的数据分箱分析了结肠Seq-Scope数据集。(A)描绘了在跨10mm方形网格发现的UMI数量的空间密度图。(B)描绘在跨10mm方形网格中基因特征数量(n特征)的小提琴状图。设置1,000的截留,分离出由组织区域所覆盖的网格单元(C),网格单元的每一个包含约2,700个UMI(D)。呈现了使所有簇可视化的UMAP图(E)和使主要组织学层(F)、上皮细胞多样性(G)和非上皮细胞多样性(H)可视化的空间图。(I-K)通过用边长5mm的方形网格的数据分箱分析的结肠Seq-Scope数据集。(I)描绘了在跨5mm方形网格中的基因特征的数量(n特征)的小提琴状图。设置250截留,分离由组织区域所覆盖的网格单元(J),网格单元的每一个包含约600个UMI(K)(L和M)从5mm网格数据集构建的UMAP图(L)和具有5mm间隔的10mm网格的滑动窗口数据集(M)。细胞类型注释是通过原始的10mm网格数据集引导的(E)。(N)多尺度细胞类型映射与滑动窗口分析相结合,以高分辨率鉴定不同细胞类型之间的清晰界限。结肠SeqScope数据集使用具有10mm边长的方格的简单网格进行分析(左)。使用10mm的数据集作为锚,在5mm的网格化数据集中进行多尺度细胞类型映射(中间)。尽管5mm网格化提高了分辨率,但由于在每个网格中的遗传信息稀少,图像非常嘈杂。为了克服这个问题,我们使用通过具有5mm间隔的10mm网格化数据集的滑动窗口分析而产生数据集,来进行同样的分析。输出的图像(右)以高分辨率清楚地可视化了在不同细胞类型之间的边界。细胞类型注释描述了主要的组织学层(上)、上皮细胞多样性(中)和非上皮细胞多样性(下)。(O)描绘滑动窗口分析方法的示意图。与10mm的网格数据集相比,5mm的网格数据集产生了更高的分辨率;然而,由5mm的网格区域所揭示的转录物组信息是从10mm网格区域所恢复的仅25%。相应地,5mm数据集在细胞类型分配方面产生了大量的噪音。为了克服这个问题,我们进行了滑动窗口分析,通过对数据进行4次(5mm间隔)、25次(2mm间隔)或100次(1mm间隔;方案未显示)的超采样,以保持每个像素的转录物组信息,同时实现细胞类型映射的高分辨率。
图20.使用正常肝脏的Seq-Scope数据集进行空间单细胞分析。A-E)Seq-Scope转录物组与大量RNA-Seq和scRNA-Seq转录物组的比较。各个点代表示出在两个数据集中的表达水平的单个基因。在各组之间的皮尔逊相关系数中评价相关性。(F-I)使用Seq-Scope进行单肝细胞转录物组分析。(F)分割的肝细胞转录物组被聚类为门静脉周围(PP)和中心周围(PC)的群。示出了簇和对簇具有特异性的基因的UMAP(上)和热图(下)分析。(G)PP和PC肝细胞群的空间图。(H)在Seq-Scope和两个独立的scRNA-seq数据之间的前50个对PP和PC具有特异性的基因重叠。(I)仅使用Drop-Seq(左)和MARS-Seq(右)的前50个PC/PP基因进行聚类、UMAP(上)和空间绘图(下)的分析。(J)在图4D中描述用H&E染色覆盖的不同肝细胞簇的空间图和细胞分割图像。分析了四个块,2104-2107(从左至右)。PV,门静脉;CV,中央静脉。(K)UMAP(左)和空间绘图(右)分析,用连续带区的颜色图(UMAP1,UMAP2)着色。(L-O)使用小鼠肝脏ST(L)和载玻片-Seq(M)数据集,将单个基因的空间表达绘制在大致覆盖0.8mm 31mm区域的组织学坐标平面上。与由Seq-Scope生成的图相比,这些图显示分辨率和动态范围大大降低,空间细节较为不明显(图4E)。在使用ST、载玻片-Seq和Seq-Scope技术产生的肝脏数据集之间比较每像素(N)或面积(O)的RNA/基因捕获输出。(P-V)通过用边长10mm方形网格的数据分箱来分析了正常肝脏Seq-Scope数据集。(P)描绘在跨10mm方形网格中发现的UMI的数量的空间密度图。(Q)描绘在跨10mm方形网格中基因特征的数量(n特征e)的小提琴状图。设置250个截留,分离出的网格单元由组织区(R)覆盖,网格单元的每一个包含约700个UMI(S)。呈现了使所有簇可视化的UMAP图(T)以及使对簇具有特异性的标志物的表达可视化的点图(U)和UMAP图(V)。
图21.不同结肠细胞类型标志物的空间表达模式。(A-J)指示细胞类型的标志物基因用指示的颜色绘制在坐标空间上。每个小图的顶行代表所有列出的标志物在坐标空间上的组合图。底行代表单个细胞类型标志物基因的基因表达图。对于所有空间图,成像区域的宽度和高度分别为800μm和1mm。
图22.Seq-Scope能够对结肠空间转录物组进行显微镜分析。(A-C)空间细胞类型映射使用具有5-mm(左)、2-mm(中)或1-mm(右)间隔的多尺度滑动窗口分析来进行完善。(D-H)通过空间基因表达图来分析的原始Seq-Scope数据集,使用指示的对层具有特异性(D)、对细胞类型具有特异性(E和F)或对细胞周期具有特异性(H)的标志物基因。这些空间转录物组特征与基础H&E组织学(G)一致。
定义
尽管与本文描述的方法和材料相似或等效的任何方法和材料都可以用于本文描述的实施方式的实践或测试,本文描述了一些优选的方法、组合物、装置和材料。然而,在描述本发明的材料和方法之前,应当理解本发明并不局限于本文所述的特定分子、组合物、方法或方案,因为这些可以根据常规实验和优化而变化。还应当理解,描述中使用的术语只是为了描述特定的方案或实施方式,并且不是为了旨在限制本文所述实施方式的范围。
除非另外定义,否则本文使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。然而,在冲突的情况下,本说明书(包括定义)将主导。因此,在本文所述的实施方式的上下文中,适用以下定义。
除非上下文明确另有规定,否则如本文和所附权利要求书中所使用的,单数形式(一个/一种(a/an)和“所述/该(the)”)包括复数引用。因此,例如,提到“两亲性多肽”是指本领域技术人员已知的一种或多种两亲性肽及其等效物,等等。
如本文所用,术语“包括”及其语言变化表示存在所描述的一个或多个特征、一个或多个元素、一个或多个方法步骤等,但不排除存在额外的一个或多个特征、一个或多个元素、一个或多个方法步骤等。反之,术语“由……组成”及其语言变化表示存在所提及的一个或多个特征、一个或多个元素、一个或多个方法步骤等,并排除任何未提及的一个或多个特征、一个或多个元素、一个或多个方法步骤等,但通常相关的杂质除外。短语“基本上由……组成”表示所提及的一个或多个特征、一个或多个元素、一个或多个方法步骤等,以及不对组合物、***或方法的基本性质具有实质性影响的任何额外的一个或多个特征、一个或多个元素、一个或多个方法步骤等。本文许多实施方式是使用开放的“包括”语言来描述的。这样的实施方式涵括多个封闭的“由……组成”和/或“基本由……组成”的实施方式,这些实施方式也可以使用这样的语言来替代地要求或描述。
本文使用的术语“基板”是最广义的并且是指本文所述的任何基板。“基板”在本文也可以被称为“流通池表面”。基板可以是流通池的一部分,其中流通池包括流通池表面(例如基板)以及一个或多个通道,以促使向流通池表面添加液体。在一些实施方式中,流通池的一个或多个部件是可拆卸的,使得可以获得暴露的流通池表面(例如基板),而不损坏其上包含的HDMI-阵列。在一些实施方式中,术语“基板”是指由本文所述方法诸如桥式扩增来生成的基板。在一些实施方式中,术语“基板”是指使用原始基板作为模板形成的第二基板或复制基板,并将原始基板复制到第二介质上。用于空间检测在如本文所述的组织样品中的核酸的方法可以使用任何基板进行,包括原始基板和第二基板。
具体实施方式
在某些方面,本文提供了空间检测在组织样品中的核酸的基板。在一些实施方式中,本文提供了空间检测在组织样品中的RNA分子的基板。在一些实施方式中,基板可以用于组织样品中RNA转录物(例如mRNA)的空间检测。
在一些实施方式中,基板包括固定在基板表面的多个捕获探针(例如“种子(seed)”或“种子分子”)。探针可以通过任何合适的方式固定在基板的表面上。在一些实施方式中,基板的表面包括捕获探针的结合配偶体。捕获探针的结合配偶体在本文中被称为“表面探针”。例如,基板的表面可以包括多个表面探针,它们与捕获探针上的互补接头区域结合。在一些实施方式中,基板的表面包括多种类型的表面探针。例如,基板的表面可以包括两种类型的表面探针,其中第一种类型的表面探针与捕获探针3'端的第一接头区域互补,并且第二种类型的表面探针与捕获探针5'端的第二接头区域互补。在这样的实施方式中,可以通过称为桥式扩增的过程在基板表面生成捕获探针的簇。
在桥式扩增中,捕获探针3'端的第一接头区域与互补的表面探针(例如,第一种类型表面探针)结合。聚合酶在杂交的捕获探针上产生互补链,生成双链分子。将双链分子变性(例如,通过添加变性剂,诸如氢氧化钠)。可以进行一个或多个洗涤步骤,以洗去原始的捕获探针,留下固定在基板表面的互补链。通过随机的相互作用,链的5'端的第二接头区域与互补的表面探针(例如第二种类型表面探针)结合,从而引起链弯曲,形成“桥”。聚合酶生成互补链,产生双链桥。将双链桥变性,产生具有与第一种类型表面探针结合的3'端并且5'端暴露的捕获探针,以及具有与第二种类型表面探针结合的5'端并且3'端暴露的另一捕获探针。
如上所述,每个捕获探针可以包括与互补表面探针结合的接头区域。在一些实施方式中,每个捕获探针包括捕获域。捕获域可以是能够与RNA或其转录物,诸如mRNA杂交的任何合适的域。在一些实施方式中,捕获域包括多聚T寡核苷酸。多聚T寡核苷酸包括由磷酸二酯键连接的一系列连续脱氧胸苷残基。多聚T寡核苷酸能够与mRNA的多聚A尾杂交。在一些实施方式中,捕获域包括含有至少10个脱氧胸苷残基的多聚T寡核苷酸。多聚T寡核苷酸可以包括至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30或超过30个的脱氧胸苷残基。在一些实施方式中,捕获域包括在功能上或结构上类似于多聚T并保留与多聚A结合的功能特性的核苷酸。例如,捕获域可以包括多聚U寡核苷酸。
在一些实施方式中,捕获域是非特异的(例如,旨在捕获包含多聚A尾的所有RNA)。在一些实施方式中,捕获域可进一步包括额外的序列,诸如随机序列,以促进捕获特定类型的RNA。在一些实施方式中,捕获域可以进一步包括额外的序列以捕获所期望的RNA亚型,诸如mRNA或rRNA。在一些实施方式中,捕获域可以进一步包括额外的序列,以促进捕获对应于选定基因或基因组的特定RNA(例如mRNA)。这样的捕获探针可以基于它期望捕获的RNA的序列来选择或设计。因此,捕获探针可以是特异序列的捕获探针。
在一些实施方式中,捕获域可以靶向DNA,而不是RNA。在一些实施方式中,捕获域可以靶向非特异或特异的DNA序列。例如,捕获域可以包括核酸序列,以促进对靶DNA序列的捕获。
在一些实施方式中,每个探针的捕获域都是相同的。在一些实施方式中,一个或多个探针的捕获域与至少一个其他探针的捕获域不同。
在一些实施方式中,捕获探针额外地包括裂解域。在一些实施方式中,裂解域是捕获域的3',这样捕获域在裂解域被裂解之前不会暴露。例如,裂解域可以包括限制性内切核酸酶的结合位点(例如限制性位点)。在捕获探针与基板表面结合以及簇生成期间,裂解域可以是完整的(例如,未裂解)。在簇生成和/或确定每个簇在基板上的位置(例如,通过空间条形码的测序)后,可以加入酶来诱导裂解域的裂解。例如,可以添加限制性内切核酸酶(例如Xba1、Dra1等)来切割裂解域,并且可以任选地进行一个或多个洗涤步骤,从而暴露出捕获域。
在一些实施方式中,裂解域的裂解可以允许暴露额外的一个或多个域。例如,裂解域的裂解可以暴露出捕获域。
捕获探针包括空间条形码。空间条形码可以是任何合适长度的寡核苷酸。在一些实施方式中,空间条形码包括10-50个核苷酸。例如,空间条形码可以包括10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在特定的实施方式中,空间条形码包括20个核苷酸。
在一些实施方式中,每种捕获探针包括一个或多个测序条形码(例如,测序柄(handle))。例如,每种捕获探针可以包括测序柄,诸如ILLUMINA TruSeq柄。测序条形码可以包括任何合适数量的连续核苷酸。在一些实施方式中,测序条形码包括10-50个核苷酸。例如,测序条形码的长度可以是约10、15、20、25、30、35、40、45或50个核苷酸。
在一些实施方式中,每个捕获探针进一步包括一个或多个填充(filler)序列。填充序列可以包括任何合适数量的连续核苷酸。在一些实施方式中,填充序列包括10-50个核苷酸。例如,填充序列的长度可以是约10、15、20、25、30、35、40或50个核苷酸。
多个捕获探针在基板表面上成簇排列,每个簇包括多个捕获探针。在簇中的每个捕获探针都包括相同的空间条形码。此外,每个簇的空间条形码是唯一的。例如,簇A包含具有空间条形码A的探针,簇B包含具有空间条形码B的探针,簇C包含具有空间条形码C的探针等。
在一些实施方式中,在簇中的每个捕获探针被设计为包括唯一分子标识符(UMI)(本文也被称为“唯一分子标识符条形码”或“UMI条形码”)。在簇中的每个捕获探针包括不同的UMI条形码(UMI_阵列)。在一些实施方式中,UMI不是由捕获探针编码的,而是在二级链合成期间从随机引物位点获得。例如,每个cDNA将与二级链配对,二级链的每一个由唯一随机引物序列编码,作为UMI(UMI_随机引物)。UMI_阵列和UMI_随机引物两者都能有效地从扩增的cDNA文库中折叠PCR重复。例如,每个簇的空间条形码的序列可以通过下一代测序确定,并且重复的序列读长可以通过由阵列(UMI_阵列)编码的唯一分子标识符或通过随机引物位点(UMI_随机引物)来进行折叠。在一些实施方式中,UMI_随机引物可以是半随机的,以便它具有某些核苷酸模式,使二级链的合成更有效率。
在一些实施方式中,每个簇包括至少200个捕获探针。例如,每个簇可以包括至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1000个捕获探针。在一些实施方式中,每个簇包括900-1100个捕获探针。例如,每个簇可以包括900、910、920、930、940、950、960、970、980、990、1000、1010、1020、1030、1040、1050、1060、1070、1080、1090或1100个捕获探针。在一些实施方式中,每个簇中的所有捕获探针将是相同的。在一些实施方式中,在单个簇中可以生成多种不同的捕获探针。
每个簇可以呈大致的圆形。每个簇可以具有的平均直径为约200-1200nm。例如,每个簇可以呈大致的圆形,具有的平均直径为200nm、250nm、300nm、350nm、400nm、450nm、500nm、550nm、600nm、650nm、700nm、750nm、800nm、850nm、900nm、950nm、1000nm、1050nm、1100nm或1200nm。在一些实施方式中,每个簇呈大致的圆形,具有的平均直径为950-1050nm。例如,平均直径可以是950nm、960nm、970nm、980nm、990nm、1000nm、1010nm、1020nm、1030nm、1040nm或1050nm。在特定的实施方式中,平均直径为600nm(0.6微米)。
基板的表面可以包括任何合适数量的簇。在一些实施方式中,基板的表面包括每1mm2的表面30-200万个簇。在一些实施方式中,基板的表面包括每1mm2的表面80-120万个簇。在一些实施方式中,基板的表面包括每1mm2的表面100万个簇。
基板的表面可以包括任何合适的材料。在一些实施方式中,基板的表面是多孔的。在一些实施方式中,基板的表面是无孔的。在一些实施方式中,该表面包括选自以下的材料:玻璃、硅、聚L-赖氨酸涂覆的材料、硝酸纤维素、聚苯乙烯、聚丙烯酰胺、环烯烃共聚物(COC)、环烯烃聚合物(COP)、聚丙烯、聚乙烯和聚碳酸酯。在一些实施方式中,该表面包括玻璃。
在一些实施方式中,基板可以是流通池的一部分,其中流通池包括流通池表面(例如基板)以及一个或多个通道,以促使向流通池表面添加液体。例如,流通池可以包含一个或多个通道,使得通道将液体流向流通池表面(例如基板)。这样的实施方式可以促进各种洗涤步骤、温育步骤等。在一些实施方式中,流通池是可拆卸的,使得可以获得暴露的流通池表面(例如基板),而不损坏其上包含的HDMI-阵列。
在一些实施方式中,基板(例如流通池表面)包括平面。例如,基板可以包括载玻片(例如,玻璃载玻片)。在一些实施方式中,基板包括非平面(例如凸面或凹面)表面。在一些实施方式中,基板包括凝胶(例如水凝胶)。在一些实施方式中,基板包括管或毛细管。这样的实施方式可能对同时处理多个组织样品特别有用。在一些实施方式中,基板包括珠粒(例如微细的珠粒)。例如,捕获探针可以经由与附接在基板表面上的珠粒的相互作用来固定在基板的表面上。
在一些实施方式中,基板不是多孔基板。而是,基板可以包括涂覆有表面探针的平面表面,并且簇的生成可以通过经由捕获探针与表面探针的随机相互作用所制约的桥式扩增来发生在基板的表面上。在一些实施方式中,避免使用多孔基板能够生成具有合适的簇密度、簇间距和簇数量的基板,以实现单细胞分辨率。因此,本文所述的基板可以使组织样品中的核酸(例如RNA)的空间检测具有单细胞分辨率。
在一些实施方式中,基板(例如流通池表面)可以被图案化。例如,基板可以用确定的表面探针组进行图案化,使得捕获探针和表面探针之间的相互作用(例如桥式扩增)得到更明确的簇。这样的图案化可能促进改善基板上各个簇的空间位置的定义。在一些实施方式中,基板经包含固定在每个纳米孔中的限定的表面探针组的纳米孔(例如多孔基板)图案化。
在一些实施方式中,基板可以被设计为生成具有局部图案的额外核酸。例如,簇可以编码RNA聚合酶结合序列,诸如T7 RNA聚合酶启动子序列,以产生由簇所编码的RNA序列,扩增序列信息。
在一些实施方式中,基板可以包括额外的捕获部分。例如,基板可以包括额外的捕获部分,用于捕获非核酸靶标(例如,除RNA或DNA以外的靶标)。这样的实施方式能够对核酸和非核酸靶标进行多重检测。例如,这样的实施方式能够对DNA和/或RNA,以及非核酸靶标诸如蛋白进行多重检测。在一些实施方式中,基板可以包括针对目的靶蛋白的抗体。作为另一种实例,基板可以包括识别特定生物分子、细胞器或细胞的其他分子探针。在一些实施方式中,可以将额外的捕获部分(例如抗体、探针)缀合到基板的表面。在一些实施方式中,天然DNA分子可以被分割并且用可以由基板捕获的部分来标记。在一些实施方式中,额外的捕获部分可以被缀合到基板的表面,使得每个捕获探针的簇包含集成在簇内的一个或多个额外的捕获部分。作为另一种实例,额外的捕获部分可以与捕获探针自身缀合。例如,额外的捕获部分可以通过合适的连接件与捕获探针的合适部分缀合。在一些实施方式中,额外的捕获部分可以与组织靶标缀合。例如,可以用捕获部分诸如聚腺嘌呤来标记小的微RNA,使得它们就可以被基板捕获。
在一些实施方式中,将基板复制到第二基板上。第二基板在本文中也被称为“复制基板”。用于生成第二基板的基板(例如流通池表面)在本文中被称为“原始基板”或“模板基板”。例如,“原始基板”或“模板基板”可以通过本文描述的方法生成。在一些实施方式中,每种捕获探针的捕获域都暴露在模板基板中。在一些实施方式中,每个捕获域的捕获域不暴露在模板基板中(例如,裂解域是完整的)。“模板基板”可以复制到第二介质上,以形成“第二基板”。例如,模板基板可以通过额外的PCR或等温扩增方法诸如桥式扩增来复制到第二基板上。核酸的后续处理可以暴露在复制基板中的捕获域。在一些实施方式中,原始基板诱导核酸转录物诸如RNA的局部合成和释放,它被第二介质捕获以形成第二基板。这样的实施方式在允许少量的模板基板作为复制模板以形成大量的第二基板方面可能是有利的。第二基板可以用于空间检测如本文所述的组织样品中核酸的方法。
复制基板可以包括任何合适的材料或形式,如上面原始基板所描述的。例如,复制基板可以是多孔或无孔的。复制基板可以是平面或非平面的。例如,复制基板可以包括涂覆有表面探针的平面。复制基板也可以包括具有增加表面积的3维结构,诸如卷曲的表面或多孔的表面。复制基板的表面可以包括选自以下的材料:玻璃、硅、聚L-赖氨酸涂覆的材料、硝酸纤维素、聚苯乙烯、环烯烃共聚物(COC)、环烯烃聚合物(COP)、聚丙烯、聚乙烯、聚碳酸酯和聚丙烯酰胺。在一些实施方式中,复制的表面包括聚丙烯酰胺。在一些实施方式中,复制基板包括凝胶。在一些实施方式中,复制基板包括珠粒。适用于PCR或等温扩增的任何DNA聚合酶都可以用于复制基板。合适的酶包括:Taq聚合酶、Pfu聚合酶、Bst聚合酶、KAPAHIFIDNA聚合酶TM、HerculaseTM和Phusion DNA聚合酶TM。在一些方面,本文提供了用于空间检测在组织样品中的核酸的方法。尽管本文通常描述用于空间检测组织样品中的RNA的方法,但应当理解,本文描述的基板、方法和试剂盒也可以用于空间检测组织样品中的DNA。此外,该方法可以包括对核酸(例如RNA、DNA)和非核酸(例如蛋白、细胞、细胞器等)靶标的多重检测。靶标的类型可以取决于使用的特定捕获域和/或基板上存在的额外捕获部分。例如,包括多聚dT尾的捕获域适用于空间检测具有多聚A尾的RNA。不具有多聚A尾的RNA在由基板捕获之前可以用多聚A标记。
在一些实施方式中,合成核苷酸与组织中的天然RNA和/或DNA进行序列特异性杂交。在这些实施方式中,这种合成核苷酸被设计成包含捕获域诸如多聚A尾的靶序列。对由基板捕获的合成核苷酸进行测序,可以能够对组织中存在的靶RNA和/或DNA进行空间检测。
包括针对靶DNA序列的核酸序列的捕获域有助于对DNA进行空间检测。包括捕获探针和额外的捕获部分(例如靶向蛋白的抗体或靶向特异核酸序列的DNA/RNA探针)的基板有助于对核酸和非核酸靶标进行多重检测。
用于空间检测组织样品中的核酸的方法包括使样品与本文所述的基板接触。在一些实施方式中,该方法包括使基板与组织样品接触,并允许组织样品的核酸(例如RNA)分子与捕获探针的捕获域结合。例如,RNA分子(例如mRNA)的多聚A尾可以与捕获探针的暴露的多聚dT(或功能等效)域结合。
作为另一种实例,靶DNA分子可以与包括与靶DNA分子的核酸序列互补的序列的捕获域结合。对于空间检测DNA的方法,靶DNA(例如与捕获域结合的DNA)可以通过合适的测序方法进行测序。例如,可以使用合适的引物来延伸捕获探针,并且确定靶DNA的序列。合适的测序方法包括下面描述的与cDNA分子测序有关的方法,诸如基于PCR的方法、ILLUMINA平台、焦磷酸测序,等等。
在一些实施方式中,该方法进一步包括从结合的RNA分子生成cDNA分子。生成的cDNA被认为是表明在采集组织样品时细胞中存在RNA。因此,cDNA代表了在采集组织样品时在细胞中表达的所有基因或某些基因。捕获探针作为逆转录的引物,使得捕获探针的序列连同与捕获的RNA链互补的序列一起被掺入第一链cDNA分子的序列中。因此,捕获探针的空间条形码被掺入至第一链cDNA分子的序列中。
可以通过任何合适的方法进行从结合的RNA分子生成cDNA分子。例如可以通过添加逆转录酶来促进RNA(例如mRNA)的逆转录,以生成互补的或拷贝的DNA(即cDNA),来从结合的RNA分子生成cDNA分子。从RNA的逆转录产生的cDNA在本文中被称为“第一链cDNA”。第一链cDNA的合成(例如逆转录)可以直接在基板上进行。
在一些实施方式中,逆转录反应包括逆转录酶、dNTPs和合适的缓冲液。该反应混合物可以包括其他组分,诸如一种或多种核糖核酸酶抑制剂。每种dNTP典型地以范围为约10至5000μΜ,通常约20至1000μΜ的量存在。可以使用任何合适的逆转录酶。合适的酶包括:M-MLV、MuLV、AMV、HIV、ArrayScriptTM、MultiScribeTM、ThermoScriptTM
Figure BDA0004119315870000221
I、II和III酶。逆转录酶反应可以在任何合适的温度下进行,这取决于酶的特性。通常情况下,逆转录酶反应在37-55℃之间进行,尽管在这个范围之外的温度也可能是合适的。反应时间可以少至1、2、3、4或5分钟,或者多至48小时。通常情况下,反应在3-12小时之间进行,尽管可以使用其他合适的反应时间(例如,过夜)。
在一些实施方式中,可以开发与第一链cDNA互补的链。与第一链cDNA互补的链在本文中被称为“第二链cDNA”。如本文所用的术语“cDNA”是最广义的,并且是指任何cDNA,包括第一链cDNA和第二链cDNA。
在一些实施方式中,“生成cDNA“包括进行第二链合成(例如,在逆转录反应之后)以生成第二链cDNA。在一些实施方式中,第二链cDNA合成可以在不增加第二链cDNA的拷贝数量的情况下进行(例如,不扩增第二链)。在其他实施方式中,合成并扩增第二链cDNA,从而产生第二链的多个拷贝。如果进行第二链cDNA合成,可以在基板上进行(例如,当cDNA被固定在基板上时)。替代地,第一链cDNA可以从基板上释放,并且第二链cDNA合成可以在溶液中进行。
第二链cDNA包括捕获探针的互补序列(complement),并且因此包括捕获探针的空间条形码序列的互补序列。第二链cDNA可以使用合适的引物或引物组合在空间条形码序列的互补序列上游来扩增,使得使空间条形码序列的互补序列存在于每个扩增的第二链cDNA中。
在一些实施方式中,第二链cDNA合成是使用随机引物进行的。例如,第一链cDNA可以与随机引物诸如六聚体引物和DNA聚合酶在足以合成互补DNA链(例如第二链cDNA)的条件下进行温育。
在一些实施方式中,使用随机引物会产生不同长度的cDNA分子,并且不太可能产生全长的cDNA分子(例如,对应于由其合成的完整RNA链的cDNA分子)。如果期望产生全长的cDNA分子,可以采用其他方法。例如,第一链cDNA的3'端可以被修改,使得生成完整第一链cDNA的互补序列。例如,连接件或接头可以连接到cDNA分子的3'端。这可以使用单链连接酶,诸如T4 RNA连接酶或CircligaseTM(LUCIGEN)来实现。替代地,可以使用双链连接酶诸如T4 DNA连接酶将辅助探针(部分双链DNA分子能够与第一链cDNA分子的3'端杂交)连接到3'端。适合于连接步骤的其他酶在本领域是已知的,并且包括例如Tth DNA连接酶、Taq DNA连接酶、热球菌属(Thermococcus sp.)(菌株9°N)DNA连接酶(9°NTM DNA连接酶,New EnglandBiolabs)和AmpligaseTM(LUCIGEN)。在一些实施方式中,辅助探针包括特定的序列,可以使用与连接到第一cDNA链的辅助探针部分互补的引物,从所述的特定序列中引发第二链的cDNA。另一种替代包括使用末端转移酶活性酶在cDNA第一链的3'端掺入多核苷酸尾,例如多聚A尾。第二链的合成可以使用多聚T引物引发,该引物也可以包括用于另外扩增的特定扩增域。
用于生成全长cDNA的另一种适合的方法被称为模板切换,例如使用
Figure BDA0004119315870000241
的SMARTTM技术。SMART(RNA模板5'端的切换机制)技术是成熟的,其基于以下发现:逆转录酶,例如
Figure BDA0004119315870000242
II(Invitrogen),能够在延伸的cDNA分子的3'端处增加几个核苷酸,以产生具有在3'端处悬垂的单链DNA的DNA/RNA杂交体。该悬垂DNA可以提供靶序列,寡核苷酸探针可以与之杂交,以为cDNA分子的另外延伸提供额外的模板。与悬垂cDNA杂交的寡核苷酸探针包含扩增域序列,其互补序列被掺入至合成的第一链cDNA产物中。与掺入第一链cDNA的互补扩增域序列杂交的包含扩增域序列的引物,可以添加至反应混合物中,以使用合适的聚合酶和使用cDNA第一链作为模板进行第二链合成。这种方法避免了在cDNA第一链的3'端连接接头的需要。虽然模板转换最初是为全长mRNA开发的,它具有5'帽结构,但是已经被证明对没有帽结构的截断的mRNA也同样有效。因此,模板转换可用于本发明的方法中,以生成cDNA分子。
在一些实施方式中,可以合成第二链cDNA使得一个或多个额外的特征被添加到第二链中。这些额外的特征可以存在于用于第二链合成的引物(例如,随机引物)中。例如,可以合成第二链cDNA使得用于后续扩增的引物结合位点被添加到第二链中。在一些实施方式中,可以将一个或多个测序柄(例如,测序条形码)掺入至第二链cDNA中。例如,第二链cDNA的合成可以包括测序柄,诸如ILLUMINA TruSeq柄,它可以被添加到第二链cDNA中。在一些实施方式中,测序条形码包括10-50个碱基。例如,测序条形码的长度可以是约10、15、20、25、30、35、40、45或50个碱基。在一些实施方式中,可以合成第二链cDNA,使得在第二链中加入唯一分子标识符(UMI)序列。UMI可以是任何合适长度的任何合适的核酸序列。在一些实施方式中,第二条链可以包含UMI和测序柄两者。在第二链cDNA中加入这些额外的特征(例如引物结合位点、唯一分子标识符和/或测序柄)可以帮助未来的步骤,诸如在公开的方法中的未来的扩增、纯化或检测步骤。
在一些实施方式中,第二链cDNA可以在合成后被分离、纯化和扩增。例如,第二链cDNA可通过上述合适的方法(例如,使用随机引物)合成。在一些实施方式中,第二链cDNA可以通过经由0.1N NaOH、0.1N KOH,或者具有高pH的任何溶液和/或能使DNA变性的有机溶液的DNA变性来进行分离。在一些实施方式中,第二链cDNA可以通过热变性来分离。分离的第二链可以被纯化,然后通过PCR扩增。用于PCR扩增第二链cDNA的引物可以是任何合适的引物,包括针对添加到第二链cDNA的额外特征(例如引物结合位点、测序条形码、唯一分子标识符)的引物。在测序之前,可以进行任何适当数量的分离、扩增和纯化步骤,以生成最终的cDNA文库。
在一些实施方式中,用于初始捕获RNA(例如,mRNA)的捕获探针可以包含一个或多个额外的特征(例如,除了空间条形码和捕获域之外),以促进测序文库的制备。例如,捕获探针可以包含测序柄(例如,测序条形码)。因此,测序条形码的互补序列将存在于cDNA中。因此,由本文所述方法生成的cDNA可以包括两个不同的测序条形码。例如,该cDNA可以包括与ILLUMINA测序平台(例如TruSeq Read 1柄、TruSeq Read 2柄)兼容的一个或多个测序条形码。在一些实施方式中,cDNA包括一个或多个测序条形码、空间条形码和/或唯一分子标识符。这些额外的特征可以促进通过本文所述方法的文库制备、测序和RNA的空间检测。
在一些实施方式中,生成的cDNA可以被测序,在测序之前没有干预处理步骤。例如,在包括大量RNA的组织样品中,生成的cDNA可能产生足够数量的cDNA,从而可以直接测序。在其他实施方式中,可以期望在测序前生成双链cDNA和/或生成多个DNA拷贝。这种方法可以在cDNA与基板结合时进行,或将cDNA从基板中释放出来并随后处理以生成双链拷贝和/或扩增DNA。在一些实施方式中,可以期望在不增加双链DNA分子数量下生成双链DNA。在其他实施方式中,可以期望生成双链DNA并生成第二链的多个拷贝。例如,可以进行一次或多次扩增反应,以生成单链或双链DNA的多个拷贝。
在一些实施方式中,cDNA的生成(例如,通过对与捕获探针结合的RNA进行逆转录)可以在基板上进行,并且在随后的处理步骤之前,生成的cDNA可能从基板上释放出来。例如,cDNA可以在基板上生成,生成的DNA可以从基板上释放并收集在试管中。随后的步骤(例如第二链cDNA的合成、扩增、测序等)可以在溶液中进行。在一些实施方式中,RNA可以在随后的cDNA链处理之前被去除。例如,可以使用RNA消化酶(例如核糖核酸酶)去除RNA。在一些实施方式中,没有必要进行特定的RNA去除步骤,因为RNA会自然降解和/或组织从基板上的去除足以去除RNA。
在一些实施方式中,对组织样品中的核酸(例如RNA)进行空间检测的方法进一步包括对cDNA分子进行测序。cDNA分子可以在基板上进行测序,或者也可以在测序前被释放并收集到合适的装置(例如,管子)中。测序可以通过任何合适的方法进行。测序一般使用一个或多个扩增步骤,诸如聚合酶链式反应(PCR)来进行。在一些实施方式中,可以使用下一代测序方法进行测序。高通量测序在本文所述的方法中特别有用,因为它能在相对较短的时间段内对大量的核酸进行测序或部分测序。在一些实施方式中,可以使用ILLUMINA技术(例如,“边合成边测序”技术)进行测序。例如,测序反应可以基于可逆的染料终止剂,诸如在ILLUIMNA技术中使用。测序引物可以被添加到包含cDNA的样品中,并且引物可以与cDNA分子上的相应区域结合。引物的序列每次延伸一个核苷酸,每个核苷酸都包含荧光标签。在每个连续的核苷酸加入到生长链中后,特征性的荧光信号被确定,直到获得期望的序列数据。使用这种技术,数以千计的核酸可以同时在单个基板上进行测序。
在一些实施方式中,可以使用其他测序方法来确定cDNA分子的序列。例如,cDNA分子的序列可以通过焦磷酸测序来确定。在这种方法中,cDNA在油溶液中的水滴内被扩增(乳液PCR),每个水滴包含附着在涂覆有引物的单珠粒上单个cDNA模板,然后形成克隆菌落。测序机器包含许多孔,每个孔都包含单个珠粒和测序酶。焦磷酸测序使用荧光素酶生成光来检测添加到新生cDNA上的个体核苷酸,并且使用合并的数据生成序列读长。
在一些实施方式中,可以对全长的cDNA分子进行测序。在一些实施方式中,可以对少于全长的cDNA分子进行测序。所述方法不限于对每个cDNA分子的完整长度进行测序。例如,可以对cDNA分子每个端的前100个核苷酸进行测序,并用于鉴定所表达的基因。在一些实施方式中,可进行测序以确定空间条形码的序列和至少约20个碱基的RNA转录物的特定序列数据。例如,可以进行测序以确定空间条形码的序列和至少10、25、30、35、40、45、50个碱基的RNA转录物特定序列数据。可以获得额外碱基的RNA转录物的特定序列数据。例如,可以进行测序以确定空间条形码的序列和至少50、60、70、80、90或100个碱基的RNA转录物特定数据。
在一些实施方式中,用于空间检测组织样品中的核酸(例如RNA)的方法进一步包括在将基板与组织样品接触之前确定基板表面上的每个捕获探针簇的位置。在一些实施方式中,可以提供每个捕获探针簇的位置。例如,包括本文所述的基板的试剂盒可以包含关于基板上每个捕获探针簇的位置的信息。在一些实施方式中,确定在基板表面上每个捕获探针簇的位置包括确定每个簇中至少一个捕获探针的空间条形码,并将该序列分配到基板上的特定位置。
在一些实施方式中,基板表面上的每个捕获探针簇的位置是在基板本身的制造期间确定的。例如,可以通过将一种或多种捕获探针固定在基板表面(例如,通过与基板上的表面探针结合)并生成簇(例如,通过桥式扩增)来制造基板,如上所述。捕获探针可以包括空间条形码和捕获域,如上所述。在簇生成后,可以通过对基板上的捕获探针进行测序来确定在表面上的每个捕获探针簇的位置。例如,可以使用ILLUMINA***进行测序。尤其,可以利用靶向空间条形码的测序引物,并确定空间条形码的序列。每个簇的空间条形码的序列可以分配至在基板上的特定位置(例如,基板上的XY坐标),从该位置获得检测到的测序。在一些实施方式中,可以基于测序期间检测到的信号(例如,荧光信号)来生成基板的高分辨率图,并用于将XY坐标分配到基板上的每个簇。
在一些实施方式中,用于空间检测组织样品中的核酸(例如RNA)的方法进一步包括将每个测序的cDNA分子的空间条形码的序列与具有相应空间条形码的在基板上的捕获探针簇的位置相关联。第一链cDNA将包含与捕获探针相同的空间条形码,而第二链cDNA将包含与捕获探针空间条形码的互补序列。如本文所用的“对应”涵盖了这些可能性中的每一种,这取决于哪条cDNA链被测序。例如,如果对第二链cDNA进行测序,第二链cDNA的序列与具有互补空间条形码的在基板上的捕获探针簇的位置相关联。替代地,如果对第一链cDNA进行测序(例如,在对cDNA进行测序之前没有进行第二链合成和/或扩增的中间步骤),则第一链cDNA的序列与具有相同空间条形码的基板上的捕获探针簇的位置相关联。
在一些实施方式中,用于空间检测组织样品中核酸(例如RNA)的方法进一步包括在组织与基板接触后对组织进行成像。组织成像可以帮助确定组织样品中RNA分子的空间位置。在一些实施方式中,在生成cDNA之前对组织进行成像。在一些实施方式中,组织成像是在生成cDNA之后进行的。组织成像可以使用任何合适的技术,包括光、明场、暗场、相位衬度、荧光、反射、干涉、共焦显微术或其组合来进行。
在一些实施方式中,可以在流通池表面引入一个或多个框标。如本文所用的术语“框标”是指放置在成像***视野中的标记或物体,用作参考点或测量。例如,框标可以通过物理去除簇或通过覆盖遮挡捕捉域功能的阻断材料来产生。在测序后,光学图像和数字重建的转录物组图像两者中都可以检测到簇的物理去除或阻断。在一些实施方式中,框标可以用于比对光学图像和数字重建的转录物组图像。
用于空间检测组织样品中的核酸(例如RNA)的方法可以任选地包括在cDNA从基板中释放之前对cDNA分子进行成像。对cDNA分子进行成像可以帮助确定相应的RNA分子的空间位置,其中在组织样品中从该RNA分子生成cDNA分子。例如,第一链或第二链的cDNA分子可以在合成期间被标记,以有利于随后的成像。cDNA分子可以用直接可检测的标签或间接可检测的标签进行标记。直接可检测的标签是无需使用额外试剂即可直接检测的标签,而间接可检测的标签是通过应用一种或多种额外试剂可检测的标签,例如,该标签是由两种或更多种组分组成的信号产生***中的成员。示例性的直接可检测的标签包括荧光标签、着色标签(例如染料)、放射性同位素标签、化学发光标签等。任何分光光度法或光学可检测的标签都可以使用。在其他实施方式中,标签可能需要添加其他组分来生成信号。例如,该标签可以与信号提供分子缀合的分子结合。
在一些实施方式中,通过在合成cDNA时掺入标记的核苷酸对cDNA进行标记。标记的核苷酸可以在第一和/或第二链的合成中掺入。在特别优选的实施方式中,标记的核苷酸是荧光标记的核苷酸。因此,标记的cDNA可以通过荧光显微术进行成像。可以用于标记核苷酸的荧光分子在本领域是众所周知的,例如荧光素、花青染料,诸如Cy3、Cy5、Alexa 555、Bodipy630/650,等等。在一些实施方式中,荧光标记的CTP(诸如Cy3-dCTP、Cy5-dCTP)被掺入在基板表面合成的cDNA分子中。其他合适的标签包括染料、核酸染色剂、金属络合物等。
在一些实施方式中,基板可以包括标志物,以促进组织样品或其图像与基板上的捕获探针簇相关的定向。用于标记阵列的任何合适的方式都可以使用,以便在对组织样品进行成像时可以检测到它们。例如,生成信号(优选可见信号)的分子(例如荧光分子)可以直接或间接固定在阵列的表面上。优选的,该阵列包括位于基板表面不同位置的至少两个标志物,进一步优选至少3、4、5、6、7、8、9、10、12、15、20、30、40、50、60、70、80、90或100个标志物。在一些实施方式中,可以使用几百个或甚至几千个标志物。在一些实施方式中,可以使用数以万计的标志物。标志物可以以一种模式提供,例如,标志物可以构成捕获探针固定在基板的部分上的外边缘。也可以使用其他的信息模式,诸如分割阵列的线条。这样的标志物可以促进组织样品的图像与从标记的cDNA分子中检测到的信号(例如标记的cDNA分子的图像)和/或在基板上的捕获探针簇的位置比对。标志物可以在组织样品成像之前、同时或之后检测。在一些实施方式中,在组织样品成像时标志物是可被检测的。因此,可以在用于观察组织样品的相同成像条件下检测标志物。在一些实施方式中,在检测标记的cDNA时标志物是可被检测的。
在一些实施方式中,确定RNA分子在组织样品中的空间位置包括将在基板上的捕获探针簇的位置与组织样品中的相应位置关联。在一些实施方式中,RNA分子在组织样品中的空间位置可以是超高分辨率的,允许鉴定表达RNA分子的单细胞。
在一些实施方式中,本文描述的技术允许检测单细胞内亚细胞区室的基因表达。例如,本文所述的方法可以允许对包括单细胞的细胞核、细胞质和/或线粒体在内的亚细胞区室的基因表达(例如RNA表达)进行超高分辨率的研究。例如,mRNA在细胞核中被转录和多聚A被修饰。在它能够被运送到细胞质之前,将它拼接,并且去除内含子序列。因此,细胞核区将具有较高浓度的未拼接的mRNA序列,而细胞质区域将具有较高浓度的拼接的mRNA序列。可以利用这种差异来研究单个细胞中细胞核与细胞质的各种序列的表达。例如,可以结合本文所述的方法(例如结合样品中RNA表达的空间检测方法)对拼接和未拼接的转录物进行绘图,以确定RNA(例如mRNA)表达的细胞核-细胞质结构。作为另一种实例,线粒体的表达可以通过研究线粒体编码的基因转录物来确定。在实施例2中描述了研究细胞核、细胞膜和/或线粒体表达模式的合适方法。在一些实施方式中,标记质膜和细胞表面蛋白的抗体或其他分子探针可以用来标记细胞边界,从而实现精确的单细胞分割。在一些实施方式中,将光学图像,包括荧光图像,用于单细胞分割。在一些实施方式中,本文描述的技术可以用于研究基于在特定组织类型内的区的各种细胞群。例如,不同的区标志物(例如,诸如肝细胞)可以用于鉴定特定区内的基因表达,如实施例2中所述。标志物的其他合适的组合可以用于研究所期望区域和/或亚细胞区室的基因表达。
在有代表性的实施方式中,本文所述的方法可以包括以下步骤的每一个(无特定顺序):
a.提供本文所述的基板;
b.确定在基板上每个簇中至少一个捕获探针的空间条形码序列;
c.基于空间条形码的序列,在基板上为每个簇分配位置(例如,XY坐标);
d.使基板与组织样品接触,并且允许组织样品中的RNA分子与捕获探针结合;
e.当样品与基板结合时,对组织样品进行成像;
f.从与捕获探针结合的RNA分子中生成cDNA分子;
g.确定cDNA分子的空间条形码序列,并将此序列与基板上的相应簇(例如,包含相应空间条形码的捕获探针簇)的位置关联;
h.将基板上相应的捕获探针簇的位置与组织样品中的相应位置关联,从而鉴定样品中RNA(例如基因)表达的空间位置。
在有代表性的实施方式中,本文所述的方法可以包括以下步骤的每一个(无特定顺序):
a.提供本文所述的基板;
b.确定在基板上每个簇中至少一个捕获探针的空间条形码序列;
c.基于空间条形码的序列,在基板上为每个簇分配位置(例如,XY坐标);
d.使基板与组织样品接触,并且允许组织样品中的RNA分子与捕获探针结合;
e.当样品与基板结合时,对组织样品进行成像;
f.从与捕获探针结合的RNA分子生成第一链cDNA分子(例如,通过逆转录);
g.从第一链cDNA分子中生成、分离、纯化并扩增第二链cDNA分子,从而从每个第一链cDNA分子中生成多个第二链cDNA分子;
h.确定第二链cDNA分子的空间条形码的序列,并将此序列与基板上的相应簇(例如,包含与第二链cDNA的空间条形码的互补空间条形码的捕获探针簇)的位置关联;
i.将基板上相应的捕获探针簇的位置与组织样品中的相应位置关联,从而鉴定样品中RNA(例如基因)表达的空间位置。
对cDNA分子进行测序可以确定组织样品中的基因表达,因为cDNA被认为是表明组织中RNA在组织被分离时的表达。因此,确定cDNA分子的空间条形码序列所对应的组织内的位置,允许对组织样品中的RNA表达进行局部的、空间的检测。在一些实施方式中,本文所述的方法具有足够高的分辨率,能够确定在单细胞中的基因表达。
在一些实施方式中,这些方法可以进一步包括分析组织样品中一个或多个额外的靶标,诸如与基板上的额外捕获部分结合的靶标的存在。例如,该方法可以进一步包括确定该组织样品是否额外包含一个或多个目的蛋白,该目的蛋白可以由与在基板上的捕获部分缀合的抗体检测到。在一些实施方式中,基板上的额外捕获部分的位置可以是已知的,并且因此用于确定组织样品中额外靶标的相应位置。例如,基板上额外捕获部分的位置可以基于捕获探针簇的位置获知,额外捕获部分整合在捕获探针中。
本文所述的方法和基板可以用于测定任何合适的组织样品中的基因表达。该组织可以是新鲜的或冷冻的。在一些实施方式中,组织可以是固定的(例如***固定)。
在一些方面,本文提供了用于空间检测组织样品中RNA的方法的试剂盒。在一些实施方式中,试剂盒包括如本文所述的基板。例如,试剂盒可以包括基板,该基板包括固定在基板表面上的如本文所述的多个捕获探针。在一些实施方式中,基板上的每个捕获探针包括捕获域和空间条形码。在一些实施方式中,多个捕获探针被布置成簇,其中每个簇包括多个捕获探针,在簇中的每个捕获探针包括相同的空间条形码,并且每个簇的空间条形码是唯一的。
在一些实施方式中,试剂盒进一步包括用于空间检测组织样品中RNA的额外试剂。例如,试剂盒可进一步包括用于生成cDNA、在基板上组织样品和/或cDNA的成像和/或cDNA测序的额外试剂。例如,试剂盒可以进一步包括酶(例如逆转录酶、连接酶等)、dNTP、缓冲剂、核糖核酸酶抑制剂、引物、探针、标签(例如荧光染料)等。在一些实施方式中,试剂盒进一步包括用于空间检测组织样品中DNA的额外试剂。在一些实施方式中,试剂盒进一步包括用于空间检测特定细胞和组织水平特征的额外试剂,该试剂可以与特定的核酸序列,诸如由核酸缀合的抗体检测的蛋白缀合。试剂盒的各个成员部件可以物理上包装在一起,或单独包装。试剂盒还可以包括使用试剂盒部件的说明书。说明书是与试剂盒相关的材料或方法。说明书可以与试剂盒一起提供,或作为单独的成员部件提供,可以是纸质形式,或是电子形式,可以在计算机可读存储器装置上提供,或从互联网网站上下载,或作为录制的演示。应当理解,本公开的试剂盒可以与本文所述的基板、方法和***结合使用。
本文进一步提供了可以用于收集、存储和/或显示关于样品中RNA空间位置的信息的***。这样的***可以与本文所述的基板、方法或试剂盒结合使用。在一些实施方式中,***包括含有执行本文所述方法中一个或多个步骤的指令的软件。例如,***可以包括旨在执行cDNA成像、组织成像、执行PCR、执行测序等的软件。在一些实施方式中,***包括存储器,用于存储在如本文所述方法的一个或多个步骤中收集的数据。例如,存储器可以存储由如本文所述方法收集的测序和/或成像数据。在一些实施方式中,***包括计算机(例如,控制器),它可以包括软件和/或存储器部件。
示例性的基板以及制作和使用这些基板的方法在Cho et al.,(2021)Cell184.3559-3572中提供,其全部内容出于所有目的通过援引并入本文。
实施例
实施例1
将包含高密度分子标识符(HDMI)、寡聚dT域和裂解域(Xba1或Dra1限制性位点)的捕获探针固定在玻璃载玻片的表面上。探针包含ILLUMINA P5或P7序列,并且通过与载玻片表面上相应的表面探针的相互作用来结合到玻璃载玻片的表面上。捕获探针通过桥式扩增进行扩增,导致在玻璃载玻片表面生成多个捕获探针簇。产生的基板包括数百万个簇,每个簇都包含相同的空间条形码(例如HDMI序列)。
P5域可以从基板上裂解,并且可以进行一个或多个洗涤步骤,只留下具有与基板结合的P7域的捕获探针。替代地,P7域可以从基板上裂解,并可以进行一个或多个洗涤步骤,只留下具有与基板结合的P5域的捕获探针。
在裂解P5或P7域后,可进行测序以确定每个簇的HDMI序列。可以使用序列将每个簇分配到在基板上的特定位置。
在扩增和确定HDMI序列后,可以暴露寡聚dT尾。例如(图4A),可以通过加入合适的限制性酶(例如Xba1)切割裂解域来暴露寡聚dT尾,并且可以进行一个或多个洗涤步骤(例如NaOH洗涤)或酶解步骤(例如外切核酸酶消化)。得到的捕获探针包括与载玻片表面结合的P5(或P7域)、HDMI序列和暴露的寡聚dT尾。在第二实例中(图4B),可以通过编码寡聚dA(oligo-dA)序列段的独立寡核苷酸的杂交在HDMI序列上合成寡聚dT尾。在第三实例中(图4C),HDMI序列簇可以通过PCR或等温扩增复制到新的基板中,该基板可以被进一步处理以暴露出寡聚dT尾。
图7示出了包含捕获探针簇的示例性载玻片。捕获探针的寡聚dT尾被暴露出来,并且在荧光标记的脱氧核苷酸(Cy3-dCTP)的存在下,用从小鼠肝脏纯化的1ug总RNA对载玻片进行逆转录(RT)反应。Cy3-dCTP在RT反应期间被掺入到HDMI分子中。这导致所有HDMI簇中出现非常明亮的Cy3染色(图7),表明这些簇适用于合成cDNA和后续分析。
实施例2
实验程序
第一部分:实验实施
种子HDMI-寡核苷酸文库的生成
本文描述的方法从生成HDMI-寡核苷酸种子文库开始(图8A和9A)。在本报告中,使用了两个版本的文库——HDMI-DraI和HDMI32-DraI,其序列在下面提供。这两个文库具有相同的骨架结构,但HDMI序列的长度不同。HDMI是随机的核苷酸的序列,是用Cutfree软件设计的,以避免DraI消化位点[52]。HDMI32-DraI是HDMI-DraI的改进版本;但是,在肝脏和结肠研究中,使用了HDMI-DraI。HDMI-DraI是由IDT生成的作为Ultramer寡核苷酸,而HDMI32-DraI是由Eurofins生成的作为Extremer寡核苷酸。
骨架:(P5序列)(TR1:TruSeq Read 1)(HDMI)(HR1:HDMI Read 1)(寡聚dT)(DraI)(DraI接头)(P7序列)。
HDMI-DraI:
CAAGCAGAAGACGGCATACGAGATTCTTTCCCTACACGACGCTCTTCCGATCTNNVNNVNNVNNVNNVNNNNNTCTTGTGACTACAGCACCCTCGACTCTCGCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTAAAGACTTTCACCAGTCCATGATGTGTAGATCTCGGTGGTCGCCGTATCATT(SEQ ID NO:1)
HDMI32-DraI:
CAAGCAGAAGACGGCATACGAGATTCTTTCCCTACACGACGCTCTTCCGATCT
NNVNBVNNVNNVNNVNNVNNVNNVNNVNNNNNTCTTGTGACTACAGCACCCTCGACTCTCGCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTAAAGACTTTCACCAGTCCATGATGTGTAGATCTCGGTGGTCGCCGTATCATT(SEQ ID NO:2)
HDMI-寡核苷酸簇生成和通过MiSeq进行测序(1st-Seq)
将HDMI-DraI或HDMI32-DraI用作ssDNA文库,并在MiSeq中通过使用Read1-DraI作为定制的Read1引物来进行测序。Read1-DraI的序列提供如下。
Read1-DraI:
ATCATGGACTGGTGAAAGTCTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGCGAGAGTCGAGGGTGCTGTAGTCACAAGA(SEQ ID NO:3)
Read1-DraI具有覆盖HDMI-DraI和HDMI32-DraI ssDNA文库的HR1、寡聚dT、DraI和DraI-接头序列的互补序列。
首先,使用MiSeq v2纳米平台对文库进行测序,滴定ssDNA文库的浓度,以生成最大可能多的数量的确信测序的HDMI簇(图11A和11B)。经过几轮的优化,以100pM加载HDMI-DraI,同时以60-80pM加载HDMI32-DraI。在实际实施中,使用MiSeq v3常规平台。MiSeq在手动模式下进行:25bp单端读取(对于HDMI-DraI)或37bp单端读取(对于HDMI32-DraI)。MiSeq的运行在第一次读取后立即完成,并且没有变性或重新合成的步骤。流通池(例如基板)在单端读取步骤完成后立即被回收。MiSeq结果以FASTQ文件提供,该文件具有HDMI序列(后接TR1中的5-碱基接头序列)。在本实施例中的所述方法中使用的所有MiSeq结果中,接头序列的一致性超过96%。使用Illumina测序分析查看器可视化的簇的缩略图像被用来检查簇的形态和密度(图10A,11A和11B)。
HDMI序列包含20-32个随机核苷酸,其可以产生2600亿(在HDMI-DraI中的20-mer)或1百万的三次方(quintillion)(在HDMI32-DraI中的32-mer)不同序列。尽管MiSeq鉴定了超过3000万个HDMI簇,但是由于这种极端的多样性,HDMI序列的重复率极低(低于总HDMI测序结果的0.1%)。
MiSeq具有总计38个矩形成像区,被称为“块(tile)”。19个块在流通池的顶部,而另外19个块在流通池的底部(图11C;块2101-2119)。对于每个测序输出,可以在MiSeq的FASTQ输出文件中找到块编号和序列来源的簇的XY坐标。只有底部的块被用于分析,因为顶部的块在流通池的拆卸期间被破坏。
将MiSeq流通池处理成HDMI阵列
在1st-Seq之后,MiSeq流通池被进一步处理,将含有HDMI的簇转换成可以捕获从组织中释放的mRNA的HDMI-阵列(图8D)。从MiSeq运行中获取的流通池用无核酸酶水洗涤3次。然后用DraI酶混合物(在1XCutSmart缓冲液中的1U DraI酶(#R0129,NEB))处理流通池,于37℃过夜,以完全切断P5序列并暴露出寡聚dT。然后将外切核酸酶I混合物(在1X Exo I缓冲液中的1U Exo I酶(#M2903,NEB))负载流通池,于37℃下45min,以消除P5引物坪和其他非特异性ssDNA。P7结合的HDMI-DraI寡核苷酸将与Read1-DraI形成双链体,因此将受到保护以免受Exo I消化。然后将流通池用水洗涤3次,用0.1N NaOH洗涤3次(每次在室温下温育5min,以使Read1-DraI引物变性并消除),用0.1M Tris(pH7.5,以中和流通池通道)洗涤3次(每次短暂洗涤),并且然后用水洗涤3次(每次短暂洗涤)。
拆卸HDMI阵列
然后拆卸流通池,使HDMI阵列暴露在外面并且可以附着到组织切片上。为了保护HDMI-阵列,在拆卸前将琼脂糖水凝胶(BP160,Fisher)用于填充流通池通道(用于结肠数据集)。在水中制备1.5%的琼脂糖悬浮液,并在95℃温育1min。将得到的1.5%融化的琼脂糖溶液负载流通池,并冷却以使凝胶凝固。使用碳化钨尖端划线器(IMT-8806,IMT),对通道的所有边界线(对应于成像区域)刻痕。将边界内的附加线刻痕,以帮助将玻璃断开成小块。然后,在刻痕线周围施加压力,以将玻璃断开。然后,通过用水洗涤去除玻璃颗粒和琼脂糖碎片。然后,顶部暴露的流通池(HDMI-阵列;图11U,左)已准备好用于组织附着。拆卸过程可以用用过的MiSeq流通池进行实践,这些流通池可以作为常规测序的副产品获得。在实践之后将流通池拆卸,可以用DNA染料诸如SYBR Gold染色来检查簇阵列的质量。作为参考,提供了最小阵列损伤的拆卸流通池的示例性SYBR Gold染色图像(图11U,右)。关键是要避免损害HDMI簇阵列的划痕。
组织样品
肝脏和结肠样品来自最近的研究[32,53]。肝脏采集自8周龄的对照(Depdc5F/F/Tsc1F/F,雄性)和TD(Alb-Cre/Depdc5F/F/Tsc1F/F,雌性)小鼠[32]。结肠来自8周龄大的C57BL/6野生型雄性小鼠[53]。
组织切片、附着和固定
在低温恒温器(Leica CM3050S,-20C)中以5°切割角度和10μm厚度对OCT固定的新鲜冷冻组织进行切片。将组织从切割台上移到HDMI阵列上(图8E)。将组织-HDMI-阵列夹层移至室温,并将组织固定在4%的甲醛(100μl,由EM级的16%多聚甲醛(#15170,ElectronMicroscopy Sciences)稀释而成)中10min。
组织成像和mRNA释放
将组织在100μl异丙醇中温育1min,并且然后用80μl苏木精(S3309,Agilent)染色5min。用水洗涤后,用80μl发蓝缓冲液(CS702,Agilent)处理组织1min。用水洗涤后,用缓冲的伊红(1:9=伊红(HT110216,Sigma)):0.45MTris-乙酸缓冲液(pH 6.0))处理组织。用水洗涤后,将组织干燥并安装在85%的甘油中。然后在光学显微镜下对组织进行成像(MT6300,Meiji Techno)。为了从固定的组织中释放RNA,用0.2U/uL胶原酶I在37℃下处理组织20min,并然后用在0.1M HCl中的1mg/mL胃蛋白酶在37℃下处理10min,如以前所述[7]。
逆转录
用40μl 1X RT缓冲液洗涤组织,该RT缓冲液包含8μl Maxima 5x RT缓冲液(EP0751,Thermofisher)、1μl核糖核酸酶抑制剂(30281,Lucigen)和31μl水。随后,通过在40μl RT反应溶液中温育组织附着的HDMI-阵列来进行逆转录(图8F和9B),该RT反应溶液包含8μl Maxima 5x RT缓冲液(EP0751,Thermofisher)、8μl 20% Ficoll PM-400(F4375-10G,Sigma)、4μl10mM dNTP(N0477L,NEB)、1μl核糖核酸酶抑制剂(30281,Lucigen)、2μlMaxima H-核糖核酸酶(EP0751,Thermofisher)、4μl放线菌素D(500ng/μl,A1410,Sigma-Aldrich)和13μl水。RT反应溶液在42℃下温育过夜。
组织消化
第二天,去除RT溶液,并且将组织浸入外切核酸酶I混合物(在1X Exo I缓冲液中的1U Exo I酶(#M2903,NEB)),并在37℃下温育45min,以消除未与mRNA杂交的DNA。然后去除混合物,并且将组织浸入1x组织消化缓冲液(100mM Tris pH 8.0、100mM NaCl、2% SDS、5mM EDTA、16U/mL蛋白酶K(P8107S,NEB))中。将组织在37℃下温育40min。
二级链的合成和纯化
组织消化后,将HDMI-阵列用水洗涤3次,用0.1N NaOH洗涤3次(每次在室温下温育5min),用0.1M Tris(pH7.5)洗涤3次(每次短暂洗涤),并且然后用水洗涤3次(每次短暂洗涤)。这将消除HDMI-阵列上的所有mRNA。
洗涤步骤后,二级链合成混合物(18μl水、3μl NEBuffer-2,3μl 100μMTruseqRead2-缀合的随机引物,随机引物具有TCA GAC GTG TGC TCT TCC GAT CTN NNNNNN NN序列(SEQ ID NO:4)(IDT)、3μl 10mM dNTP混合物(N0477,NEB)和3μl KlenowFragment(缺失外切核酸酶;M0212,NEB)。然后将HDMI-阵列在37℃下在湿度控制室中温育2小时。
二级链合成后(图8G),将HDMI-阵列用水洗涤3次,以去除从HDMI-阵列上脱落的所有DNA,使得每个HDMI分子可以对应二级链的每个单拷贝。然后用30μl 0.1N NaOH处理HDMI-阵列以洗脱二级链。重复进行洗脱步骤,以收集总计60μl的二级链产物。将60μl二级链产物与30μl 3M醋酸钾(pH5.5)混合中和。
用水将中和的二级链产物的体积增加到100μl。然后根据制造商的说明,用1.8X珠粒/样品的比率对溶液进行AMPure XP纯化(A63881,Beckman Coulter)。使用40μl水进行最终洗脱。
文库构建和测序(2nd-Seq)
以40μl二级链产物为模板,以2μM的正向(TCT TTC CCT ACA CGA CGC*T*C(SEQ IDNO:5))和反向(TCA GAC GTG TGC TCT TCC*G*A(SEQ ID NO:6))引物,使用Kapa HiFiHotstart Readymix(KK2602,KAPA Biosystems)在100μl反应体积中进行第一轮文库PCR。PCR条件:95℃ 3min,13-15个循环(95℃ 30秒,60℃ 1min,72℃ 1min),72℃ 2min和4℃无限时。PCR产物用AMPure XP以1.2X珠粒/样品的比率进行纯化。
以10μl的2nM第一轮PCR产物为模板并且以1μM的正向(AAT GAT ACG GCG ACC GAGATC TAC ACT CTT TCC CTA CAC GAC GCT CT*T*C(SEQ ID NO:7))和反向(CAA GCA GAAGAC GGC ATA CGA GAT[8-mer index sequence]GTG ACT GGA GTT CAG ACG TGT GCT CTTCC*G*A(SEQ ID NO:8))引物,使用Kapa HiFi Hotstart Readymix(KK2602,KAPABiosystems)在100μl反应体积中进行第二轮文库PCR(图8H)。PCR条件:95℃ 3min,8-9个循环(95℃ 30秒,60℃ 30秒,72℃ 30秒),72℃2min和4℃无限时。根据制造商的建议,使用Zymoclean Gel DNA Recovery Kit(D4001,Zymo Research)对400-850bp大小的所有产物进行琼脂糖凝胶洗脱来纯化PCR产物。然后用AMPure XP以0.6X-0.7X珠粒/样品的比率进一步纯化洗脱的产物。合并的文库在AdmeraHealth Inc.、Psomagen Inc.和北京基因组研究所的Illumina和BGI平台上进行双端(100-150bp)测序。HDMI发现图评估表明,所有的测序平台都能很好地分析最终输出数据。
cDNA标记试验
为了标记HDMI阵列上的cDNA,所有的步骤与上述相同地进行,只是在mRNA释放后,对HDMI阵列进行cDNA标记检测,而不是文库生成程序[7]。在mRNA释放之后,将组织附着的HDMI阵列在40uL荧光逆转录溶液中温育,该逆转录溶液包含13μl水、8μl Maxima 5x RT缓冲液(EP0751,Thermofisher)、8μl 20% Ficoll PM-400(F4375-10G,Sigma)、0.8μl 100mMdATP(来自0446S,NEB)、0.8μl 100mM dTTP(来自0446S,NEB)、0.8μl 100mM dGTP(来自0446S,NEB)、0.1μl 100mM dCTP(来自0446S,NEB)、1.5μl 6.45mM Cy3-dCTP(B8159,APExBIO)、1μl核糖核酸酶抑制剂(30281,Lucigen)、4μl放线菌素D(500ng/μl,A1410,Sigma-Aldrich)和2μl Maxima H-RTase(EP0751,Thermofisher)。在42℃下进行逆转录过夜。
然后去除混合物,并且将组织浸入1x组织消化缓冲液(100mM Tris pH 8.0、100mMNaCl、2% SDS、5mM EDTA、16U/mL蛋白酶K(P8107S,NEB))中。在37℃下温育组织40min。用水洗涤HDMI-阵列表面3次后,在80%的甘油中固定,并且然后在荧光显微镜(Meiji)下观察。
UMI编码的HDMI阵列的生成和测试
使用HDMI-TruEcoRI文库生成了UMI编码的HDMI阵列,该文库与上述的ssDNA库相似,但没有寡聚dT序列(图9F)。
骨架:(P5序列)(TR1:TruSeqRead1)(HDMI)(HR1B:HDMIRead1B)(EcoRI)(EcoRI接头)(P7序列)
HDMI-TruEcoRI:
CAAGCAGAAGACGGCATACGAGATTCTTTCCCTACACGACGCTCTTCC
GATCT
HNNBNBNBNBNBNBNBNNNNCCCGTTCGCAACATGTCTGGCGTCATAGAATTCCGCAGTCCAGGTGTAGATCTCGGTGGTCGCCGTATCATT(SEQ ID NO:9)
在运行MiSeq时,使用Read1-EcoRI作为read 1引物。
骨架:(EcoRI接头)(EcoRI)(HR1B)
Read1-EcoRI:CTGGACTGCG GAATTC TATGACGCCAGACATGTTGCGAACGGG(SEQ ID NO:10)
使用MiSeq v2 nano平台在100pM的浓度下测序文库,并且每mm2生成140万个测序的HDMI簇。使用Read1-EcoRI作为定制的Read 1引物以手动模式进行MiSeq,25bp单端读取。在完成单端读取步骤后,立即回收流通池。MiSeq结果以FASTQ文件提供,该文件具有HDMI序列(后接TR1中的5-碱基接头序列)。
然后对MiSeq流通池进行处理,以将UMI和寡聚dT序列附着在HDMI簇上。将流通池用水洗涤3次,然后加载EcoRI-HF混合物(在1X CutSmart NEB缓冲液中的1U EcoRI-HF(R3101,NEB))以切割出P5序列。在37℃下过夜温育后,将流通池用水洗涤3次,用0.1N NaOH洗涤3次(每次在室温下温育5min),用0.1M Tris(pH 7.5)洗涤3次,并且然后用水洗涤3次。然后用含有5μM的UMI-寡核苷酸(序列见下文)的1X Phusion Hot Start II High-Fidelity Mastermix(F565S)加载流通池。
骨架:(寡聚dA)(UMI)C(HR1B)
UMI-寡核苷酸:AAAAAAAAAAAAAAAAAAAAAAAAAAAAAANNNNNNNNCTATGACGCCAGACATGTTGCGAACGGG(SEQ ID NO:11)
然后以95℃ 5min、60℃ 1min和72℃ 5min温育流通池。然后,用外切核酸酶I混合物(组合物参见上文)加载流通池,并在37℃下温育45min。然后用水洗涤流通池3次,用0.1NNaOH洗涤3次(每次在室温下温育5min),用0.1M Tris(pH 7.5)洗涤3次,并且然后用水洗涤3次。这样就完成了编码UMI的HDMI-阵列的生成。
使用从小鼠肝脏中纯化的2μg总RNA测试了编码UMI的HDMI-阵列的性能,使用与上述相同的逆转录和文库制备方法(但没有组织切片)。在Illumina HiSeqX和HiSeq4000平台上对从总肝脏RNA和编码UMI的HDMI-阵列制备的文库进行了测序。
免疫组织化学法
对于免疫组织化学法,用4%多聚甲醛固定冷冻的肝脏切片,用1%的BSA、在DPBS中0.01%的Triton X-100封闭,并且用检测指定蛋白的第一抗体进行温育,然后用Alexa荧光缀合的第二抗体和DAPI进行染色。免疫荧光在尼康(Nikon)A1共聚焦显微镜下检测。
第II部分。数据的计算分析。
输入数据
存在三个实验输出,作为下游计算分析的输入数据。(1)来自1st-Seq的HDMI序列、块和空间坐标信息;(2)结合来自2nd-Seq的cDNA序列的HDMI序列;以及(3)从组织切片的H&E染色得到的组织学图像。
组织边界的估计
为了估计组织边界,HiSeq数据根据它们的HDMI序列被加入到MiSeq数据中。因此,对于从MiSeq中找到它的HDMI的HiSeq数据的每一个,都分配了块号和XY坐标。最后,使用自定义的python代码,生成了HDMI发现图,以可视化在每个块的特定XY空间中的HiSeq HDMI密度(图9C)。将密度图手动分配到相应的H&E图像(图10C、图11D和图11E)。
读长比对和数字基因表达矩阵的生成
使用STAR/STARsolo 2.7.5c(Dobin et al.,2013)进行读长比对,从中生成数字基因表达(DGE)矩阵。从MiSeq数据中,提取了位于底层块上的簇的HDMI序列,并在反向互补转换后作为细胞(HDMI)条形码的“白名单”。HiSeq数据Read1的前20个(HDMI-DraI版本)或30个(HDMI32-DraI)碱基对被认为是细胞(HDMI)条形码。使用在STARsolo(1MM_multi)中实施的默认错误纠正方法进行HDMI的分配。有关空间条形码分配和错误纠正方法的细节将在下面单独章节中描述。
由于二级链合成后的大量洗涤步骤,预计每个单分子的HDMI-cDNA杂交体都会在文库中产生一个二级链。因此,Read2序列的第一个9-mer来自随机引物序列,可以作为唯一分子标识符(UMI)的代表。因此,HiSeqRead2数据的前9个碱基对被复制到Read1中,并作为唯一分子标识符(UMI)。Read2在30端处进行修剪,以去除长度为10或更大的多聚A尾,并且然后使用Genefull选项(没有长度阈值并且没有细胞过滤)来与小鼠基因组(mm10)进行比对(图9D)。对于无法通过Genefull选项监测其表达的基因,使用Gene选项来生成基因表达发现图谱。使用在STARsolo(1MM_All)中实施的默认误差校正方法对UMI进行重复去除,其中相互之间有1个错配距离的所有UMI被折叠(即计数一次)。
为了进行饱和度分析,使用2nd-Seq结果的25%、50%和75%的子集进行多个读长比对。在Graphpad Prism 8(Graphpad Software,Inc.)中,将比对输出值绘制成图表(图S2I),以生成饱和度曲线。将双曲线回归用于估计在肝脏(60,292,407至96,899,822;95%置信区间)和结肠(308,586,493至510,224,639;95%置信区间)Seq-Scope文库中的总唯一转录物数量。
空间条形码的错误纠正方法
虽然每个碱基出错的可能性很低,但Seq-Scope涉及到对序列和DNA样品的多步骤处理,因此HDMI条形码中可能有小的但不可忽略的部分将包含错误。例如,在整个1st-Seq和2nd-Seq步骤中没有任何错误的“完美条形码测序”的概率(详见下文)估计为92.3%,其余的读长可能导致对正确的条形码分配的挑战。然而,在测序错误的随机假设下,估计只有<1%会有多个错误,并且错误纠正程序对整个1st-和2nd-Seq步骤中偶尔出现的错误是稳健的。在目前的研究中,错误纠正和HDMI条形码的解复用是在STARsolo中进行的,使用2nd-Seq结果作为FASTQ输入,和1st-Seq结果作为条形码白名单。使用STARsolo的默认选项(1MM_multi),它实现了类似于10X CellRanger 2.2.0的稳健的统计错误纠正方法。在这种方法中,允许HDMI有一个错配,并且当出现多个错配序列时,使用后验概率计算来选择条形码。
在经验评价中,当没有采用错误纠正方法时,13.3%(肝脏)和5.1%(结肠)的HDMI条形码在1st-和2nd-Seq之间不再匹配。这与预期的7.7%的错误率相当,并且表明所采用的错误纠正方法极大地挽救了潜在的假阴性。另一方面,错误纠正仅引入了可忽略不计的假阳性。使用错误纠正,将1st-和2nd-seq之间的假阳性HDMI匹配的总分数估计为0.2%(肝脏数据)和0.7%(结肠数据)。因此,Seq-Scope程序与标准的错误纠正方法相结合,对产生假阳性的条形码分配是稳健的,并且同时也从数据集中挽救了大量的假阴性条形码。
Seq-Scope过程中PCR和测序错误的潜在来源
在整个Seq-Scope程序中,有三个潜在的错误来源。1st-Seq簇生成步骤、1st-Seq测序步骤、以及2nd-Seq文库预处理和测序步骤。
1st-Seq簇的生成(2.3%)。尽管HDMI条形码是在单链寡核苷酸文库中随机生成的,但它们是在流通池表面扩增的,因此在簇中的每个条形码都有相同的HDMI序列。基于DNA聚合酶的高保真度,在簇生成过程期间引入的错误预计将是最小的。为了估计簇生成期间复制错误的程度,使用了PCR保真度估计器。经过Bst DNA聚合酶25个循环的固相等温扩增(错误率设定为10-4),其生成每个簇包含HDMI(20-mer核苷酸)的分子的大约1000个拷贝,估计97.7%的分子将没有错误,并且只有2.27%的分子将具有单个错误。具有多个错误的HDMI序列将少于0.03%。因此,预计在单个簇中的大多数HDMI序列都是没有错误的。
1st-Seq测序步骤(3%):在测序步骤期间也可能引入错误;然而,众所周知,Illumina SBS是最可靠的高通量测序技术之一。在1st-Seq期间,通过实时分析(Real TimeAnalysis,RTA)提供的算法对簇进行了严格的过滤。只有通过过滤器的簇(PF簇)才被用于坐标分配。随机创建的HDMI序列产生了高的且均衡的碱基多样性,这使得在高密度的文库加载条件下可以进行高质量的测序。因此,Q30率(具有>99.9%碱基调用准确率)非常高,在超过96%处(肝脏1st-Seq为96.89%,和结肠1st-Seq为96.21%)。Q20率(具有>99%碱基调用准确率)甚至高于99%(肝脏1st-Seq为99.4%,和结肠1st-Seq为99.2%)。在超过99%的所有测序簇中,每个测序位置的碱基组成与预期的HDMI测序模式(NNNNNBNNBNNBNNBNNBNN)完全一致(图11Q);肝脏1st-Seq为99.08%,和结肠1st-Seq为99.09%)。基于目前的Q30和Q20比率,20-mer HDMI的1st-Seq测序总错误率估计为3%。
2nd-Seq文库制备和测序步骤(2.4%):在二级链合成、基于PCR的文库扩增和2nd-Seq测序读长期间,可能会引入少量的条形码错误。基于这些程序的性质,与其他现有的ST或scRNA-seq方法相比,预计Seq-Scope不会产生大量的错误。例如,外切核酸酶缺陷的Klenow酶每10,000个碱基产生1个错误。因此,20个碱基的HDMI的错误率将低于0.2%。我们用于文库扩增的KAPAHIFI酶具有极低的错误率(每3.6 3 106个碱基有1个错误),所以即使经过21-25个总的扩增循环,20个碱基的HDMI的错误率将再次低于0.2%。最后,如果假定每个HDMI在2nd-Seq中只在Q30处测序(>99.9%的准确率),将有2%的机会在序列中产生错误。因此,在2nd-Seq步骤中产生的总错误估计为约2.4%。
总的错误率(7.7%)是通过增加每个步骤的所有可能的错误率来估计的:1st-Seq簇生成(2.3%)+1st-Seq测序(3%)+2nd-Seq文库准备和测序(2.4%)。因此,92.3%的最终HDMI序列被估计为没有错误。然而,在真实的实验中,每个步骤的实际错误率可能会有所不同;因此,预计与这个数值会有很大的差异。最重要的是,这些条形码错误不太可能产生假阳性,因为来自1st-Seq的白名单是用于分配空间条形码的。这些错误大多会造成一小部分假阴性,这些假阴性问题不大,并且可以通过错误纠正(见下文)和/或额外的测序来恢复。
错误纠正期间的假阴性和假阳性空间分配的估计
为了估计由流程纠正的错配错误率,在没有错误纠正方法的情况下进行了空间HDMI分配(w/o纠正)。去除错误纠正(w/o纠正)后,空间分配(白名单)的唯一转录物总数减少了13.3%(肝脏;在图11S中L至L)和5.1%(结肠;在图11S中C至C)。这些比率将等于被错误纠正所拯救的假阴性条形码分配率。目前的算法不会纠正多重错误的比率,多重错误的比率可以估计比这些比率低得多(0.3%至3%)。假阳性的空间分配可能会有更多的问题,并且也应该尽可能地避免。为了了解潜在的假阳性空间分配的程度,我们进行了互换的错误分配分析——使用结肠1st-Seq白名单(L至C)分析肝脏2nd-Seq结果,预计没有正确匹配的HDMI。同样,使用肝脏1st-Seq白名单(C至L)分析结肠2nd-Seq结果。在错配分析中,选择了从测序仪的不同通道获得的肝脏和结肠的2nd-Seq结果,并且用来消除在两个数据集之间的潜在干扰。与正确分配的数据集(设定为100%;L至L和C至C)相比,错误分配的数据集呈现出0.2%(L至C)和0.7%(C至L)的空间分配率,两者几乎可以忽略不计(图S2H)。因此,假阳性的空间分配率估计低于1%。所有这些分析表明,超过99%的Seq-Scope数据在空间分配中是准确的。
拼接和未拼接基因表达的分析
为了获得拼接和未拼接转录物的单独读长计数,使用了Starsolo软件中的Velocyto[55]选项(图9E)。所有拼接或未拼接的mRNA读长被绘制在成像空间上,以确定细胞核-细胞质结构(见下文“空间基因表达的可视化”)。为了检验细胞核-细胞质图像的统计学意义,将所有基因随机分为三组,并独立获得拼接和未拼接的读长计数。在NIH ImageJ中使用Just Another Colocalization Plugin(JACoP)[56],将由在各组中拼接和未拼接的读长计数绘制产生的独立图像进行相互比较,以计算皮尔逊相关系数。使用同样的统计方法分析了对细胞核具有特异性的(Malat1、Neat1和Mlxipl)和线粒体编码(名称以“mt-”开头的所有基因)的转录物的丰度。相关系数被收集起来,并呈现在由Graphpad Prism 8(Graphpad Software,Inc.)制作的热图中。
亚细胞转录物组分析
使用在ImageJ中实施的分水岭局部最大值检测,从未拼接的RNA图中鉴定转录物组细胞核中心。HDMI转录物组根据其与细胞核中心的mm距离被划分为14个箱。然后,分离出在细胞核区域(离核中心5mm)最显著富集的基因。
用于单细胞分析的图像分割
为了使用H&E组织学图像进行细胞分割,利用了在ImageJ中实施的分水岭算法。细胞分割的结果分离出单个肝细胞区域,这与H&E图像的视觉检查一致(图15A)。细胞边界图像和细胞中心坐标从ImageJ中导出,并用于汇总SeqScope数据,使得在每个分割区域内的所有HDMI像素的转录物组信息被折叠成其相应的细胞中心坐标条形码,生成单一细胞索引DGE矩阵。将该DGE矩阵用于聚类分析,如下所述。使用Adobe Photoshop CC将单细胞分割数据和空间单细胞注释数据叠加到组织学图像或未拼接的RNA绘图图像上。
通过方形网格进行数据分箱
通过将成像空间划分为100mm2(边长10mm)的方形网格,并将所有HDMI-UMI信息折叠成每个网格一个条形码来进行数据分箱。替代地,也可以用25mm2(边长5mm)的方形网格来进行数据分箱。在数据分箱后,将基因类型过滤以只包含蛋白编码基因、lncRNA基因和免疫球蛋白/T细胞受体基因,以只包含首次出现的拼接异构体,并排除任何假设的基因模型(指定为Gm-number的基因)。
细胞类型图谱(聚类)分析
在Seurat v4包中对经过分箱和处理的DGE矩阵进行了分析。应用特征数阈值,以去除对应于未被组织覆盖或因划痕而被广泛损坏的区域的网格。使用在Seurat的SCTransform函数中实施的正则化负二项回归对数据进行归一化。使用在Seurat的FindClusters函数中实施的共享近邻模块化优化来进行聚类。具有混合细胞类型的聚类要经过额外的一轮聚类,以获得不同细胞类型之间的分离,而相似的细胞类型则被归为一组。使用同样在Seurat包中建立的UMAP流形来评估聚类表现。使用通过FindAllMarkers功能鉴定的每个簇中的顶端标志物来推断和注释细胞类型。然后分别使用DimPlot和SpatialDimPlot函数在UMAP流形或组织学空间中对聚类进行可视化。通过在Seurat包中构建的VlnPlot、DotPlot、FeaturePlot和SpatialFeaturePlot功能,对每个块、簇和空间网格中的原始和归一化的转录物丰度进行可视化。使用BioVenn制作面积比例的维恩图。
在组织覆盖区域之外发现的转录物的分析
一些RNA是在组织没有被覆盖的区域发现的。可能是一丝组织液或碎片,以及从组织中释放的环境RNA可能已经生成了这种模式。虽然在这些区域发现的RNA很少,但在组织覆盖区域(肝脏数据集中的n特征>250)和非覆盖区域(肝脏数据集中的n特征%250)发现的RNA的组成彼此非常相似(斯皮尔曼系数中r=0.9833)。这两个区域之间的微小差异可以通过环境RNA释放/捕获的不同速率和在组织碎片中细胞类型的不同组成来解释。因此,环境和碎片产生的RNA在组织非覆盖区域中生成了RNA的发现模式,这是可信的。
多尺度的滑动窗口分析
使用在Seurat中实施的FindTransferAnchors和TransferData函数,采用多尺度分析来微调注释。将由10mm网格数据集提供的锚点用来指导由同一Seq-Scope结果产生的其他数据集。与10mm网格数据集相比,5mm网格数据集在UMAP(图19L)和空间(图19N,中心)分析中噪音更大,即使在多尺度微调后也是如此。为了规避这个问题,采用了滑动窗口分析;在最初的10mm网格采样后,网格以5mm、2mm或1mm的间隔水平和垂直移动,分别产生4、25和100倍的数据(参见图19O的示意图示)。然后,将原始的10mm网格数据集用于指导这些滑动窗口数据集以进行高分辨率的细胞类型注释。与5mm的网格数据集(图19N,中心)相比,具有5mm间隔的滑动窗口分析(图19N,右)的表现要好得多,并示出UMAP模式(图19M),其形状与原始10mm网格数据集(图19E)更相似。
使用具有5mm间隔的滑动窗口分析产生了在图17D、17H、17I、22A-22C和16I中的左小图。使用具有2mm间隔的滑动窗口分析产生了在图17D、17H、17I和16I中的右小图,以及在图22A-22C中的中间小图。使用具有间隔1mm的滑动窗口分析产生了图22A-22C中的右小图。
空间基因表达的可视化
使用自定义的python代码使空间基因表达可视化。被查询基因(或基因列表)的原始数字表达数据根据其HDMI空间指数被绘制到坐标平面上。考虑到从原始ST研究中测得的横向RNA扩散距离为1.7±2mm(平均值±SD),基因表达密度被绘制成约3mm半径的圆,透明度α水平在0.005和0.5之间。在白色背景的空间基因表达图像中,彩色斑点的强度表示斑点位置周围转录物的丰度。黑色背景的空间基因表达图像是为高表达值的基因或基因列表创建的,以方便调整基因表达密度的线性范围,并以不同的伪色编码叠加不同查询的基因表达密度。灰度图的反图像用红色、蓝色、绿色或灰色进行伪彩色处理,并对图像对比度进行线性调整以突出生物相关的空间特征。最后,将不同的伪彩色图像叠加在一起,以比较在同一组织学坐标平面内的基因表达模式。对细胞周期具有特异性的基因,诸如对S期和G2/M期具有特异性的基因列表从Seurat包中检索出来,并使用biomaRt包鉴定其小鼠同源基因。
基准分析
Seq-Scope在肝脏和结肠实验中的表现相对于由10X VISIUM(https://support.10xgenomics.com/spatial-gene-expression/datasets/1.1.0/V1_Hu man_Brain_Section_1)、DBiT-Seq(GSE137986中的GEO:GSM4096261)、载玻片-Seq(SCP354中的Single Cell Portal:180819_11)、载玻片-SeqV2(SCP815中的Single Cell Portal:190921_19)和HDST(GSE130682中的GEO:GSM4067523)产生的公开可获得数据集进行基准检查。肝脏Seq-Scope数据集相对于使用原始ST(Zenodo:10.5281/zenodo.4399655)和载玻片-Seq(SCP354中的Single Cell Portal:1808038_8)产生的先前肝脏数据集分别进行了基准检测。Seq-Scope数据集具有没有被组织覆盖的很大面积,所以组织覆盖的HDMI像素被分离出来并用于基准分析。组织覆盖的HDMI像素是从用于上述细胞类型图谱分析的10mm网格区域中分离出来的。每个像素的中心至中心的分辨率被计算为离最近的像素的距离。对于具有确定像素面积的技术(VISIUM、DBiT-Seq和HDST),像素密度被计算为像素面积的倒数。对于载玻片-Seq、载玻片-SeqV2和Seq-Scope,像素密度按最终数据集的150mm网格(载玻片-Seq和载玻片-SeqV2)和10mm网格(Seq-Scope)计算。包含少于10个像素的网格被排除在分析之外。nUMI对应于映射到转录物组的唯一转录物的数量,以及n基因对应于每个像素发现的基因特征的数量。nUMI/像素和n基因/像素值乘以平均像素密度(像素/mm2)以得到每个像素的面积归一化的nUMI和n基因(分别为nUMI/mm2和n基因/mm2)。
UMI效率测试
使用“UMI编码的HDMI-阵列的生成和测试”部分产生的数据,来评价用于折叠重复读长计数的UMI编码方法的效率。从2nd-Seq结果鉴定由HDMI阵列编码的UMI(UMI_阵列;Read1的第49-57的位置)和由随机引物位置编码的UMI(UMI_随机引物;Read2的第1-9的位置)。计算了观察到的所有HDMI序列的未折叠读长计数、根据UMI_阵列折叠的读长计数和根据UMI_随机引物折叠的读长计数,并将它们的相对丰度用线图表示(图9G)。结果表明,UMI_阵列和UMI_随机引物两者在折叠2nd-Seq结果的重复读长计数方面是有效的。
结果/概述:本文所述的方法,被称为“Seq-Scope”,分为两个连续的测序步骤:“1st-Seq”和“2nd-Seq”(图8)。1st-Seq生成空间编码的RNA捕获分子的物理阵列。1st-Seq还生成了数据表,其中限定了物理阵列中每个条形码序列的空间坐标。2nd-Seq使用由1st-Seq产生的物理阵列来捕获从组织中释放的RNA,并对捕获的分子进行cDNA和空间条形码信息两者进行测序。
1st-Seq从使用Illumina边合成边测序(SBS)平台(在目前的研究中为MiSeq;图8A)对单链合成寡核苷酸文库进行固相扩增开始。寡核苷酸“种子”分子(例如捕获探针)包含PCR/读长接头序列、可限制性酶切的RNA捕获域(寡聚dT)和高清地图位置标识符(HDMI),该空间条形码由20-32个核苷酸的随机序列组成。“种子”寡核苷酸文库(例如捕获探针文库)在涂有PCR接头(例如表面探针)的坪表面进行扩增(图8B),生成了许多簇,每个簇都来自单个“种子”分子。每个簇有数千个寡核苷酸,它们是初始寡核苷酸“种子”的相同克隆(图8B)。每个簇的HDMI序列和空间坐标是通过SBS确定的(图8C和9A)。在SBS之后,每个簇中的寡核苷酸被处理以暴露核苷酸捕获域(图8D和9A),产生HDMI编码的RNA捕获阵列(HDMI-阵列;图8E)。
2nd-Seq首先将组织切片叠加到HDMI-阵列上(图8E)。来自组织的mRNA被用作模板,以在HDMI条形标记的RNA捕获分子上生成cDNA足迹(图8F和9B)。然后,使用接头标记的随机引物在cDNA足迹上合成二级链(图8G和9B)。由于每个cDNA足迹在洗涤后与单一随机引物配对,随机引物序列被用作唯一分子标识符(UMI;图9B)。然后收集二级链,即HDMI和cDNA序列的嵌合分子,并通过PCR制备成文库(图8H和9B)。该文库的双端测序将显示出cDNA足迹序列,以及其相应的HDMI序列(图8I和9B)。每个被发现的cDNA足迹的空间坐标是通过基于匹配的HDMI序列连接1st-Seq和2nd-Seq的数据表来确定的(图9C-9E)。将合并的数字基因表达(DGE)矩阵用于各种分析,包括基因表达可视化和空间特征聚类试验(图9C-9E)。
总之,对于每个HDMI序列,1st-Seq提供空间坐标信息,而2nd-Seq提供捕获的cDNA信息。相应地,空间基因表达矩阵是由1st-Seq和2nd-Seq数据组合构建的,其用于各种分析。
HDMI-阵列捕获组织的空间RNA足迹:通过一系列的滴定和优化实验,HDMI-阵列产生了每mm2最高达150万个簇的测序的簇密度(图10A、11A和11B)。据估计,附近簇的中心之间的距离在0.5-1μm之间(图10A和11A)。由于在一个100μm2面积中生成了最多达150个HDMI,所以单细胞的结构以及其亚细胞结构,诸如细胞核和细胞质的可视化是可能的(图9J)。
首先通过使用碎裂的冷冻肝脏切片进行Cy3-dCTP介导的cDNA标记测定来评价HDMI-阵列的RNA捕获能力。HDMI阵列成功地捕获了组织的转录物组,并且生成了保留了叠加组织的总形状的空间cDNA足迹(图10B)。有趣的是,Cy3-dCTP标记测定还显示了cDNA足迹的微观细节,类似于单细胞的形态(图10B,插图),其具有荧光结构与底层簇产生的荧光结构相似(图10A和11A)。
完整的Seq-Scope程序(1st-Seq和2nd-Seq;图1)随后在两个有代表性的胃肠道组织、肝脏和结肠上进行。在每个1st-Seq实验中,在MiSeq流通池的1mm宽的圆形区域产生HDMI-阵列,也被称为“块(tile)”(2101至2119;图10C)。将肝脏和结肠组织切片覆盖在HDMI阵列上,通过H&E染色检查,并且进行2nd-Seq。1st-Seq和2nd-Seq数据的分析(图9C)表明,RNA足迹主要是从每个块的组织重叠区域发现的(图10C,11D和11E),证实了该程序确实可以捕获和分析组织的空间转录物组。
Seq-Scope分析对PCR和测序错误是稳健的;所有空间分配中的>99%估计是准确的,详见STAR方法(图11Q-11S)。在组织覆盖区域外发现的少量转录物具有与组织覆盖区域相似的转录物组特征(r=0.9833);因此,这些转录物可能来自组织碎片或从组织中释放的环境RNA。
高效率地捕获转录物组信息:与先前的ST解决方案相比,Seq-Scope在分辨率(图10F)和像素密度(图10G)方面提供了极大的改进;在HDMI像素之间的中心至中心的距离被测量为0.633±0.140mm(肝脏)和0.630±0.132mm(结肠)(平均值±SD)(图10F)。虽然每个HDMI条形标记的簇覆盖了极其微小的区域(小于1μm2),但是许多HDMI簇能够从覆盖的组织切片中鉴定10-100个唯一转录物(图11F和11G)。为了将数据输出与其他现有的ST技术进行比较,对边长10μm方形网格中的基因特征和唯一转录物的数量进行了量化(图11H和11I)。由于组织重叠的网格像素明显显示出更多的基因特征和唯一转录物数量(图10D),设置简单的基因特征截留足以隔离组织重叠的网格像素(图10E和11J-11M);组织重叠的网格像素鉴定出每个个体像素最多达1000-1200个唯一转录物(图10D、10E、11N和11O)。
事实上,尽管每个HDMI编码的簇覆盖了极其微小的区域(小于1μM2),但在组织覆盖的区域内单个HDMI像素能够捕获6.70±5.11(肝脏)和23.4±17.4(结肠)的UMI(平均值±SD)(图10H)。每个HDMI像素鉴定的基因特征数量为5.88±4.22(肝脏)和19.7±14.3(结肠)(平均值±SD)(图10I)。在Seq-Scope中UMI和基因的每像素计数比HDST大,但是比其他技术小(图10H和10I)。然而,在使用像素密度进行归一化后,Seq-Scope在我们检查的数据集中示出最佳的每面积转录物组捕获性能(图10J和图10K;结肠数据集)。考虑到目前的数据估计覆盖了总文库大小的约60%(肝脏)和约36%(结肠)(图11P),Seq-Scope最大可能的捕获效率应该甚至比目前提出的数据还要高。因此,Seq-Scope除了提供无与伦比的空间分辨率输出外,还提供了出色的mRNA捕获输出。
组织切片中的细胞核-细胞质转录物组结构:mRNA在细胞核中被转录并经多聚A修饰。在它能够被运送到细胞质之前,将它拼接,并且去除内含子序列。因此,细胞核区将具有较高浓度的未拼接的mRNA序列,而细胞质区将具有较高浓度的拼接的mRNA序列(图12A)。在小鼠肝脏中,发现几个RNA物种,诸如Malat1、Neat1和Mlxipl,由于它们在细胞质运输中的强烈衰减而示出细胞核定位(图12A)[18]。另一方面,细胞质具有线粒体,它具有唯一转录物组结构,带有线粒体编码的RNA(mt-RNA;图12A)。
为了了解本文所公开的技术是否能够检查亚细胞水平的空间转录物组(图8G),所有拼接和未拼接的转录物被绘制在一个二维坐标空间中。有趣的是,未拼接的转录物示出了有趣的模式,因为它们的表达被限制在一些小圆圈里,这些圆圈具有的直径为大约10μm,这约是肝细胞核的大小[19](图12B和13A)。更有趣的是,在未拼接区较少发现拼接的mRNA,而细胞核定位的RNA,包括Malat1、Neat1和Mlxipl[18],更经常在未拼接区被发现(图12B)。另一方面,mt-RNA更频繁地出现在拼接的细胞质区(图12C和13B)。因此,覆盖单细胞区的聚焦图像示出了未拼接的mRNA和细胞核定位的mRNA之间以及拼接的mRNA和线粒体mRNA之间强烈的正相关,而在相对的组之间显示强烈的负相关(图12D和13C)。这些数据表明,拼接和未拼接的转录物的绘图可以用于从数据集中确定细胞核-细胞质结构。为了进一步检验这些观察是否稳健和具有统计学意义,将所有基因分为三个独立的子集,计算每个基因子集的拼接和未拼接mRNA的表达,并通过相同的绘图方法分析每个数据集。所有三个数据集都类似地将细胞核-细胞质结构可视化,并具有强烈的统计学相关性(图12E和13D)。
这些结果表明,拼接和未拼接的转录物对于从Seq-Scope数据集中确定的细胞核-细胞质结构是有用的。事实上,当与H&E染色图像重叠时,未拼接的RNA富集区域一般与细胞核的位置一致(图12F;应当注意已知一些肝细胞是多核的)(Donne et al.,2020)。然而,在一些肝细胞中,没有观察到未拼接的RNA富集区域(图12F),这可以解释为在组织切片中缺少细胞核(图13E,左),细胞核的位置不足以捕获RNA(图13E,中),或转录、拼接和细胞核输出速率的内在变化(图13E,右)。为了进一步测试这些观察的稳健性,将所有基因随机分为三个独立的子集,并检查来自每个子集的拼接和未拼接的mRNA的表达。所有三个数据集都类似地可视化了具有强烈相关性的细胞核-细胞质结构(图12E和图13D)。最后,通过使用未拼接的转录物来鉴定细胞核中心(图12G)。然后,搜索其转录物在距离细胞核中心5mm内富集的基因。与先前的细胞分级分离和RNA原位杂交研究(Bahar Halpern et al.,2015)和上述观察一致,Malat1、Neat1和Mlxipl被鉴定为在细胞核区富集的前3个基因(图12H)。这些结果表明,Seq-Scope可以进行亚细胞转录物组研究。
代谢性肝脏带区的空间转录物组细节:然后检验了本文所述的方法是否能揭示出肝脏空间转录物组的生物学相关特征。为了***地接近肝细胞转录物组的异质性,用标准的scRNA-seq分析流程[20]分析了方形网格的数据集(图10H-10O)。多维聚类分析鉴定了许多有趣的细胞类型(图14A),并列出了一长串对簇具有特异性的标志物基因(图14B-14D)。
肝细胞是肝脏的实质细胞类型,根据其组织学位置暴露于不同梯度的氧气和营养物,导致代谢带区,因而细胞表达不同的基因来执行对区具有特异性的代谢功能(1-3区或Z1-3区)[21]。与此相一致,多维聚类分析鉴定分区的肝细胞为从数据集中发现的主要聚类(图14A)。簇身份的空间绘图在二维网格空间中清楚地可视化了1-3区。
为了充分利用亚微米分辨率的性能,将对区具有特异性的分子标志物定向绘制到原始坐标平面上。这揭示了示出各种带区模式的基因谱,其不能通过三个简单的层来解释。例如,紧邻中央的肝细胞特异性地表达极端的3区标志物诸如Glul和Oat。Cyp2a5、Mup9和Mup17也在极端中心周围的肝细胞中勉强地表达;然而,Mup9和Mup17在紧邻中心周围的肝细胞中显示出更低的表达,形成甜甜圈状的染色模式。相比之下,一般的中心周围的标志物,诸如Cyp2c29和Cyp2e1,在所有中心周围的肝细胞中广泛表达。几个基因诸如Mup11和Hamp,在极端的1区和3区层没有表达,但在中间层示出较高的表达。同样,不同的门静脉周围标志物,诸如Ass1、Serpina1e、Cyp2f2、Alb和Mup20,呈现出对1区具有特异性的表达模式的不同水平。这些观察中有许多得到了先前scRNA-seq、RNA原位杂交[22,23]和免疫染色结果[24]的支持。
有趣的是,这些对1区或3区具有特异性的标志物大多被发现位于细胞膜上,因为它们没有与未拼接的转录物富集区重叠。这与对区具有特异性的蛋白在胞质溶胶中积极翻译以执行分区代谢功能的观点一致[21-24]。因此,基于亚细胞转录物组的异质性对2区肝细胞进行聚类,2区肝细胞没有呈现出明显的门静脉周围或中心周围的转录物组特征;2区肝细胞被发现在示出异质的空间基因表达模式(图14E)的用核转录物(Malat1、Neat1和Mlxipl[18];图14A中第9簇)、线粒体转录物(mtRNA;图14A中的第1簇)和长非编码RNA(lncRNA;图14A中的第3簇)富集的簇中。
Seq-Scope进行肝细胞的空间单细胞分析
使用图像分割方法(Sage and Unser,2003),从H&E图像中鉴定出单个肝细胞区(图12F和15A)。来自分割的Seq-Scope数据的单肝细胞转录物组示出了大量的UMI(4294,中位值;4734±2480,平均值±SD)和基因(1617,中位值;1673±631.7,平均值±SD),这与最近从MARS-Seq(Halpern et al.,2017)和DropSeq(Park et al.,2021)(FIG.15B)获得的单肝细胞转录物组数据集相当(图15B)。Seq-Scope的转录物组内容与正常肝脏的MARS-Seq、Drop-Seq和Bulk RNA-seq分析的结果相似(图20A-20E)。对分割的单个肝细胞数据集的细胞类型图谱分析显示了肝细胞带区的空间结构,鉴定了中心周围(PC)和门静脉周围(PP)两者的图谱(图20F),其被发现于在其相应的空间位置(图20G)。在MARS-Seq和Drop-Seq数据中也发现了从Seq-Scope中分离出来的对PP和PC具有特异性的基因(图20H)。来自Drop-Seq和MARS-Seq的前50个PC/PP基因足以在Seq-Scope数据集中对PC/PP细胞进行分类(图20I)。因此,Seq-Scope单细胞分析与以前的scRNAseq结果一致,并揭示了每个单细胞的实际空间位置。对Seq-Scope数据进行更详细的分析,鉴定了多个转录物组层在门静脉-中央带区轴线上有序排列(图15C、图14D)。连续映射,而不是离散的聚类,也可视化了类似的带区模式(图20K)。许多簇标志物基因在PC和PP图谱之间示出了不同的带区模式谱(图15E)。这些基因表达模式与先前的RNA原位杂交(Aizarani et al.,2019;Halpern et al.,2017)和免疫染色结果(Park et al.,2021)一致。然而,先前使用原始ST(Hildebrandt et al.,2021)或载玻片-Seq(Rodriques et al.,2019)的研究无法发现这种水平的细节(图20L和20M),可能是由于分辨率(图10F,图10G)和RNA捕获效率(图20N和20O)的限制。
Seq-Scope检测肝脏切片中的非实质细胞转录物组
尽管肝细胞是肝脏中的主要细胞组分,但在组织学区的一小部分中可以发现非实质细胞(NPC)诸如巨噬细胞(M4;蓝色)、肝星状细胞(HSC;深绿色)、内皮细胞(ENDO;橙色)和红细胞(RBC;红色)(图15F)(Ben-Moshe和Itzkovitz,2019)。由于这些细胞其体积小,不容易通过基于H&E的图像分割检测分离出来;基于H&E的分割检测未能揭示NPC转录物组,除了门静脉区周围(图15C和15D中的灰色团块),其中RBC和M4s通常大量聚集在那里(Dou etal.,2020)。因此,替代地,Seq-Scope数据集是用由边长10mm的方块组成的统一网格来分割(图20P-20S)。网格化的Seq-Scope数据集的细胞类型映射分析,基于对细胞类型特异性标志物的表达(图20T-20V),鉴定了对应于这些NPC细胞类型的网格(图15G和20T)。虽然大部分的组织学空间被肝细胞区(Hep_PP和Hep_PC)占据,但散布在整个切片中的小且零散的空间代表了NPC区(图15H)。M4和ENDO网格的位置(图15I,第一和第二小图)与它们相应的细胞类型特异性标志物表达的空间位置(图15I,第三小图中的箭头)以及位于分割边界周围(图15I,第五小图的箭头)的组织学鉴定的M4和窦状区(图15I,第四小图中箭头)一致。因此,组织学指导的细胞分割分析和组织学诊断的方形网格分析在鉴定不同的细胞类型方面相互补充。
经历组织损伤反应的肝细胞亚群的鉴定:聚类还鉴定了表达肝细胞损伤反应基因的少数干细胞亚群(Saa1-3和Cxcl9;图4L)[29,30]、主要尿蛋白的子集(Mup10、Mup14和Mup7)、先前与肝癌发生有关的翻译延伸因子(Eef1a1)[31],以及核糖体蛋白的子集(Rpl15、Rpl35和它们匹配的假基因)。这些簇在空间上分散在整个肝脏切片中(图14F),尽管表达损伤反应标志物的簇示出局部的表达模式。在空间绘图分析中,肝脏损伤标志物的表达与Alb大量重叠,证实它们是具有改变转录物组的肝细胞亚群。
通过较小的网格处理正常肝脏数据,包括7μm(图14G-14L)和5μm(图14M-14R)的方形网格,也有力地鉴定了肝细胞带区、实质/非实质细胞和肝细胞亚群,证实了这里描述的观察是重要的且可重复的。
与肝损伤相关的组织病理学的转录物组细节:上述数据证实,所述技术揭示了正常肝脏在不同尺度上的转录物组异质性和空间复杂性。为了解决该技术是否也能揭示病变肝脏中转录物组失调的病理细节,使用了最近开发的由过度mTORC1信号传导引发的早发性肝脏衰竭的小鼠模型[32]。这种模型(Tsc1Δhep/Depdc5Δhep小鼠或TD小鼠)的特点是广泛的肝细胞氧化应激,导致局部肝脏损伤、炎症和纤维化反应[32]。
首先使用网格化的Seq-Scope数据集评价了TD肝脏的细胞组分(图16A-16D)。从正常肝脏中鉴定的大多数细胞类型,诸如PP/PC肝细胞和NPC,也从TD肝脏中发现(图17A、图16E和图16F)。
细胞核、细胞质和线粒体的结构也分别通过未拼接、拼接和mtRNA转录物的空间绘图被可视化(图16G)。以前的批量RNA-seq结果示出,TD肝脏上调了氧化应激信号通路。与此相一致,Seq-Scope鉴定的是,TD肝脏表达的几个抗氧化基因诸如Gpx3和Sepp1的水平升高。有趣的是,这些基因的诱导在PP肝细胞中是强有力的,而在PC肝细胞中的上调则不明显(图16H)。因此,TD肝脏的氧化应激反应对PP具有特异性。
在TD肝脏中,一些NPC群体,诸如M4s和HSC,极大增加并分化为亚群。M4s被分化为稳态和炎症型群体(M4-Kupffer和M4-炎症(M4-Inflamed))。M4-Kupffer表达对Kupffer细胞特异性标志物诸如Clec4f,而M4-炎症表达促炎症标志物诸如Cd74和MHC-II组分(图17B)。同样,HSC也被分化为正常和活化的HSC(HSC-N和HSC-A)。HSC-A呈现出纤维化标志物诸如胶原蛋白和α-平滑肌肌动蛋白(Acta2)的升高的水平。相比之下,HSC-N表达了不同组的细胞外蛋白,诸如Ecm1和Dcn(图17B),这些蛋白也被常驻在正常肝脏中的HSC表达。TD肝脏还呈现出新出现的细胞群。呈现出损伤反应的肝细胞(Hep_损伤)表达血清淀粉样蛋白(图16F),这是肝脏损伤的标志物。虽然Hep_损伤群体在正常肝脏肝细胞的小子集中被观察到(图15C和15D,黑色簇,和20T-20V),但它在TD肝脏数据集中变得更为普遍(图17A和图16E)。
肝脏祖细胞(HPC)表达唯一组的基因诸如Clu、Mmp7、Spp1和Epcam(图17B)。在这些基因中,Spp1和Epcam以前被报道为由损伤反应的HPC表达。有趣的是,M4-炎症、HSC-A、Hep_损伤和HPC的这些群集中在损伤和炎症部位周围,从H&E组织学图像中鉴定出(图17C;虚线矩形)。因此,这些细胞类型很可能与在TD肝脏中观察到的肝脏损伤有直接的病理生理联系。通过多尺度滑动窗口分析(见STAR方法),生成了不同细胞类型的精细空间图(图16I)。结果表明,死亡的肝细胞(图17C-G中的星号)被M4-炎症包围,随后被Hep_损伤包围(图17D)。相比之下,M4-Kupffer更均匀地分布在整个肝区(图17D)。这些观察与细胞类型特异性标志物的空间绘图一致(图17EE),并表明肝脏损伤组织病理学的转录物组结构(图17F)。]
为了通过正交技术(orthogonal technology)独立证实这些观察,对细胞类型特异性标志物(Cd74、Saa1/2和Clec4f)进行了免疫荧光共聚焦成像(图17B和16J-16O)。结果显示类似的组织病理学结构(图17G)——Cd74阳性细胞围绕着没有活细胞的区域(黄色星号),并且Saa1/2标记了炎症区域周围的肝细胞损伤反应。Kupffer细胞标志物Clec4f与损伤部位不相关,并且散布在整个空间(图17G)。这些结果支持Seq-Scope数据的初步观察(图17D-17F)。TD肝脏也呈现出纤维化反应。在活跃的纤维化区,M4-炎症和HSC-A非常紧密地相互交织在一起(图17H和17I)。相比之下,M4-Kupffer没有示出特定的空间交互,并且在纤维化和非纤维化区都可以发现(图17H和17I)。这些观察(图17J)再次用免疫荧光成像再现;通过可视化Cd74、Acta2和Clec4f蛋白,证实了M4-炎症和HSC-A之间的紧密共定位(图17K),以及M4-Kupffer的非特定分布(图17L)。除了HSC-A,在Seq-Scope数据中,HPCs也与M4-炎症相互作用(图17M和17N),与它们已知的功能相互作用一致。在免疫荧光成像中也观察到HPC和M4-炎症之间的相互作用(图17O)。这些结果突出了Seq-Scope在鉴定与特定组织病理学结构相关的细胞类型和鉴定其特定细胞类型标志物方面的效用。这些结果还表明,Seq-Scope能以类似于免疫荧光显微术的方式揭示转录物组表型的微观结构。
Seq-Scope使结肠壁的组织学层可视化
结肠是具有复杂组织层、组织学带区结构和多种细胞组分的另一个胃肠道器官。利用结肠,接下来研究Seq-Scope是否能检查在非肝脏组织中的空间转录物组。结肠壁在组织学上被分为结肠黏膜和外部肌肉层。结肠黏膜由上皮和固有层组成,并且上皮进一步分为隐窝基底层、过渡层和表面层(图18A)。对网格化的Seq-Scope数据集的聚类分析(图18A-18E)显示了与这些层对应的转录物组表型(图18B),并将其空间位置可视化(图18C和18F)。
Seq-Scope鉴定结肠组织中的单个细胞组分
除了可视化层结构外,Seq-Scope还显示了各种结肠上皮和非上皮细胞类型(图18D-18I和19F-19H)。鉴定了隐窝基底,干/***细胞、深隐窝分泌细胞(DCSC)和潘氏(Paneth)样细胞表型(图18E、18F和19G)。干/***细胞表达较高水平的核糖体蛋白,而表达的其他上皮细胞类型标志物的水平较低(图18J)。DCSC表达分泌细胞标志物,诸如Agr2、Spink4和Oit1(图18J),而潘氏样细胞表达Mptx1,这是最近鉴定的在小肠中潘氏细胞的标志物。Seq-Scope还鉴定了结肠黏膜表面的不同细胞类型(图18D-18F)。上皮细胞的顶层表达表面结肠细胞标志物,诸如Aqp8、Car4和Saa1(图18J)。一些上皮细胞表达了杯状细胞特异性标志物,诸如Zg16、Fcgbp和Tff3(图18J)。另外,Seq-Scope还鉴定了表达激素,诸如胰高血糖素、YY肽、胰岛素样肽和CCK(图18J)的肠内分泌细胞(EEC)。在上皮的下面,有***层,包括固有层、黏膜下层和外部肌肉层。Seq-Scope从这些层中鉴定出许多非上皮细胞类型,包括平滑肌、成纤维细胞、肠道神经元、M4s和B细胞(图18G-6I)。这些结果表明,Seq-Scope可以从转录物组上识别在正常结肠壁中存在的大多数主要细胞类型。
Seq-Scope对结肠空间转录物组进行显微分析
为了利用Seq-Scope的高分辨率数据,进行了多尺度滑动窗口分析(图22A-C)和簇标志物的空间绘图(图22D-7F和图21),重点是结肠壁的相同区域。多尺度滑动窗口分析在不同的细胞区室之间画出了清晰的线(图22A-C);原始网格分析(10mm)或用较小的网格分析(5mm)没有显示出这种高分辨率的细节水平。滑动窗口的簇分配(图22A-C)与相关簇标志物基因的空间绘图(图22D-F)和H&E组织学数据(图22G)一致。例如,在所有这些数据中,B细胞和M4s局限于固有层,而隐窝基底细胞标志物局限于上皮层(图22D-G中用虚线分开)。B细胞和M4s通常非常接近(图22C和图22F),可能是由于它们的功能相互作用(Spencer andSollid,2016)。在S和G2/M细胞周期阶段特异性表达的基因(Nestorowa et al.,2016)在干/***细胞所在的隐窝基底区高度表达(Levine and Haggitt,1989),然而,它们在表面区的表达较低(图22H)。
讨论
本文描述的技术是唯一可用的分子条形码技术,可以进行空间转录物组的显微镜检查。这里呈现的数据表明,本文描述的方法能够在多种尺度上可视化转录物组结构的组织学结构,包括大的组织分区水平、细胞组分水平和甚至亚细胞水平。由于其超高的分辨率输出,该技术能够在不同的组织区、细胞类型和亚细胞组分之间划出清晰的边界。先前存在的技术由于其低分辨率输出和/或转录物组捕获效率低下,无法提供这种清晰的水平。在目前的研究中,单个像素面积,也就是低于1μm2,可以在仅仅约70%(肝脏)和42%(结肠)的文库检查饱和度下,捕获最多达10-100个唯一转录物,导致每100μm2面积大约1000个唯一转录物。因此,除了提供前所未有的亚微米分辨率外,该技术还能揭示高质量的转录物组信息。高分辨率和高转录物组输出性能是本文描述的技术能够从肝脏和结肠切片中可视化如此多生物相关的ST特征的基础。
有几个因素可能促成了Seq-Scope的高转录物组捕获效率。首先,在Seq-Scope中密集和紧密排列的条形码簇可能提高了转录物组捕获率,因为它们几乎消除了空间特征之间的“盲点”区域。第二,与产生凹凸不平的阵列表面的一些方法不同,Seq-Scope产生平坦的阵列表面,使捕获探针和组织样品之间能够直接相互作用。第三,受分子拥挤限制的固相扩增,可能提供了RNA捕获探针的二维浓度,是与组织来源的RNA进行分子相互作用的理想选择。最后,我们的方案所特有的生化策略,诸如二级链的合成、检索和扩增方法,可以提高转录物组的回收产率。
本文所述技术的另一个好处是其可扩展性和适应性。本文使用MiSeq平台进行HDMI阵列的生成;然而,使用空间定位扩增的几乎任何测序平台,诸如包括GAIIx、HiSeq、NextSeq和NovaSeq的Illumina平台,都可以用于生成HDMI阵列。已建立的DNA测序技术可以被重新利用来提供高分辨率的空间条形码。例如,尽管MiSeq具有的分隔成像区被限制在0.8mm×1mm的矩形空间内,但HiSeq2500(Rapid Run)和NovaSeq可以提供可以用于HDMI-阵列的产生和测序的大约90mm2和800mm2的不间断的成像区。更新的测序方法,诸如NovaSeq,是基于模式化的流通池技术[49],它可以为HDMI编码的簇提供更明确和可信的空间信息。此外,通过这些组合,由该技术提供的视野可以得到极大的扩展。
就成本而言,目前可以以每mm2大约$150来生成基于MiSeq的HDMI-阵列。基于目前的测序成本,HiSeq2500的成本可以进一步降低到每mm2$11,或者NovaSeq降低到每mm2$2.6。30个和40个核苷酸的随机种子序列可以分别提供1百万的三次方和1千的八次方(septillion)的条形码多样性,这应该足以对宽阔的成像区域表面进行空间条形码化。就周转时间而言,HDMI-阵列的生成需要不到一天的时间,并且文库的制备可以在两天内完成(总计三天)。该程序简单明了,并不费力,也没有技术要求;相应地,研究人员可以同时处理多个样品。因此,本文所描述的方法可以使任何类型和规模的基础科学和临床工作都能获得超高分辨率的ST。
本文提供的方法具有补充目前固体组织的scRNA-seq方法的潜力。固体组织的scRNA-seq受到组织解离和单细胞分选程序的严重限制,这对大多数类型的细胞来说是非常苛刻的条件。固体组织中的不稳定细胞群会在组织解离期间裂解,并且因此,某些细胞群可以在最终数据集中的代表性可能过高或不足。此外,有许多细胞类型,诸如拉长的肌纤维和神经元、充满脂质的脂肪细胞和由细胞外基质和密接结合紧密连接的细胞,传统的scRNA-seq分析不能修正这些细胞。在scRNA-seq程序期间,即使是能够通过单细胞解离和分选存活下来的细胞类型也可能会显著改变其转录组。例如,严重的组织解离可能激活损伤和炎症相关的基因标签,而这些基因标签在细胞的原始条件下是观察不到的。通过直接从组织切片中捕获转录物组,有可能从这种困难类型的细胞中捕获转录物组标签。事实上,肝脏数据集显示了几个新的肝细胞亚群正在经历组织损伤反应,这些细胞亚群以前无法通过正常和病变肝组织的scRNA-seq检测到[22-24]。这体现了该技术在鉴定传统scRNA-seq无法检测到的固体组织中的新型细胞类型方面的效用;因此,它也具有补充和改进现有的scRNA-seq技术的潜能。
暴露簇的表面是最初的挑战。在肝脏数据集中,由于拆卸期间的损坏,经常观察到与划痕有关的数据丢失。在生成结肠数据集时,通过用水凝胶填充物保护HDMI阵列,使损害最小化。因此,结肠的结果几乎没有划痕,并且比肝脏的结果显示出更多的UMI数量/面积。
10mm网格的数据分箱对于鉴定肝脏和结肠数据集的各种细胞类型表现良好,而更小的网格则表现不佳。为了克服这一限制并充分利用Seq-Scope的高分辨率,采用了三种独立的方法:(1)组织学指导的图像分割检测,用于空间单细胞分析;(2)多尺度滑动窗分析,用于高分辨率细胞类型映射;以及(3)直接空间绘图,用于监测高分辨率的空间基因表达。这些分析结果证明了Seq-Scope在进行高分辨率空间单细胞/亚细胞分析和鉴定以前技术无法接近的生物信息方面的效用。这些结果还表明,Seq-Scope具有改进和补充目前的scRNA-seq方法的潜能。固体组织的scRNA-seq需要大量的组织解离和单细胞分选程序。这些程序创造了非常苛刻的条件,可能会消除不稳定的细胞群并诱发应激反应。几种细胞类型,诸如拉长的肌纤维、充满脂质的脂肪细胞,以及由细胞外基质和密接结合紧密连接的细胞,都不能用于常规的scRNA-seq。通过直接从冷冻的组织切片中捕获转录物组,Seq-Scope可以从先前难以处理的细胞类型中捕获单细胞转录物组标签。
总之,本文描述的是能够在显微分辨率下进行转录物组成像的***和方法。本文所述方法的一次运行可以产生相当于25,000个基因的RNA原位杂交的显微成像数据。这种技术所提供的大量信息不仅会加速科学发现,还可能导致分子诊断中新模式的发展。
应当理解,前述详细描述和所附实例仅仅是说明性的,并且不应视为对本公开内容范围的限制,本公开内容仅由所附权利要求书及其等同物限定。
对于本领域的技术人员来说,对所公开的实施方式进行各种改变和修改是显而易见的。这种变化和修改,包括但不限于与本公开的化学结构、取代物、衍生物、中间体、合成物、组合物、制剂或使用方法有关的变化和修改,可以在不偏离其精神和范围的情况下作出。
本文引用的任何专利和出版物以其全部内容通过援引并入本文。
参考文献
1.Mazzarini,M.,et al.,Evolution and new frontiers of histology inbio-medical research.Microsc Res Tech,2020.
2.Callea,F.,et al.,From immunohistochemistry to in situhybridization.Liver,1992.12(4Pt 2):p.290-5.
3.Asp,M.,J.Bergenstrahle,and J.Lundeberg,Spatially ResolvedTranscriptomes-Next Generation Tools for Tissue Exploration.Bioessays,2020.42(10):p.e1900221.
4.Liao,J.,et al.,Uncovering an Organ's Molecular Architecture atSingle-Cell Resolution by Spatially Resolved Transcriptomics.TrendsBiotechnol,2020.
5.Crosetto,N.,M.Bienko,and A.van Oudenaarden,Spatially resolvedtranscriptomics and beyond.Nat Rev Genet,2015.16(1):p.57-66.
6.Bergenstrahle,J.,L.Larsson,and J.Lundeberg,Seamless integration ofimage and molecular analysis for spatial transcriptomics workflows.BMCGenomics,2020.21(1):p.482.
7.Salmen,F.,et al.,Barcoded solid-phase RNA capture for SpatialTranscriptomics profiling in mammalian tissue sections.Nat Protoc,2018.13(11):p.2501-2534.
8.Stahl,P.L.,et al.,Visualization and analysis of gene expression intissuesections by spatial transcriptomics.Science,2016.353(6294):p.78-82.
9.Stickels,R.R.,et al.,Highly sensitive spatial transcriptomicsatnear-cellular resolution with Slide-seqV2.Nat Biotechnol,2020.
10.Vickovic,S.,et al.,High-definition spatial transcriptomics for insitutissue profiling.Nat Methods,2019.16(10):p.987-990.
11.Rodriques,S.G.,et al.,Slide-seq:A scalable technology formeasuringgenome-wide expression at high spatial resolution.Science,2019.363(6434):p.1463-1467.
12.Liu,Y.,et al.,High-Spatial-Resolution Multi-Omics SequencingviaDeterministic Barcoding in Tissue.Cell,2020.183(6):p.1665-1681 e18.
13.
Figure BDA0004119315870000641
L.,et al.,Super-resolved spatial transcriptomicsbydeep data fusion.bioRxiv,2020:p.2020.02.28.963413.
14.Baccin,C.,et al.,Combined single-cell and spatialtranscriptomicsreveal the molecular,cellular and spatial bone marrow nicheorganization.NatCell Biol,2020.22(1):p.38-48.
15.Asp,M.,et al.,A Spatiotemporal Organ-Wide Gene Expression andCellAtlas of the Developing Human Heart.Cell,2019.179(7):p.1647-1660e19.
16.Zhou,Y.,et al.,Encoding Method of Single-cellSpatialTranscriptomics Sequencing.Int J Biol Sci,2020.16(14):p.2663-2674.
17.Bentley,D.R.,et al.,Accurate whole human genome sequencingusingreversible terminator chemistry.Nature,2008.456(7218):p.53-9.
18.Bahar Halpern,K.,et al.,Nuclear Retention of mRNA inMammalianTissues.Cell Rep,2015.13(12):p.2653-62.
19.Baratta,J.L.,et al.,Cellular organization of normal mouse liver:ahistological,quantitative immunocytochemical,and fine structuralanalysis.Histochem Cell Biol,2009.131(6):p.713-26.
20.Stuart,T.,et al.,Comprehensive Integration of Single-CellData.Cell,2019.177(7):p.1888-1902 e21.
21.Ben-Moshe,S.and S.Itzkovitz,Spatial heterogeneity in themammalianliver.Nat Rev Gastroenterol Hepatol,2019.16(7):p.395-410.
22.Halpern,K.B.,et al.,Single-cell spatial reconstruction revealsglobaldivision of labour in the mammalian liver.Nature,2017.542(7641):p.352-356.
23.Aizarani,N.,et al.,A human liver cell atlas revealsheterogeneityand epithelial progenitors.Nature,2019.572(7768):p.199-204.
24.Park,S.R.,et al.,Holistic Characterization of SingleHepatocyteTranscriptome Responses to High Fat Diet.Am J Physiol EndocrinolMetab,2020.
25.Xiong,X.,et al.,Landscape of Intercellular Crosstalk in HealthyandNASH Liver Revealed by Single-Cell Secretome Gene Analysis.Mol Cell,2019.75(3):p.644-660 e5.
26.de Haan,W.,et al.,Unraveling the transcriptional determinantsofliver sinusoidal endothelial cell specialization.Am J Physiol GastrointestLiverPhysiol,2020.318(4):p.G803-G815.
27.Tee,L.B.,et al.,Dual phenotypic expression of hepatocytes andbileductular markers in developing and preneoplastic ratliver.Carcinogenesis,1996.17(2):p.251-9.
28.Werner,M.,et al.,All-In-One:Advanced preparation ofHumanParenchymal and Non-Parenchymal Liver Cells.PLoS One,2015.10(9):p.e0138655.
29.Sack,G.H.,Jr.,Serum Amyloid A(SAA)Proteins.Subcell Biochem,2020.94:p.421-436.
30.Saiman,Y.and S.L.Friedman,The role of chemokines in acuteliverinjury.Front Physiol,2012.3:p.213.
31.Abbas,W.,A.Kumar,and G.Herbein,The eEF1A Proteins:At theCrossroadsof Oncogenesis,Apoptosis,and Viral Infections.Front Oncol,2015.5:p.75.
32.Cho,C.S.,et al.,Concurrent activation of growth factor andnutrientarms of mTORC1 induces oxidative liver injury.Cell Discov,2019.5:p.60.
33.Levine,D.S.and R.C.Haggitt,Normal histology of the colon.Am JSurgPathol,1989.13(11):p.966-84.
34.Farkas,A.E.,et al.,Cryosectioning Method for MicrodissectionofMurine Colonic Mucosa.J Vis Exp,2015(101):p.e53112.
35.Haber,A.L.,et al.,A single-cell survey of the smallintestinalepithelium.Nature,2017.551(7680):p.333-339.
36.Moor,A.E.,et al.,Spatial Reconstruction of SingleEnterocytesUncovers Broad Zonation along the Intestinal Villus Axis.Cell,2018.175(4):p.1156-1167 e15.
37.Altmann,G.G.,Morphological observations on mucus-secretingnongoblet cells in the deep crypts of the rat ascending colon.Am JAnat,1983.167(1):p.95-117.
38.Sasaki,N.,et al.,Reg4+deep crypt secretory cells functionasepithelial niche for Lgr5+stem cells in colon.Proc Natl Acad Sci U S A,2016.113(37):p.E5399-407.
39.Rothenberg,M.E.,et al.,Identification of a cKit(+)coloniccryptbase secretory cell that supports Lgr5(+)stem cells inmice.Gastroenterology,2012.142(5):p.1195-1205 e6.
40.Park,S.W.,et al.,The protein disulfide isomerase AGR2 isessentialfor production of intestinal mucus.Proc Natl Acad Sci U S A,2009.106(17):p.6950-5.
41.Parikh,K.,et al.,Colonic epithelial cell diversity in healthandinflammatory bowel disease.Nature,2019.567(7746):p.49-55.
42.Fischer,H.,et al.,Differential expression of aquaporin 8 inhumancolonic epithelial cells and colorectal tumors.BMC Physiol,2001.1:p.1.
43.Borenshtein,D.,et al.,Decreased expression of colonic Slc26a3andcarbonic anhydrase iv as a cause of fatal infectious diarrhea inmice.InfectImmun,2009.77(9):p.3639-50.
44.Eckhardt,E.R.,et al.,Intestinal epithelial serum amyloidAmodulates bacterial growth in vitro and pro-inflammatory responses inmouseexperimental colitis.BMC Gastroenterol,2010.10:p.133.
45.Okumura,R.,et al.,Lypd8 promotes the segregation offlagellatedmicrobiota and colonic epithelia.Nature,2016.532(7597):p.117-21.
46.Pelaseyed,T.,et al.,The mucus and mucins of the goblet cellsandenterocytes provide the first defense line of the gastrointestinal tractand interactwith the immune system.Immunol Rev,2014.260(1):p.8-20.
47.Nestorowa,S.,et al.,A single-cell resolution map ofmousehematopoietic stem and progenitor cell differentiation.Blood,2016.128(8):p.e20-31.
48.Spencer,J.and L.M.Sollid,The human intestinal B-cellresponse.Mucosal Immunol,2016.9(5):p.1113-24.
49.Singer,G.A.C.,et al.,Comprehensive biodiversity analysis viaultra-deep patterned flow cell technology:a case study of eDNAmetabarcodingseawater.Sci Rep,2019.9(1):p.5991.
50.Stoeckius,M.,et al.,Simultaneous epitope andtranscriptomemeasurement in single cells.Nat Methods,2017.14(9):p.865-868.
51.Hughes,T.K.,et al.,Second-Strand Synthesis-Based MassivelyParallelscRNA-Seq Reveals Cellular States and Molecular Features of HumanInflammatorySkin Pathologies.Immunity,2020.53(4):p.878-894 e7.
52.Storm,A.J.and P.A.Jensen,Designing Randomized DNA SequencesFree ofRestriction Enzyme Recognition Sites.Biotechnol J,2018.13(1).
53.Ro,S.H.,et al.,Tumor suppressive role of sestrin2 during colitisandcolon carcinogenesis.Elife,2016.5:p.12204.
54.Dobin,A.,et al.,STAR:ultrafast universal RNA-seqaligner.Bioinformatics,2013.29(1):p.15-21.
55.La Manno,G.,et al.,RNA velocity of single cells.Nature,2018.560(7719):p.494-498.
56.Bolte,S.and F.P.Cordelieres,A guided tour intosubcellularcolocalization analysis in light microscopy.J Microsc,2006.224(Pt3):p.213-32.
57.Becht,E.,et al.,Dimensionality reduction for visualizing single-celldata using UMAP.Nat Biotechnol,2019.37:p.38-44。
                         序列表
<110>  密执安大学评议会(THE REGENTS OF THE UNIVERSITY OF MICHIGAN)
<120>  用于组织样品中核酸的局部检测的材料和方法
<130>  PPI23170129US
<150>  US 63/053,238
<151>  2020-07-17
<150>  US 63/141,254
<151>  2021-01-25
<160>  11
<170>  PatentIn version 3.5
<210>  1
<211>  185
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  1
Cys Ala Ala Gly Cys Ala Gly Ala Ala Gly Ala Cys Gly Gly Cys Ala
1               5                   10                  15
Thr Ala Cys Gly Ala Gly Ala Thr Thr Cys Thr Thr Thr Cys Cys Cys
            20                  25                  30
Thr Ala Cys Ala Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys
        35                  40                  45
Gly Ala Thr Cys Thr Asn Asn Val Asn Asn Val Asn Asn Val Asn Asn
    50                  55                  60
Val Asn Asn Val Asn Asn Asn Asn Asn Thr Cys Thr Thr Gly Thr Gly
65                  70                  75                  80
Ala Cys Thr Ala Cys Ala Gly Cys Ala Cys Cys Cys Thr Cys Gly Ala
                85                  90                  95
Cys Thr Cys Thr Cys Gly Cys Thr Thr Thr Thr Thr Thr Thr Thr Thr
            100                 105                 110
Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr
        115                 120                 125
Thr Thr Thr Thr Thr Ala Ala Ala Gly Ala Cys Thr Thr Thr Cys Ala
    130                 135                 140
Cys Cys Ala Gly Thr Cys Cys Ala Thr Gly Ala Thr Gly Thr Gly Thr
145                 150                 155                 160
Ala Gly Ala Thr Cys Thr Cys Gly Gly Thr Gly Gly Thr Cys Gly Cys
                165                 170                 175
Cys Gly Thr Ala Thr Cys Ala Thr Thr
            180                 185
<210>  2
<211>  197
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  2
Cys Ala Ala Gly Cys Ala Gly Ala Ala Gly Ala Cys Gly Gly Cys Ala
1               5                   10                  15
Thr Ala Cys Gly Ala Gly Ala Thr Thr Cys Thr Thr Thr Cys Cys Cys
            20                  25                  30
Thr Ala Cys Ala Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys
        35                  40                  45
Gly Ala Thr Cys Thr Asn Asn Val Asn Asx Val Asn Asn Val Asn Asn
    50                  55                  60
Val Asn Asn Val Asn Asn Val Asn Asn Val Asn Asn Val Asn Asn Val
65                  70                  75                  80
Asn Asn Asn Asn Asn Thr Cys Thr Thr Gly Thr Gly Ala Cys Thr Ala
                85                  90                  95
Cys Ala Gly Cys Ala Cys Cys Cys Thr Cys Gly Ala Cys Thr Cys Thr
            100                 105                 110
Cys Gly Cys Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr
        115                 120                 125
Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr Thr
    130                 135                 140
Thr Ala Ala Ala Gly Ala Cys Thr Thr Thr Cys Ala Cys Cys Ala Gly
145                 150                 155                 160
Thr Cys Cys Ala Thr Gly Ala Thr Gly Thr Gly Thr Ala Gly Ala Thr
                165                 170                 175
Cys Thr Cys Gly Gly Thr Gly Gly Thr Cys Gly Cys Cys Gly Thr Ala
            180                 185                 190
Thr Cys Ala Thr Thr
        195
<210>  3
<211>  83
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  3
Ala Thr Cys Ala Thr Gly Gly Ala Cys Thr Gly Gly Thr Gly Ala Ala
1               5                   10                  15
Ala Gly Thr Cys Thr Thr Thr Ala Ala Ala Ala Ala Ala Ala Ala Ala
            20                  25                  30
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
        35                  40                  45
Ala Ala Ala Ala Ala Gly Cys Gly Ala Gly Ala Gly Thr Cys Gly Ala
    50                  55                  60
Gly Gly Gly Thr Gly Cys Thr Gly Thr Ala Gly Thr Cys Ala Cys Ala
65                  70                  75                  80
Ala Gly Ala
<210>  4
<211>  32
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  4
Thr Cys Ala Gly Ala Cys Gly Thr Gly Thr Gly Cys Thr Cys Thr Thr
1               5                   10                  15
Cys Cys Gly Ala Thr Cys Thr Asn Asn Asn Asn Asn Asn Asn Asn Asn
            20                  25                  30
<210>  5
<211>  20
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  5
Thr Cys Thr Thr Thr Cys Cys Cys Thr Ala Cys Ala Cys Gly Ala Cys
1               5                   10                  15
Gly Cys Thr Cys
            20
<210>  6
<211>  20
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  6
Thr Cys Ala Gly Ala Cys Gly Thr Gly Thr Gly Cys Thr Cys Thr Thr
1               5                   10                  15
Cys Cys Gly Ala
            20
<210>  7
<211>  49
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  7
Ala Ala Thr Gly Ala Thr Ala Cys Gly Gly Cys Gly Ala Cys Cys Gly
1               5                   10                  15
Ala Gly Ala Thr Cys Thr Ala Cys Ala Cys Thr Cys Thr Thr Thr Cys
            20                  25                  30
Cys Cys Thr Ala Cys Ala Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr
        35                  40                  45
Cys
<210>  8
<211>  55
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  8
Cys Ala Ala Gly Cys Ala Gly Ala Ala Gly Ala Cys Gly Gly Cys Ala
1               5                   10                  15
Thr Ala Cys Gly Ala Gly Ala Thr Gly Thr Gly Ala Cys Thr Gly Gly
            20                  25                  30
Ala Gly Thr Thr Cys Ala Gly Ala Cys Gly Thr Gly Thr Gly Cys Thr
        35                  40                  45
Cys Thr Thr Cys Cys Gly Ala
    50                  55
<210>  9
<211>  145
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  9
Cys Ala Ala Gly Cys Ala Gly Ala Ala Gly Ala Cys Gly Gly Cys Ala
1               5                   10                  15
Thr Ala Cys Gly Ala Gly Ala Thr Thr Cys Thr Thr Thr Cys Cys Cys
            20                  25                  30
Thr Ala Cys Ala Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys
        35                  40                  45
Gly Ala Thr Cys Thr His Asn Asn Asx Asn Asx Asn Asx Asn Asx Asn
    50                  55                  60
Asx Asn Asx Asn Asx Asn Asn Asn Asn Cys Cys Cys Gly Thr Thr Cys
65                  70                  75                  80
Gly Cys Ala Ala Cys Ala Thr Gly Thr Cys Thr Gly Gly Cys Gly Thr
                85                  90                  95
Cys Ala Thr Ala Gly Ala Ala Thr Thr Cys Cys Gly Cys Ala Gly Thr
            100                 105                 110
Cys Cys Ala Gly Gly Thr Gly Thr Ala Gly Ala Thr Cys Thr Cys Gly
        115                 120                 125
Gly Thr Gly Gly Thr Cys Gly Cys Cys Gly Thr Ala Thr Cys Ala Thr
    130                 135                 140
Thr
145
<210>  10
<211>  43
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  10
Cys Thr Gly Gly Ala Cys Thr Gly Cys Gly Gly Ala Ala Thr Thr Cys
1               5                   10                  15
Thr Ala Thr Gly Ala Cys Gly Cys Cys Ala Gly Ala Cys Ala Thr Gly
            20                  25                  30
Thr Thr Gly Cys Gly Ala Ala Cys Gly Gly Gly
        35                  40
<210>  11
<211>  66
<212>  PRT
<213>  人工序列
<220>
<223>  合成
<400>  11
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1               5                   10                  15
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Asn Asn
            20                  25                  30
Asn Asn Asn Asn Asn Asn Cys Thr Ala Thr Gly Ala Cys Gly Cys Cys
        35                  40                  45
Ala Gly Ala Cys Ala Thr Gly Thr Thr Gly Cys Gly Ala Ala Cys Gly
    50                  55                  60
Gly Gly
65

Claims (41)

1.一种用于空间检测在组织样品中核酸的基板,所述基板包括固定在所述基板表面上的多个捕获探针,其中:
a.每个捕获探针包括捕获域和空间条形码;
b.所述多个捕获探针被布置成簇,每个簇包括多个捕获探针;
c.在簇中的每个捕获探针都包括相同的空间条形码;以及
d.每个簇的所述空间条形码是唯一的,
其中,所述基板每1mm2表面包括50-200万个簇。
2.根据权利要求1所述的基板,其中,每个簇包括至少200个捕获探针。
3.根据权利要求1所述的基板,其中,每个簇包括至少500个捕获探针。
4.根据权利要求1所述的基板,其中,每个簇包括至少800个捕获探针。
5.根据前述权利要求中任一项所述的基板,其中,每个簇具有500-1200nm的直径。
6.根据权利要求5所述的基板,其中,每个簇具有0.6μm的平均直径。
7.根据前述权利要求中任一项所述的基板,其中,所述基板每1mm2的表面包括约150万个簇。
8.根据前述权利要求中任一项所述基板,其中,所述表面包括选自以下的材料:玻璃、硅、聚-L-赖氨酸涂覆材料、硝酸纤维素、聚苯乙烯、环烯烃共聚物(COC)、环烯烃聚合物(COP)、聚丙烯酰胺、聚丙烯、聚乙烯和聚碳酸酯。
9.根据前述权利要求中任一项所述的基板,其中,每个捕获探针的所述捕获域是相同的。
10.根据前述权利要求中任一项所述的基板,其中,所述捕获域包括含有至少10个脱氧胸苷残基的多聚T寡核苷酸或与靶核酸的核苷酸序列互补的DNA序列。
11.根据前述权利要求中任一项所述的基板,其中,每个捕获探针进一步包括测序条形码。
12.根据前述权利要求中任一项所述的基板,其中,每个捕获探针进一步包括一个或多个填充序列。
13.根据前述权利要求中任一项所述的基板,其中,在簇中的每个捕获探针包括唯一分子标识符(UMI)条形码。
14.根据前述权利要求中任一项所述的基板,其中,每个捕获探针进一步包括裂解域。
15.根据权利要求14所述的基板,其中,所述裂解域包括用于限制性内切核酸酶的结合位点。
16.根据前述权利要求中任一项所述的基板,其中,所述核酸是RNA。
17.一种包括将前述权利要求中任一项所述的基板复制到第二介质以产生第二基板的方法。
18.一种用于空间检测在组织样品中RNA的方法,包括:
a.提供前述权利要求中的任一项所述的基板;
b.使所述基板与组织样品接触,并且允许所述组织样品的RNA分子结合捕获探针的捕获域;
c.从结合的RNA分子生成cDNA分子;以及
d.测序所述cDNA分子。
19.根据权利要求18所述的方法,进一步包括在测序之前回收并扩增所述cDNA分子。
20.根据权利要求18或19所述的方法,进一步包括在使所述基板与所述组织样品接触之前确定在所述基板上的每个捕获探针簇的位置。
21.根据权利要求20所述的方法,其中,确定每个簇的位置包括确定在每个簇中至少一个捕获探针的空间条形码的序列,并将所述序列分配到在所述基板上的位置。
22.根据权利要求21所述的方法,其中,通过下一代测序来确定所述空间条形码的序列。
23.根据权利要求21或22所述的方法,进一步包括将每个测序的cDNA分子的所述空间条形码的序列与具有相应空间条形码的在所述基板上的所述捕获探针簇的位置相关联。
24.根据权利要求23所述的方法,进一步包括在生成所述cDNA分子之前或之后对所述组织成像。
25.根据权利要求24所述的方法,进一步包括通过将在所述基板上的所述捕获探针簇的位置与在所述组织样品内的相应位置相关联来确定在所述组织样品内RNA分子的空间位置。
26.一种用于在组织样品中空间检测核酸的方法,包括:
a.提供前述权利要求中的任一项所述的基板;
b.使所述基板与组织样品接触,并且允许所述组织样品的核酸分子结合捕获探针的捕获域;以及
c.测序结合的核酸分子。
27.根据权利要求26所述的方法,进一步包括在使所述基板与所述组织样品接触之前确定在所述基板上的每个捕获探针簇的位置。
28.根据权利要求27所述的方法,其中,确定每个簇的位置包括确定在每个簇中至少一个捕获探针的空间条形码的序列,并将所述序列分配到在所述基板上的位置。
29.根据权利要求28所述的方法,其中,通过下一代测序来确定所述空间条形码的序列。
30.根据权利要求28或29所述的方法,进一步包括将每个测序的核酸分子的所述空间条形码的序列与具有相应空间条形码的在所述基板上的所述捕获探针簇的位置相关联。
31.根据权利要求30所述的方法,进一步包括在对所述核酸分子测序之前或之后对所述组织成像。
32.根据权利要求31所述的方法,进一步包括通过将在所述基板上的所述捕获探针簇的位置与在所述组织样品内的相应位置相关联来确定在所述组织样品内所述核酸分子的空间位置。
33.一种用于空间检测在组织样品中RNA的方法,包括:
a.提供前述权利要求中的任一项所述的基板;
b.确定在所述基板上的每个捕获探针簇的空间条形码的序列;
c.确定在所述基板上的每个捕获探针簇的空间位置;
d.使所述基板与组织样品接触,并且允许所述组织样品的RNA分子结合所述捕获探针的捕获域;
e.从结合的RNA分子生成cDNA分子;
f.恢复所述cDNA分子并且扩增它们以生成cDNA文库;
g.对所述cDNA文库进行测序,以确定每个分子的空间条形码序列;以及
h.通过将所述cDNA分子的所述空间条形码序列与在包含相应空间条形码序列的所述基板上的所述捕获探针簇的空间位置相关联,来确定一个或多个cDNA分子的空间位置。
34.根据权利要求18-33中任一项所述的方法,其中,所述方法确定在所述组织样品内的单个细胞内的RNA表达。
35.根据权利要求34所述的方法,其中,所述方法确定在所述单个细胞内的亚细胞组分中的RNA表达。
36.根据权利要求35所述的方法,其中,所述方法确定在所述细胞的核、细胞质和/或线粒体内的RNA表达。
37.一种试剂盒,所述试剂盒包括权利要求1-17中任一项所述的基板。
38.根据权利要求1-17中任一项所述的基板在用于确定在组织样品内RNA分子的空间位置的方法中的用途。
39.一种测定在组织样品中的单个细胞中RNA表达的方法,包括使所述组织样品与权利要求1-17中任一项所述的基板接触。
40.一种测定在组织样品中的单个细胞的亚细胞组分中RNA表达的方法,包括使所述组织样品与权利要求1-17中任一项所述的基板接触。
41.根据权利要求40所述的方法,其中,所述亚细胞组分包括核、细胞质和/或线粒体。
CN202180062321.2A 2020-07-17 2021-07-15 用于组织样品中核酸的局部检测的材料和方法 Pending CN116097360A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063053238P 2020-07-17 2020-07-17
US63/053,238 2020-07-17
US202163141254P 2021-01-25 2021-01-25
US63/141,254 2021-01-25
PCT/US2021/041725 WO2022015913A1 (en) 2020-07-17 2021-07-15 Materials and methods for localized detection of nucleic acids in a tissue sample

Publications (1)

Publication Number Publication Date
CN116097360A true CN116097360A (zh) 2023-05-09

Family

ID=79554297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180062321.2A Pending CN116097360A (zh) 2020-07-17 2021-07-15 用于组织样品中核酸的局部检测的材料和方法

Country Status (4)

Country Link
US (3) US20240043913A1 (zh)
EP (1) EP4182462A1 (zh)
CN (1) CN116097360A (zh)
WO (1) WO2022015913A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2620510T4 (da) * 2005-06-15 2020-03-30 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
GB201106254D0 (en) * 2011-04-13 2011-05-25 Frisen Jonas Method and product
JP6828007B2 (ja) * 2015-04-10 2021-02-10 スペーシャル トランスクリプトミクス アクチボラグ 生物学的試料の空間識別されるマルチプレックスな核酸分析
US11729472B2 (en) * 2019-12-03 2023-08-15 International Business Machines Corporation Content access based on location token
CN115461473A (zh) * 2020-02-20 2022-12-09 加利福尼亚大学董事会 空间分辨单细胞rna测序方法

Also Published As

Publication number Publication date
EP4182462A1 (en) 2023-05-24
US20240229102A9 (en) 2024-07-11
US20240043913A1 (en) 2024-02-08
US20240132936A1 (en) 2024-04-25
US11713480B2 (en) 2023-08-01
WO2022015913A1 (en) 2022-01-20
US20220372547A1 (en) 2022-11-24

Similar Documents

Publication Publication Date Title
Cho et al. Microscopic examination of spatial transcriptome using Seq-Scope
US11898205B2 (en) Increasing capture efficiency of spatial assays
US20230069046A1 (en) Methods for increasing resolution of spatial analysis
EP3891300B1 (en) Methods for spatial analysis using rna-templated ligation
US20230126825A1 (en) Methods of measuring mislocalization of an analyte
AU2020200418B2 (en) Generating cell-free DNA libraries directly from blood
US20230081381A1 (en) METHODS TO COMBINE FIRST AND SECOND STRAND cDNA SYNTHESIS FOR SPATIAL ANALYSIS
US20230279477A1 (en) Methods for spatial analysis using targeted rna capture
US9330295B2 (en) Spatial sequencing/gene expression camera
CN114787348A (zh) 用于空间组学测序的确定性条形码
US20230340590A1 (en) Method for verifying bioassay samples
CA2826384C (en) A method for detecting chromosome structure and gene expression simultaneously in single cells
Cho et al. Seq-Scope: Submicrometer-resolution spatial transcriptomics for single cell and subcellular studies
US20230167495A1 (en) Systems and methods for identifying regions of aneuploidy in a tissue
US20230306593A1 (en) Systems and methods for spatial analysis of analytes using fiducial alignment
CN116097360A (zh) 用于组织样品中核酸的局部检测的材料和方法
CN108977435A (zh) 陈旧血痕miRNA高通量测序文库的构建方法
US20240052404A1 (en) Systems and methods for immunofluorescence quantification
KR20240012460A (ko) 생물학적 샘플에서 단일 세포를 찾고 프로파일링하기 위한 방법 및 구조물
KR20220106153A (ko) 표적 분석과 관련된 조성물, 세트, 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination