CN113215234A - 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用 - Google Patents

一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用 Download PDF

Info

Publication number
CN113215234A
CN113215234A CN202110646186.8A CN202110646186A CN113215234A CN 113215234 A CN113215234 A CN 113215234A CN 202110646186 A CN202110646186 A CN 202110646186A CN 113215234 A CN113215234 A CN 113215234A
Authority
CN
China
Prior art keywords
rna
seq
lace
protein
binding protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110646186.8A
Other languages
English (en)
Inventor
薛愿超
苏瑞宝
曹唱唱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Biophysics of CAS
Original Assignee
Institute of Biophysics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Biophysics of CAS filed Critical Institute of Biophysics of CAS
Priority to CN202110646186.8A priority Critical patent/CN113215234A/zh
Publication of CN113215234A publication Critical patent/CN113215234A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种鉴定RNA结合蛋白靶位点的方法LACE‑seq及试剂盒和应用,属于生物技术领域。本发明提供了一种在微量细胞中以单碱基分辨率精度鉴定RNA结合蛋白靶位点的新方法LACE‑seq,采用交联法诱导蛋白与其结合的RNA形成共价键,利用特异性抗体免疫共沉淀蛋白质‑RNA复合物,通过线性扩增逆转录酶在RNA结合蛋白结合位点处的终止信号,实现了在全转录组范围内准确鉴定RNA结合蛋白的靶位点。本发明所述LACE‑seq方法及试剂盒可用于在各种类型细胞、组织和穿刺样本中***研究RNA结合蛋白调控基因表达的分子机制,为理解RNA结合蛋白在分化、发育和疾病发生中的调控机理提供了新工具。

Description

一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和 应用
技术领域
本发明属于生物技术领域,具体涉及一种鉴定RNA结合蛋白靶位点的方法LACE-seq及相关试剂盒和应用。
背景技术
人类基因组编码了约2000个RNA结合蛋白,它们参与了基因表达的各个步骤,在遗传信息传递过程中发挥了关键的调控作用,并与各种恶性肿瘤、神经退行性疾病、代谢性疾病、***不育和生殖缺陷等密切相关。鉴定RNA结合蛋白的作用靶标及具体结合位置是理解其功能机制的前提。当前,研究RNA结合蛋白靶位点的方法主要有CLIP-seq、iCLIP、eCLIP、irCLIP和RIP-seq等[1~11]
紫外交联免疫沉淀测序技术(crosslinking-immunprecipitation and high-throughput sequencing,CLIP-Seq),是一种将紫外交联免疫沉淀(crosslinking-immunprecipitation,CLIP)与高通量测序相结合的革命性技术。该技术可在全转录组范围内鉴定RNA结合蛋白在转录本上的结合位点。CLIP-seq提供了一种高分辨率、高特异性、高覆盖度的研究蛋白质-RNA相互作用的新策略。CLIP-seq技术可以应用到任何基因组序列已知的物种,可以研究任何一种RNA相关蛋白与其靶定RNA之间的相互作用,并能确切得到蛋白质所结合的每一个片段的序列信息。随着测序成本的降低,CLIP-seq逐步成为研究基因调控和RNA结合蛋白功能的常用手段。其基本原理是:在生理状态下,首先利用紫外线(UV-C,254nm)处理细胞,以固定蛋白质及其相互作用的RNA;然后裂解细胞,通过RNA酶对蛋白质未保护的RNA进行片段化;之后利用特异性的抗体富集与目的蛋白质相结合的RNA片段;对RNA片段的3'端羟基化并加接头、5'端32P同位素标记,接着将富集的RNA结合蛋白及共价结合的RNA片段进行SDS-PAGE胶分离并转膜,切取符合RNA结合蛋白-RNA复合物大小的尼龙膜后蛋白酶K消减RNA结合蛋白,富集RNA片段并连接5'接头,接着根据已知3'接头序列进行反转录反应至cDNA,最后利用PCR进行文库制备和高通量测序;进而结合生物信息学分析的手段,在全转录组范围内鉴定RNA结合蛋白的结合位点。利用CLIP-seq技术可获得全转录组范围内与RNA结合蛋白相互作用的RNA序列信息,其长度大约为50个核苷酸,从而有助于深入研究RNA结合蛋白的调控网络和作用机制。
虽然传统的CLIP-seq技术具有高分辨率、低噪音、高覆盖率等优点,但也存在一些问题:第一,目前CLIP-seq对样本起始量要求过高,细胞投入总量至少需要107;第二,实验步骤冗繁,需要经历紫外交联、细胞裂解、抗体富集目的蛋白与RNA复合物、RNA片段3'末端接头连接、5'端32P同位素标记、RNA结合蛋白及共价结合的RNA片段进行SDS-PAGE胶分离并转膜、切取符合RNA结合蛋白-RNA复合物大小的尼龙膜、蛋白酶K消减RNA结合蛋白、富集RNA片段并连接5'接头、反转录反应至cDNA,最后利用PCR进行文库制备,这也要求了较高样本起始量。CLIP-seq对样本起始量的要求限制了该技术在微量样本和珍稀材料的应用。
参考文献
[1]Dahl J A,Jung I,Aanes H,et al.Broad histone H3K4me3 domains inmouse oocytes modulate maternal-to-zygotic transition.Nature,2016,537(7621):548
[2]Xue,Y.et al.Direct conversion of fibroblasts to neurons byreprogramming PTB-regulated microRNA circuits.Cell 152,82-96(2013).
[3]Coelho,M.B.et al.Nuclear matrix protein Matrin3 regulatesalternative splicing and forms overlapping regulatory networks with PTB.TheEMBO journal 34,,653-668(2015).
[4]Stein,P.et al.Essential Role for endogenous siRNAs during meiosisin mouse oocytes.PLoS genetics 11,e1005013(2015).
[5]Licatalosi,D.D.et al.HITS-CLIP yields genome-wide insights intobrain alternative RNA processing.Nature 456,464-469(2008).
[6]Yeo,G.W.et al.An RNA code for the FOX2 splicing regulator revealedby mapping RNA-protein interactions in stem cells.Nature structural&molecularbiology 16,130-137(2009).
[7]Konig,J.et al.iCLIP reveals the function of hnRNP particles insplicing at individual nucleotide resolution.Nature structural&molecularbiology 17,909-915(2010).
[8]Van Nostrand,E.L.et al.Robust transcriptome-wide discovery of RNA-binding protein binding sites with enhanced CLIP(eCLIP).Nature methods 13,508-514(2016).
[9]Zarnegar,B.J.et al.irCLIP platform for efficient characterizationof protein-RNA interactions.Nature methods 13,489-492(2016).
[10]Masuda,A.et al.tRIP-seq reveals repression of prematurepolyadenylation by co-transcriptional FUS-U1 snRNP assembly.EMBO reports 21,e49890(2020).
[11]Zhao,J.et al.Genome-wide identification of polycomb-associatedRNAs by RIP-seq.Molecular cell 40,939-953(2010).
发明内容
本发明的目的是提供一种在微量细胞中鉴定RNA结合蛋白靶位点的方法LACE-seq及对应的试剂盒,以研究RNA结合蛋白在发育和疾病发生过程中的功能机制。
本发明提供了一种在微量细胞中鉴定RNA结合蛋白靶位点的方法,包括以下步骤:1)将微量细胞样本进行紫外交联,得到交联后的细胞;
2)将步骤1)所述交联后的细胞进行裂解,所得细胞裂解液与目标蛋白特异性抗体混合孵育,富集得到目标蛋白所结合的RNA;
3)对步骤2)所述目标蛋白结合的RNA进行片段化处理,并对所得片段化RNA进行去磷酸化,加3'末端接头,得到目标蛋白所结合的且3'末端接头连接后的RNA片段;
4)对步骤3)目标蛋白所结合的且3'末端接头连接后的RNA片段进行逆转录,得到一组cDNA片段;
5)对步骤4)所述一组cDNA片段进行3'端加多聚腺苷酸尾巴,合成二链cDNA片段;
6)将步骤5)所述二链cDNA片段进行LACE-seq文库预扩增,得到预扩增产物;
7)将步骤6)所述预扩增产物进行体外转录,得到一组RNA片段;
8)将步骤7)所述RNA片段经二次逆转录为cDNA,得到的cDNA进行LACE-seq文库扩增,得到LACE-seq文库;
9)对步骤8)所述LACE-seq文库进行高通量测序,将测序片段比对到所述细胞对应的参考基因组,得到目标蛋白在全转录组内的靶位点。
优选的,步骤1)中所述微量细胞样本中含有的细胞数量为1~1000个。
优选的,步骤1)中所述紫外交联时,紫外线的波长为254nm;所述紫外线的能量为400mJ。
优选的,步骤3)中所述片段化处理用酶为微球菌核酸酶;
所述微球菌核酸酶的稀释倍数为6×105~3×106
优选的,步骤3)中所述去磷酸化的反应体系为20μl,具体包括:1μl FastAP热敏感性碱性磷酸酶,2μl 10×FastAP缓冲液,17μl含所述片段化RNA的无核酸酶水;
所述去磷酸化的条件在36~38℃的条件下反应9~12min。
优选的,步骤3)中所述加3'末端接头的反应体系为20μl,具体包括:0.5μl 1μM的3'末端接头,2μl 10×T4 RNA连接酶缓冲液,0.5μl T4 RNA连接酶2,4μl质量浓度为50%的PEG8000,13μl含去磷酸后的RNA的无核酸酶水;
所述加3'末端接头的反应条件为在24~26℃的条件下反应1.5~2.5h。
本发明提供了实施所述微量细胞中鉴定RNA结合蛋白靶位点方法的试剂盒,包括以下组分:
蛋白A/G磁珠、封闭缓冲液、洗涤缓冲液、PNK缓冲液、含EGTA的PNK缓冲液、结合和洗涤缓冲液、SPRI AMPure XP磁珠、SPRI RNA Clean磁珠、C1链霉素磁珠、目标蛋白抗体、3'末端接头、逆转录用引物、LACE-seq文库预扩增用引物、LACE-seq文库扩增用引物和单端分子标签引物。
优选的,所述3'末端接头的核苷酸序列如SEQ ID NO:1所示;
所述逆转录用引物的核苷酸序列如SEQ ID NO:2和SEQ ID NO:3所示;
所述LACE-seq文库预扩增用引物的核苷酸序列如SEQ ID NO:4所示;
所述LACE-seq文库扩增用引物的核苷酸序列如SEQ ID NO:5所示;
所述单端分子标签引物的核苷酸序列如SEQ ID NO:6所示。
优选的,所述试剂盒还包括微球菌核酸酶缓冲液、PBS溶液、质量浓度为0.2%BSA水溶液。
本发明提供了所述的试剂盒在以下一种或多种方法中的应用:构建RNA结合蛋白靶位点文库、研究蛋白质与RNA互作关系和鉴定或辅助鉴定RNA结合蛋白的结合位点。
本发明提供了一种在微量细胞中鉴定RNA结合蛋白靶位点的方法LACE-seq,LACE-seq方法的基本原理是对细胞进行紫外交联以固定蛋白质与RNA之间的相互作用,之后利用抗体特异性富集蛋白质与RNA的复合物,在对RNA进行3'末端接头连接后,便可进行反转录,当逆转录酶遇到RNA结合蛋白的交联位点后便会产生反转录终止产物,通过对反转录cDNA的末端进行测序便可推断出RNA结合蛋白在RNA上的精确结合位置。本发明提供的方法能从微量或者单细胞样品中制备得到RNA结合蛋白的靶位点文库,从而对一些无法利用常规方法构建文库的样本进行有效研究,并且文库的制备是针对微量或者单细胞,有效的节省试剂及实验所需费用。同时本发明提供的方法能够有效缩短文库制备的周期,与常规CLIP-seq文库制备需要6-7天的建库周期相比,本发明提供的方法多是在磁珠上进行,从而使文库构建的时间缩短为2-3天,极大的节省了实验周期,提高了工作效率。
附图说明
图1为LACE-seq方法流程及与传统CLIP-seq方法的比较结果;其中a为LACE-seq方法流程图;b为Agilent 2100分析仪检测PTBP1 LACE-seq文库的片段分布结果;c为不同细胞投入量的PTBP1 LACE-seq文库重复性分析结果;d为PTBP1 LACE-seq文库与CLIP-seq文库的Peason相关性分析结果;e为PTBP1 LACE-seq、CLIP-seq和iCLIP的Peak相对位置;f为PTBP1 LACE-seq和CLIP-seq信号在EIF4G1转录本上的分布结果;g为不同细胞量投入的PTBP1 LACE-seq文库结合基序富集分析结果;h为不同细胞量投入的PTBP1 LACE-seq文库reads在CU富集基序的分布结果;i为PTBP1 LACE-seq文库peak中逆转录阻滞reads占比与CU富集基序数量的相关性统计结果;j为PTBP1 LACE-seq文库peak中reads的数量与CU富集基序数量的相关性统计结果;k为不同细胞量投入的PTBP1 LACE-seq文库敏感性统计结果;l为不同细胞量投入的PTBP1 LACE-seq文库精确度统计;m为PTBP1 LACE-seq和CLIP-seq信号在PGRC5A和HMGA1转录本上的分布结果;n为PTBP1分别在LACE-seq和CLIP-seq数据中参与可变性剪接事件的累积分布趋势结果;o为PTBP1分别在LACE-seq和CLIP-seq数据中靶位点的RNA转录水平统计结果;
图2为LACE-seq鉴定Ddx4在小鼠***内的结合靶标;其中a为不同稀释浓度的微球菌核酸酶处理的Ddx4 LACE-seq文库reads比对到基因组上的分布统计结果;b为不同稀释浓度的微球菌核酸酶处理的Ddx4 LACE-seq文库鉴定到的peaks数统计结果;c为不同***投入量的Ddx4 LACE-seq文库Pearson相关性统计结果;d为不同***投入量的Ddx4LACE-seq文库信号在Hspa1l基因上的分布结果;e为Ddx4 LACE-seq reads在基因组中分布统计。f为Ddx4蛋白的结合基序统计结果;g为Ddx4 LACE-seq文库信号在Pou5f1基因上的分布展示结果;h为凝胶阻滞实验分析Ddx4蛋白结合野生型探针和突变型探针的情况;i为Ddx4蛋白对野生型探针和突变型探针的结合能力统计结果;
图3为LACE-seq鉴定Ago2和Mili在***内的靶标;其中a为Ago2、Mili和Ptbp1蛋白LACE-seq文库Pearson相关性分析结果;b为Ago2 LACE-seq reads在基因组中分布统计结果;c为Mili LACE-seq reads在基因组中分布统计。d为Ago2和Mili蛋白靶基因交集统计结果;e为小RNA及Ago2和Mili LACE-seq文库信号在Kif4基因上的分布展示解脱;f为Ago2特异性结合的靶基因功能富集统计结果;
图4为在***中敲除Ago2导致的转录组变化结果;其中a为野生型和Ago2敲除***的免疫荧光图;b为野生型和Ago2敲除***的RNA-seq信号在Ago2基因上的分布展示结果;c为Ago2敲除***内差异基因展示结果;d为Ago2敲除***内上调基因功能富集结果;e为不同Ago2结合强度梯度的靶基因的累积分布趋势结果;f为不同Ago2结合强度梯度的上调靶基因的累积分布趋势结果;
图5为Ago2/endo-siRNA复合物抑制反转座子嵌合转录本的生成结果;其中a为小RNA和Ago2的LACE-seq信号在不同LTR亚型驱动的嵌合转录本上的分布结果;b为筛选Ago2调控LTR驱动的嵌合转录本的流程;c为Ago2调控LTR驱动的嵌合转录本的累积分布趋势结果;d为驱动嵌合转录本的LTR亚型统计结果;
图6为endo-siRNA对靶标的识别规则;其中a为与小RNA信号重叠的Ago2靶位点及非重叠靶位点在基因组上的分布统计结果;b为两群不同Ago2靶位点在不同转录本上的信号展示结果;c为endo-siRNA-336的完全互补配对靶序列和双位点突变的靶序列展示以及荧光报告***分析检测结果;d为Ago2靶位点及其互作的endo-siRNA匹配预测流程图;e为两款不同软件预测到的Ago2靶位点及其互作的endo-siRNA的匹配数量结果;f为所有预测到的Ago2靶位点及其互作的endo-siRNA的匹配能量分布结果;g为两类与endo-siRNA匹配能量强弱的靶基因统计结果;
图7为转座元件产生的endo-siRNA可抑制mRNA翻译结果;其中a为Ago2 LACE-seq信号在不同转录本的分布及endo-siRNA预测靶位点结果;b为endo-siRNA与靶基因片段的匹配结构结果;c为荧光报告***监测不同基因片段对翻译效率的影响;d为RT-qPCR检测荧光素酶mRNA的表达情况;e为突变endo-siRNA靶位点后检荧测光素酶活性水平结果;f为sponge RNA竞争性结合endo-siRNA后,Western blot检测endo-siRNA靶基因的翻译情况;g为将Ago2野生型及ADH突变型mRNA分别注射到Ago2敲除的***内免疫荧光观察Bub3的荧光变化;h为将Ago2野生型及ADH突变型mRNA分别注射到Ago2敲除的***内统计Bub3的荧光强度变化;
图8为蛋白组学鉴定endo-siRNA抑制的mRNA靶标结果;其中a为Ago2敲除***进行蛋白质谱分析流程图;b为Ago2敲除***内差异蛋白表达分析结果;c为Ago2结合及未结合转录本的mRNA变化及蛋白变化情况统计;d为Ago2结合的转录本的蛋白表达累积分布趋势结果;e为不同endo-siRNA结合强度的转录本的蛋白表达累积分布趋势结果;f为Ago2蛋白在***内功能流程图。
具体实施方式
本发明提供了一种在微量细胞中鉴定RNA结合蛋白靶位点的方法LACE-seq,包括以下步骤:
1)将微量细胞样本进行紫外交联,得到交联后的细胞;
2)将步骤1)所述交联后的细胞进行裂解,所得细胞裂解液与目标蛋白抗体混合孵育,富集得到目标蛋白所结合的RNA;
3)对步骤2)所述目标蛋白结合的RNA进行片段化处理,对所得片段化RNA进行去磷酸化,加3'末端接头,得到目标蛋白所结合的、且连有接头的RNA片段;
4)对步骤3)接头连接后的RNA片段3'端序列进行逆转录,得到一组cDNA片段;
5)将步骤4)所述一组cDNA片段进行3'端加多聚腺苷酸尾巴,合成二链,得到二链cDNA;
6)将步骤5)所述二链cDNA片段进行LACE-seq文库预扩增,得到预扩增产物;
7)将步骤6)所述预扩增产物进行体外转录,得到一组RNA片段;
8)将步骤7)所述一组RNA片段进行第二逆转录,得到cDNA,进行LACE-seq文库扩增以加上分子标签,从而得到LACE-seq文库;
9)对步骤8)所述LACE-seq文库进行高通量测序,将测序片段比对到所述细胞对应的参考基因组进行可视化展示,得到目标蛋白在全转录组范围内的靶位点。
本发明将微量细胞样本进行紫外交联,得到交联后的细胞。
在本发明中,所述微量细胞样本中含有的细胞数量优选为1~1000个,更优选为1~100个。本发明对所述细胞的种类没有特殊限制,采用本领域所熟知的细胞即可,例如哺乳动物体细胞或生殖细胞。在本发明实施例中,以小鼠***为代表说明在哺乳动物生殖细胞中鉴定RNA结合蛋白靶位点的具体实施方法,以HeLa细胞为代表说明在哺乳动物体细胞内鉴定RNA结合蛋白靶位点的具体实施方法。本发明对所述微量细胞样本的浓度没有特殊限制,采用本领域所熟知的浓度即可。
在本发明中,所述紫外交联时,紫外线的波长优选为254nm;所述紫外线的能量优选为400mJ。所述紫外交联的次数优选为2次。所述紫外交联的时间优选为1~1.5min/次,更优选为1.1min/次。所述紫外交联可使细胞内蛋白质与互作的RNA分子之间形成共价键。
得到交联的细胞后,本发明将所述交联后的细胞进行裂解,所得细胞裂解液与目标蛋白的抗体混合孵育,富集得到目标蛋白所结合的RNA。
本发明对所述交联后的细胞裂解方法没有特殊限制,采用本领域所熟知的细胞裂解方法即可。在本发明实施例中,所述裂解优选采用冰浴法进行。所述冰浴的时间优选为9~12min,更优选为10min。所述冰浴时,优选交联后的细胞在洗涤缓冲液中进行。
在与目标蛋白抗体混合前,优选去除细胞裂解液中的基因组DNA。所述去除基因组DNA的方法是利用脱氧核糖核酸酶I进行酶解。所述酶解的条件优选为在37℃条件下孵育3min。
在本发明中,所述目标蛋白抗体优选将目标蛋白抗体与蛋白A/G磁珠预先进行偶联反应。所述偶联反应的条件优选为36~37℃下反应1~1.5h。所述偶联时,优选包含0.1M的磷酸钠盐缓冲液(pH 8.0)。磷酸钠盐缓冲液的体积与目标蛋白抗体的质量比为50μl:2μg。所述蛋白A/G磁珠优选进行封闭和洗涤。所述封闭用溶液优选为封闭缓冲液。所述洗涤用溶液优选为磷酸钠缓冲液。本发明对所述目标蛋白的种类不做具体限定,采用本领域所熟知的目标蛋白即可。在本发明实施例中,所述目的蛋白为Ddx4、Ptbp1、Ago2、Mili和PTBP1,所述目的蛋白抗体依次对应为Ddx4抗体(abcam,ab108392)、Ptbp1抗体(abcam,ab133734)、Ago2抗体(abcam,ab186733)、Mili抗体(CST,2071)和PTBP1抗体(sigma,monoclonal BB7)。
在本发明中,所述富集方法优选利用目标蛋白抗体与目标蛋白发生特异性结合反应,从而形成RNA-目标蛋白-目标蛋白抗体-磁珠复合物,利用磁力架的磁场力,使所述复合物从溶液中分离出来。分离后的复合物优选用洗涤缓冲液和PNK缓冲液漂洗并重悬。
得到目标蛋白所结合的RNA,本发明对所述目标蛋白结合的RNA进行片段化处理,对片段化的RNA的3'端去磷酸化,加3'末端接头,得到目标蛋白所结合的且连有接头的RNA片段。
在本发明中,所述片段化用酶优选为微球菌核酸酶;所述微球菌核酸酶的稀释倍数优选为6×105~3×106倍,更优选为8×105~1×106倍。所述稀释用溶液优选为微球菌核酸酶缓冲液。在所述RNA片段化后,优选还包括对所述片段化的RNA进行漂洗。所述漂洗依次包括含EGTA的PNK缓冲液、洗涤缓冲液漂洗和PNK缓冲液漂洗。每种漂洗液的漂洗次数优选包括2~3次。所述片段化的目的是对目标蛋白所结合的RNA进行酶切,以去掉不受蛋白质保护的RNA片段,保留与蛋白质直接结合的RNA区域用于后续去磷酸化。
在本发明中,所述去磷酸化的反应体系优选为20μl,具体包括:1μl FastAP碱性磷酸酶,2μl 10×FastAP缓冲液,17μl含片段化RNA的无核酸酶水。所述去磷酸化的条件优选为在36~38℃的条件下反应9~12min,更优选为37℃的条件下反应10min。去磷酸后优选依次包括含EGTA的PNK缓冲液、洗涤缓冲液和PNK缓冲液漂洗。
在本发明中,所述加3'末端接头是针对与蛋白质结合的RNA片段的3'端添加接头。所述加3'末端接头的反应体系优选为20μl,具体包括:0.5μl 1μM的3'端接头(SEQ ID NO:1),2μl 10×T4 RNA ligase缓冲液,0.5μl T4 RNA ligase 2,4μl质量浓度为50%的PEG8000,13μl含去磷酸化RNA的无核酸酶水。所述加接头的反应条件优选为在24~26℃的条件下反应1.5~2.5h,更优选为25℃的条件下反应2h。加接头后优选进行PNK缓冲液漂洗。
加3'末端接头后,本发明对目标蛋白所结合的RNA片段的3'端进行逆转录,得到一组cDNA片段。
在本发明中,所述逆转录优选在逆转录酶的作用下进行。所述逆转录所用的引物优选为5'端生物素修饰并含有T7启动子的核苷酸序列(SEQ ID NO:2),用于合成cDNA,所述逆转录还包括cDNA二链的合成。所述二链cDNA的合成引物序列如SEQ ID NO:3所示。所述逆转录优选在65℃的条件下变性并立刻置于冰上,再加入逆转录反应混合物(3μl 5×firststrand buffer,1μl 10mM dNTP,0.5μl 100mM DTT,0.5μl RNase抑制剂、0.5μlSuperScript II,用无核酸酶的水补充体积至20μl)。所述逆转录的反应条件优选为:42℃反应50min;70℃反应15min;12℃保温。所述逆转录从与目标蛋白结合的RNA片段的3'端开始,直至目的蛋白的结合位点而终止。
逆转录后,优选将cDNA产物中过量的引物降解,并将单链cDNA从蛋白A/G磁珠上释放,然后利用C1链霉素磁珠富集cDNA片段。降解过量引物的方法优选采用核酸外切酶Ⅰ进行酶解。所述酶解的条件优选在37℃下反应1h,再在80℃下反应20min。所述将单链cDNA从蛋白A/G磁珠上释放的方法优选在核糖核酸酶H的切割作用下,使cDNA从RNA/cDNA-目标蛋白-目标蛋白抗体-磁珠的复合物上释放出来。所述C1链霉素磁珠富集cDNA片段优选将洗涤后的C1链霉素磁珠与cDNA产物孵育,在磁力架的作用下,去除上清,用1×结合和洗涤缓冲液漂洗,再用BSA溶液漂洗一次,最后用无核酸酶的水重悬cDNA-C1链霉素磁珠复合物。
得到cDNA片段后,本发明对所述cDNA片段进行3'端加多聚腺苷酸尾巴,合成二链cDNA片段。
在本发明中,所述加多聚腺苷酸尾的反应体系为12.5μl,优选包括1.25μl的10×TdT缓冲液,1.25μl CoCl2,0.5μl 0.2μM dATP,0.5μl末端转移酶,9.5μl含单链cDNA的无核酸酶的水。所述加多聚腺苷酸尾的反应条件优选在36~38℃的条件下反应7~9min,再在68~72℃条件下反应9~11min,更优选为在37℃的条件下反应8min,再在70℃条件下反应10min。
在本发明中,所述合成二链cDNA片段优选在在逆转录用引物(SEQ ID NO:3)的存在下进行。本发明对所述二链cDNA扩增的方法没有特殊限制,采用本领域所熟知的二链cDNA扩增方法即可。
得到二链cDNA后,本发明将所述二链cDNA片段进行LACE-seq文库预扩增,得到扩增产物。
在本发明中,所述预扩增的反应条件优选:12.5μl 2×KAPA HiFi HotStartReadyMix,0.5μl逆转录用引物(SEQ ID NO:3),0.5μl LACE-seq文库预扩增用引物(SEQ IDNO:4),12.5μl双链cDNA加多聚腺苷酸尾的产物。所述预扩增的反应条件优选为:98℃反应3min;98℃变性15s,55℃退火20s,72℃延伸30s,反应18个循环;72℃反应10min。所述预扩增结束后,将双链cDNA从C1链霉素磁珠中洗脱下来溶解于无核酸酶水中。优选用SPRIAMPure XP磁珠对扩增产物进行纯化。
得到扩增产物后,本发明将所述扩增产物进行体外转录,得到一组RNA片段。
在本发明中,所述体外转录的反应体系优选如下:2μl 25mM NTP,1μl 0.1M DTT,0.5μl RNase抑制剂,2μl 10×Reaction缓冲液,2μl T7聚合酶,余量体积的扩增产物。所述体外转录的反应条件优选为在36-38℃条件下反应22~26h,更优选为37℃的条件下反应24h。所述体外转录后优选用TURBO酶对DNA模板进行酶解和用RNA Clean XP磁珠进行纯化。本发明所进行的体外转录属于线性扩增,可在保持起始样本中不同RNA的原始比例不变的前提下,有效扩增微量产物,以保证目标蛋白靶位点的覆盖度。
得到纯化的RNA片段后,本发明对所述RNA片段进行二次逆转录,得到的cDNA进行LACE-seq文库扩增以引入分子标签引入,得到LACE-seq文库。
在本发明中,所述二次逆转录优选将所述RNA片段在LACE-seq文库扩增用引物(SEQ ID NO:5)作用下进行逆转录。所述逆转录的反应条件优选在42℃反应50min;70℃反应15min;12℃保持恒温。
在本发明中,所述PCR文库扩增的反应体系优选为20μl,包括1μl LACE-seq文库扩增用引物(SEQ ID NO:5),1μl单端分子标签引物(SEQ ID NO:6),1μl MgSO4,3μl 10×Buffer,0.6μl 25mM dNTP,0.5μlpfx酶,2.9μl含cDNA片段的无核酸酶水。所述LACE-seq文库扩增的反应条件优选为:94℃反应2min;94℃变性15s,62℃退火30s,72℃延伸30s,反应10个循环;72℃反应10min。
在本发明中,LACE-seq文库扩增后,优选对扩增产物进行片段选择,对片段长度约125~350bp的胶块进行回收,作为LACE-seq文库。所述回收优选采用胶回收试剂盒进行。
得到LACE-seq文库后,本发明对所述LACE-seq文库进行高通量测序,将测序片段比对到对应的基因组上进行可视化展示,从而得到目标蛋白在全转录组范围内的靶位点。
在本发明中,所述高通量测序优选用illumina Nextseq测序仪进行SE50单端测序。所述测序片段优选去除LACE-seq原始测序片段(reads)中的接头和低质量序列,将保留的测序片段比对到参考基因组上。所述将测序片段比对到对应基因组的可视化展示采用的生物信息学分析方法可参考已报道文献2
本发明提供了一种实施所述方法的试剂,包括以下组分:
蛋白A/G磁珠、封闭缓冲液、洗涤缓冲液、PNK缓冲液、含EGTA的PNK缓冲液、结合和洗涤缓冲液、SPRI AMPure XP磁珠、SPRI RNA Clean磁珠、C1链霉素磁珠、目标蛋白抗体、3'末端接头、逆转录用引物、LACE-seq文库预扩增用引物LACE-seq文库扩增用引物和单端分子标签引物(SE index primer)。
在本发明中,所述3'末端接头的核苷酸序列优选如SEQ ID NO:1(rAppNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT-NH2)所示。所述逆转录用引物的核苷酸序列优选如SEQID NO:2(Bio-GATCACTAATACGACTCACTATAGGGACACTCTTTCCCTACACGACGCTCTTCCGATCT)和SEQID NO:3(CAAGCAGAAGACGGCATACGAGATTTTTTTTTTTTTTTTTTTTTVN)所示。所述LACE-seq文库预扩增用引物的核苷酸序列优选如SEQ ID NO:4(GATCACTAATACGACTCACTATAGG)所示;所述LACE-seq文库扩增用引物的核苷酸序列优选如SEQ ID NO:5(CAAGCAGAAGACGGCATACGAGAT)所示。所述单端分子标签引物(SE index primer)的核苷酸序列优选如SEQ ID NO:6(AATGATACGGCGACCACCGAGATCTACACNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCT)所示。
在本发明中,所述洗涤缓冲液为含0.1%SDS(质量浓度)、0.5%脱氧胆酸盐(质量浓度)、0.5%NP-40(乙基苯基聚乙二醇,体积比)的PBS溶液。所述PNK缓冲液优选为包含pH7.4的50mM Tris-Cl、10mM MgCl2和0.5%NP-40的水溶液。所述含EGTA的PNK缓冲液优选为含pH 7.4的50mM Tris-Cl、20mM EGTA和0.5%NP-40的水溶液。结合和洗涤缓冲液优选为含pH 7.5的10mM Tris-Cl、1mM EDTA和2M NaCl的水溶液。所述封闭缓冲液优选为含0.2mg/mlGlycogen和0.2mg/ml BSA的PBS溶液。
在本发明中,所述试剂优选还包括微球菌核酸酶缓冲液、PBS溶液、含质量浓度为0.2%BSA水溶液。所述微球菌核酸酶缓冲液优选为含pH 8.0 50mM Tris-Cl和5mM CaCl2的水溶液。所述PBS溶液优选为含NaCl 137mmol/L、KCl 2.7mmol/L、Na2HPO4 10mmol/L、KH2PO42mmol/L的水溶液。
在本发明中,当目标蛋白为Ddx4、Ptbp1、Ago2、Mili和PTBP1时,特异性的目的蛋白抗体为Ddx4抗体(abcam)、Ptbp1抗体(abcam)、Ago2抗体(abcam)、Mili抗体(CST)和PTBP1抗体(sigma)。
鉴于采用本发明提供的方法能够在稀有微量细胞样品中全面鉴定RNA结合蛋白靶位点,同时具有快速高效的特点,本发明提供了所述鉴定RNA结合蛋白靶位点的试剂在构建RNA结合蛋白靶位点文库中的应用。同时本发明还提供了所述鉴定RNA结合蛋白靶位点的试剂在研究目的蛋白与对应的靶标RNA之间的相互作用中的应用以及所述试剂在鉴定或辅助鉴定RNA结合蛋白的结合位点中的应用。
下面结合实施例对本发明提供的一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
1.一种微量细胞鉴定RNA结合蛋白靶位点的方法
1.1实验材料
1.1.1细胞样本
以不同数目的HeLa细胞以及小鼠发育至MⅡ期的***为投入材料进行LACE-seq文库构建。HeLa细胞投入量分别为1、10、100、1000和104个细胞,***投入量分别为1、10、30、50和100个细胞。
1.1.2目标蛋白及其抗体
目的蛋白分别为Ddx4、Ptbp1、Ago2和Mili,目的蛋白的特异性抗体为:Ddx4抗体(abcam)、Ptbp1抗体(abcam)、Ago2抗体(abcam)、Mili抗体(CST)、PTBP1抗体(sigma)。
1.2 LACE-seq文库的制备方法
微量细胞中鉴定RNA结合蛋白靶位点的流程图如图1中a所示,其中包括微量或单细胞样本收集,依次经过紫外交联、细胞裂解、目的蛋白免疫共沉淀、核酸酶打断目的蛋白所结合的RNA片段、RNA 3'端接头连接、RNA片段逆转录为cDNA、cDNA片段3'端多聚腺苷酸加尾、PCR预扩增、体外转录、逆转录为cDNA、PCR引入分子标签和扩增等步骤。具体步骤如下:
1)、取10μl蛋白A/G磁珠,在磁分离架上放置1分钟,去除上清,加入200μl封闭缓冲液,室温封闭蛋白A/G磁珠1h;磁分离架上放置1分钟,然后去除上清,使用200μl 0.1M磷酸钠盐缓冲液(pH 8.0)漂洗1次;加入50μl磷酸钠盐缓冲液及2μg蛋白抗体重悬蛋白A/G磁珠,室温孵育1h。
2)、将细胞样本放入1.5ml离心管中,置于冰上,在254nm波长的紫外线下,400mJ能量照射2次,得到交联后的细胞样品。
3)、将50μl洗涤缓冲液加入上步交联细胞样品后,冰上放置10min。然后加入4μl脱氧核糖核酸酶I和1μlRNase抑制剂到细胞裂解液中,37℃反应3min去除基因组DNA。
4)、将孵育完的目的蛋白抗体及蛋白A/G磁珠混合液置于磁力架上1min,去除上清,使用200μl洗涤缓冲液漂洗2次,并用10μl洗涤缓冲液重悬磁珠,然后将磁珠加入细胞裂解液内,4℃孵育2h。然后将孵育混合液置于磁力架上1min,去除上清;200μl洗涤缓冲液漂洗3次之后,再用200μl PNK缓冲液漂洗2次。
5)、将微球菌核酸酶分2步稀释:第一步取0.5μl微球菌核酸酶加入499.5μl微球菌核酸酶缓冲液中,即以1:1000的比例稀释;第二步取0.5μl上步稀释后酶液加入1.5ml微球菌核酸酶缓冲液,即1:3000的比例稀释(如果起始量材料为单细胞,此步需1:5000稀释)。取10μl稀释3×106倍后的微球菌核酸酶稀释液重悬上步蛋白A/G磁珠后,在37℃条件下反应3min,反应完后样品置于磁力架上1min,去除上清。然后使用200μl含EGTA的PNK缓冲液漂洗2次;200μl洗涤缓冲液漂洗2次;200μl PNK缓冲液漂洗2次,得到片段化的RNA。
6)、对上述片段化后的RNA,使用20μl去磷酸化反应体系(1μl FastAP碱性磷酸酶,2μl10×FastAP缓冲液,17μl无核酸酶水)去除RNA 3'端磷酸基团。在37℃的条件下反应10min,反应完后样品置于磁力架上1min,去除上清。然后,使用200μl含EGTA的PNK缓冲液漂洗2次,200μl PNK缓冲液漂洗2次,再用200μl 1%BSA缓冲液漂洗2次。
7)、对上述去磷酸化后的RNA片段,使用20μl连接反应体系(0.5μl 1μM的3'接头,2μl 10×T4 RNA连接酶缓冲液,0.5μl T4 RNA连接酶2,4μl 50%PEG8000,13μl无核酸酶水)将3'接头(SEQ ID NO:1)连接到RNA片段上。在25℃的条件下,反应2h,反应完后样品置于磁力架上1min,去除上清。然后使用200μl PNK缓冲液漂洗3次。
8)、将上述含有RNA片段的蛋白A/G磁珠重悬在8.5μl无核酸酶水中,并加入1μl0.01μM的含有T7启动子的逆转录引物(SEQ ID NO:2),65℃变性5min,并立刻置于冰上。然后加入逆转录反应混合物(3μl 5×First strand缓冲液,1μl 10mM dNTP,0.5μl 100mMDTT,0.5μlRNase抑制剂,0.5μl SuperScript II),42℃反应50min;70℃反应15min。
9)、向上述cDNA产物中加入反应混合液(2μl 10×ExoⅠ缓冲液,3μl ExoⅠ酶),37℃反应1h,80℃反应20min;然后加入反应混合液(3μl 10×RNase H缓冲液,1μlRNase H,6μl无核酸酶水),37℃反应30min,65℃反应20min。
10)、取5μl C1链霉素磁珠,置于磁力架上1min,弃上清,使用100μl 1×结合与洗涤缓冲液漂洗3次后,用5μl 1×结合与洗涤缓冲液将C1链霉素磁珠重悬。将上步反应产物置于磁力架上1min,取上清加入C1链霉素磁珠重悬液内,在室温条件下反应30min后,置于磁力架上1min,去除上清,使用100μl 1×结合与洗涤缓冲液漂洗2次,100μl 0.2mg/ml BSA缓冲液漂洗1次,使用9μl无核酸酶水重悬cDNA-C1链霉素磁珠。
11)、向上步样品中加入末端加尾反应混合液(1.25μl 10×TdT缓冲液,1.25μlCoCl2,0.5μl 0.2μM dATP,0.5μl末端转移酶),37℃反应8min,70℃反应10min。
12)、向上步样品中加入PCR反应混合物(12.5μl 2×KAPA HiFi HotStartReadyMix,0.5μl逆转录引物(SEQ ID NO:3),0.5μl LACE-seq文库预扩增引物(SEQ IDNO:4)),反应条件为:98℃反应3min;98℃变性15s,55℃退火20s,72℃延伸30s,反应18个循环;72℃反应10min。反应完后将PCR产物置于磁力架上1min,取上清转移到新的1.5ml离心管中。
将SPRI AMPure XP磁珠(简称XP磁珠,Beckman)提前室温混匀放置30min。然后将46.8μl(1.8×)的XP磁珠加入上步获得的上清中,轻柔混匀。室温静置5min,转移至磁力架静置5min,去除上清液,并使用200μl新鲜配制的80%乙醇溶液漂洗磁珠2次。磁珠置于磁力架上晾干2min后,加入13μl无核酸酶水重悬磁珠,吹打20次。室温静置5min,然后放入磁力架上静置5min,吸取12.5μl上清液并移入新的PCR管内,即为PCR产物。
13)、向上述PCR产物中加入体外转录混合液(2μl 25mM NTP,1μl 0.1M DTT,0.5μlRNase抑制剂,2μl 10×Reaction缓冲液,2μl T7聚合酶),37℃反应24h。
14)、向得到的RNA产物中,加入消化DNA模板反应混合液(3μl 10×TURBO缓冲液,1μl TURBO Enzyme,6μl无核酸酶水),37℃反应30min。
15)、提前将RNA Clean XP磁珠室温混匀放置30min。然后取66μl(2.2×)的RNAClean XP磁珠加入上步获得的RNA样品中,轻柔混匀。室温静置5min,转移至磁力架上静置5min,去除上清液,并使用200μl新鲜配制的80%乙醇溶液漂洗磁珠2次。磁珠置于磁力架上晾干2min后,加入13μl无核酸酶水重悬磁珠,吹打20次。室温静置5min,然后放入磁力架上静置5min,吸取12μl上清液并移入新的PCR管内,得到RNA纯化产物。
16)、向上述RNA纯化产物中加入1μl LACE-seq文库扩增引物(SEQ ID NO:5),65℃反应5min,然后置于冰上。接着加入逆转录反应混合物(4μl 5×First strand缓冲液,1μl10mM dNTP,1μl 100mM DTT,0.5μl RNase抑制剂,0.5μl SuperScript II),反应条件为:42℃50min;70℃15min。
17)、向上步得到的cDNA产物中加入PCR反应混合物(1μl LACE-seq文库扩增引物(SEQ IDNO:5),1μl单端分子标签引物(SEQ ID NO:6),1μl MgSO4,3μl 10×Buffer,0.6μl25mM dNTP,0.5μl pfx enzyme,2.9μl无核酸酶水),反应条件为:94℃反应2min;94℃变性15s,62℃退火30s,72℃延伸30s,反应10个循环;72℃反应10min。
18)、将上述PCR产物在120V的电压下跑2%的琼脂糖胶,跑胶2h后,切125-350bp的胶块回收,按照Qiagen胶回收说明书回收LACE-seq文库片段,并使用Qubit检测文库浓度。
表1 本发明涉及的引物及接头信息
Figure BDA0003109783410000131
1.3 LACE-seq文库测序
使用illumina Nextseq测序仪对步骤1.2构建得到的LACE-seq文库进行SE50单端测序。
1.4数据分析方法
高通量测序完成之后,首先利用Cutadapt软件(1.15版本)去除LACE-seq原始测序片段(reads)中的接头和低质量序列,然后使用Bowtie软件(1.2.3版本)将保留下来的测序片段比对到参考基因组序列。通过计算参考基因组上每10-kb窗口中的reads数目,统计不同重复或样本之间的皮尔森相关系数(Pearson correlation coefficient)。利用NGSPLOT软件绘制LACE-seq信号在转录起始位点以及基因区上下游的分布,使用在线工具UCSCgenome browser(http://genome.ucsc.edu/)对LACE-seq信号在整个基因组的分布进行可视化展示,具体生物信息学分析方法可参考已报道文献(Dahl JA,Jung I,Aanes H,etal.Broadhistone H3K4me3 domains inmouse oocytes modulate maternal-to-zygotictransition.Nature,2016,537(7621):548)。
2、数据分析结果
2.1 LACE-seq方法流程及与传统CLIP-seq方法的比较
为了在微量或单细胞水平鉴定RNA结合蛋白的靶位点,开发了LACE-seq方法。主要流程为:微量细胞或单细胞在254nm的紫外线下交联,细胞裂解后加入RNA结合蛋白特异性抗体进行免疫共沉淀反应,以富集目的蛋白及其结合的RNA;对RNA进行片段化和3'端去磷酸化后,将带有预腺苷酸化的接头连接到RNA片段的3'端,再使用生物素修饰且含T7启动子的引物进行逆转录反应以获得cDNA产物;将cDNA产物从蛋白A/G磁珠上释放后,进行多聚腺苷酸加尾反应,之后使用cDNA片段合成二链并进行预扩增反应,体外转录为RNA片段后再逆转录为cDNA,PCR扩增文库并胶回收约180bp长度的文库片段,最后进行高通量测序反应(见图1中a和b)。为了评估LACE-seq方法的重复性、可靠性和灵敏性,本发明使用HeLa细胞作为材料,在不同数目的细胞中构建了PTBP1蛋白LACE-seq文库,并与经典的CLIP-seq数据3和iCLIP数据4进行了比较分析。
通过分析不同细胞投入量的LACE-seq文库重复性,发现Pearson相关系数随着细胞投入量的降低而逐渐降低(R=0.93-0.36),这凸显了微量样品中不同细胞之间的异质性(图1中c)。随后,通过与已经发表的PTBP1CLIP-seq数据相比,发现LACE-seq鉴定的PTBP1结合位置与已报道的数据高度相关(R>0.72,图1中d)。进一步,发现与CLIP-seq和iCLIP检测到的peaks相比,LACE-seq的Peaks会有约5nt的下游偏移(图1中e)。这恰恰反映了CLIP-seq以及iCLIP与LACE-seq方法的原理差异,在前两种方法中,RNA结合蛋白会被蛋白酶K降解,绝大多数逆转录酶可顺利通过蛋白质的结合位点,而在LACE-seq方法中逆转录酶会被停滞在蛋白质的直接结合位点下游。以PTBP1在SNORD66基因上的结合情况为例,CLIP-seq和iCLIP的信号覆盖在富含CU的序列周围,而LACE-seq的信号则集中在CU序列的下游(图1中f)。这些对比凸显了LACE-seq方法的可靠性。
进一步地,将不同细胞投入量的LACE-seq数据进行基序富集分析,结果显示LACE-seq检测到的蛋白结合位置绝大多数富集在CU基序的下游,这与PTBP1蛋白偏好结合CU富集的基序结果一致(图1中g)。另一方面,以富集CU的序列为中心,分析LACE-seq的逆转录停滞位点分布,结果显示,这些逆转录停止的位置主要分布在CU基序的下游区域(图1中h)。以上数据进一步证明了LACE-seq方法的有效性。
进而测试了能否通过分析逆转录停止位点而寻找目的蛋白的RNA结合基序。以PTBP1为例,在LACE-seq鉴定到的Peaks中,逆转录阻滞reads的比例与其下游序列中CU基序出现频率呈正相关(图1中i)。进一步,根据Peaks中reads数量可将其可分为4个梯度(Q1<Q2<Q3<Q4),发现Reads丰度高的peaks中CU基序出现的频率较高,并且逆转录阻滞reads所占比例也较高(图1中j)。因此,利用逆转录阻滞reads可有效鉴定RNA结合蛋白的结合基序。
以经典CLIP-seq鉴定的靶标为金标准,进而统计了LACE-seq方法的灵敏性和精确度。结果显示,随着细胞数量的下降,LACE-seq的敏感性(LACE-seq鉴定的结合基因数与CLIP-seq鉴定的结合基因数比值)下降,但精确度(LACE-seq与CLIP-seq共有的结合基因数与LACE-seq鉴定的结合基因数比值)则基本不变(图1.k-l)。对于已报道的PTBP1调控的GPRC5和HMGA1基因,LACE-seq、CLIP-seq和iCLIP均有一致的信号(图1中m)。调控可变剪接是PTBP1已报道的主要功能之一,与不受PTBP1剪接调控的对照基因相比,敲降PTBP1后,LACE-seq所鉴定靶标的剪接显著变化(图1.n)。进一步统计发现CLIP-seq和不同细胞投入量的LACE-seq中PTBP1结合基因的表达水平趋于一致,而在微量细胞的LACE-seq中PTBP1结合基因的表达水平更低一些,这些结果表明,微量细胞的LACE-seq能够捕获一些低表达的转录本,灵敏性较高(图1中o)。
2.2LACE-seq鉴定Ddx4在小鼠***内的结合靶标
为了优化LACE-seq技术以实现在微量的小鼠***中鉴定RNA结合蛋白的靶位点,选取了生殖细胞特异性表达的RNA结合蛋白Ddx4,并首先测试了微球菌核酸酶的4个稀释倍数:1.2×105、6×105、3×106、1.5×107。结果显示:在微球菌核酸酶稀释6×105倍后,LACE-seq文库的有效reads比例最高,并且鉴定到的peaks的数目也最多(图2中a和b)。因此,选定该最优化的稀释倍数在微量细胞中构建LACE-seq文库。
在优化完多种不同反应条件后,在不同数量(1~50)的MⅡ期小鼠***中构建了Ddx4的LACE-seq文库。发现不同细胞投入量的LACE-seq文库的Pearson相关性较高,且与IgG对照显著不同(图2中c)。以第17号染色体上的特定200kb窗口为例,单个***中的Ddx4 LACE-seq信号与其他微量细胞中的信号类似,都在Hspa1l转录本上有特异性的结合信号,但不结合临近的Lsm2转录本(图2中d)。
Ddx4的LACE-seq reads中有28%分布在蛋白质编码基因的5'UTR、3'UTR和外显子区,而23%则分布在逆转座子等重复序列上(图2中e),这与Ddx4和PIWI复合物相互作用沉默转座子的已知功能相符。基序分析发现Ddx4偏好结合CG富集的序列(图2中f)。例如,Ddx4可有效结合在其已知靶标Pou5f1的3'UTR附近(图2中g)。为了验证Ddx4结合Pou5f1转录本的真实性,合成了Pou5f1 3'UTR上CG富集区域(图2中g,黄色标记区域)的RNA探针,以及CG富集序列突变为AA的RNA探针,并进行了凝胶阻滞实验。随着Ddx4蛋白浓度的增加,其结合野生型Pou5f1探针的能力越强;而作为对照,Ddx4蛋白结合突变型Pou5f1探针的能力较弱(图2中h)。结合常数分析发现Ddx4蛋白结合两种Pou5f1探针的能力相差约10倍(图2中i),该数据进一步在体外证明了Ddx4偏好于结合CG富集的基序。
2.3 LACE-seq鉴定Ago2和Mili在***内的靶标
在充分验证LACE-seq方法可靠性的基础上,进而分析了Ago2、Mili和PTBP1在***中的靶标。与MVH的高丰度表达不同,由于Ago2、Mili和PTBP1的表达丰度相对较低,导致无法在微量卵子中构建文库。因此,在50~100个卵子中构建了这三个蛋白的LACE-seq文库,相关性分析表明Ago2与Mili的结合靶标高度相关,而与PTBP1和IgG阴性对照的靶点则完全不同(图3中a)。有意思的是~70%的Ago2靶位点和~95%的Mili靶位点为转座子序列(图3中b和c),这与Ago2和Mili所结合的小RNA的功能密切相关:已知,Ago2在***中主要结合endo-siRNA以沉默转座子,而Mili的功能则是结合piRNA沉默转座子。该结果进一步说明了LACE-seq方法的准确度和有效性。
令人意外的是,Mili的绝大部分靶位点与Ago2完全重合,提示这两个蛋白在***中的功能存在冗余。该现象也解释了为什么在小鼠***中敲除Mili对其发育和分化无任何影响:可能是由于Ago2/endo-siRNA依然结合相同的位置,起到了代偿抑制作用(图3中d~e)。与***中敲除Mili无表型相反,Ago2敲除后会导致***停滞在减数***II期且无法成熟。对Ago2特异结合的3637个基因进行功能富集分析发现,Ago2特异结合的基因主要富集在组蛋白修饰、核***、染色体调控、细胞微管骨架组织等方面(图3中f),这很好的解释了Ago2敲除的表型。
2.4***中敲除Ago2导致的转录组变化
为了深入研究Ago2蛋白在小鼠***内的调控机制,将ZP3-Cre雄性工具鼠与在Ago2第三个外显子两侧插有floxp位点的雌性实验鼠交配,获得了***特异性敲除Ago2的雌性小鼠(Ago2 floxp/floxp;Cre;Ago2 cKO)。通过对雌性小鼠中分离的***进行免疫荧光染色观察,发现Ago2敲除会导致纺锤体发育异常,如形成多个纺锤体、纺锤体紊乱、纺锤体发育滞后等(图4中a),这些表型与先前的报道一致5。对收集的单个***进行转录组测序进一步确证了Ago2的第三个外显子被完全切除(图4中b)。利用该单细胞转录组测序数据,在敲除Ago2的***内共鉴定了1525个上调基因和775个下调基因(图4中c),其中上调基因的功能主要富集在细胞核***、细胞周期、染色质分离、生殖发育、纺锤体组织、雌性配子产生等方面(图4中d),提示这些基因可能与Ago2敲除的表型相关。进一步,根据Ago2LACE-seq信号强弱,***内的转录本可大致分为Ago2高结合、中结合、低结合、不结合四类。发现Ago2在转录本上结合的信号越强,当Ago2敲除后,基因表达量越容易发生上调变化(图4中e)。该现象在Ago2敲除后上调的转录本中更为明显(图4中f)。有意思的是,Ago2的靶标mRNA在Ago2敲除的***中绝大多数都不发生变化(5179个,图4中c),提示Ago2在***中主要发挥翻译调控作用。这与***中转录完全停止相一致。
2.5 Ago2/endo-siRNA复合物抑制反转座子驱动嵌合转录本的生成
通过整合小鼠***中小RNA-seq数据、Ago2 LACE-seq数据以及Ago2敲除后的转录组数据,意外发现,LTR逆转座子在野生型***内往往被Ago2/endo-siRNA复合物所沉默;当Ago2敲除后,LTR逆转座子被激活,可驱动其所在的转录本上调;这些被激活的LTR有MTA、MTB、MTC、MTD、ORR1A2、RLTR10等(图5中a)。进一步的生物信息学分析鉴定了一系列LTR驱动的嵌合体转录本,通过与Ago2 LACE-seq数据结合,筛选出了Ago2蛋白直接调控的LTR来源嵌合体转录本(图5中b)。LTR驱动的嵌合体可大致分为Ago2结合与不结合两类,Ago2直接结合的LTR在Ago2敲除后更容易上调且驱动嵌合体RNA的形成(图5中c)。在小鼠***内,LTR亚型MTA驱动的嵌合体RNA所占比例最高,其他LTR亚型则较弱(图5中d)。
2.6 endo-siRNA对靶标的识别规则
通过比较Ago2 LACE-seq和***内小RNA测序数据,发现Ago2靶标可大致分为2类:1)Ago2蛋白与endo-siRNA位置重合;2)对应Ago2结合位置无endo-siRNA。第Ⅰ类中约有90%的位点位于LTR等逆转座子元件(TEs)上,仅有部分位于基因位点上(图6中a和b),如Ago2在Kifc1转录本上的结合;第Ⅱ类中约有70%的位点位于基因位点上(图6中a和b),如Ago2在Calm1转录本上的结合。第Ⅰ类中endo-siRNA主要通过与Ago2结合,以完全互补配对的方式切割对应的转录本;第Ⅱ类中Ago2与endo-siRNA结合后,可能主要以非互补完全配对的方式调控翻译过程,但具体的机制不明。
为了进一步研究endo-siRNA在***中的作用机制,选取了在***内中度表达的endo-siRNA-336为目标,将endo-siRNA-336的靶标片段从3'端逐步双突变,克隆到Renilla荧光酶报告***的3'UTR,经过体外转录后,与firefly内参报告基因一同注射入***,以检测Ago2/endo-siRNA抑制Renilla荧光素酶表达的规律。与endo-siRNA-336的完全互补配对的靶标相比,1-8位双突变的靶标中Renilla荧光素酶检测信号增强;9-22位的双突变靶标中Renilla荧光活性保持不变(图6中c)。据此,推测endo-siRNA在***内也存在“种子”序列,可通过与Ago2结合而调控特定mRNA的翻译。
基于以上发现,结合Ago2免疫共沉淀富集到的endo-siRNA以及LACE-seq鉴定的Ago2结合序列,利用miRanda和Targetscan软件***预测了endo-siRNA的靶位点(图6中d)。重叠分析共得到了共22,335,946个Ago2/endo-siRNA复合物的潜在靶位点(图6中e)。这些靶位点可根据配对能力分为强配对和弱配对两组(图6中f)。发现强配对的靶标约97%含有转座元件,而弱配对的靶标则不含转座元件,且都是通过种子区配对而相互作用(图6中g)。
2.7转座元件产生的endo-siRNA可抑制mRNA翻译
针对预测的靶位点,选取了23个进行验证,发现其中78.3%可能是功能性靶标,包括Calm1、Bub3和Nuf2等(图7中a和b)。将含有Calm1、Bub3和Nuf2 3'UTR的荧光素酶报告mRNA注射到卵子后发现它们的荧光素酶活性被显著抑制,但mRNA水平不变,提示内源的endo-siRNA主要在翻译水平调节基因表达(图7中c和d)。进而对endo-siRNA 336,503,1603,3492,607,2837等对应的种子区进行突变,发现突变后荧光素酶的活性可显著恢复(图7中e)。为了进一步验证功能性,设计了sponge(含有8个与endo-siRNA完全互补的片段),并将其显微注射到小鼠卵子中,Western免疫印迹实验发现阻断内源的336,503,1603,3492,607,2837后,Calm1、Bub3和Nuf2的蛋白水平显著升高(图7中f)。
以上结果证明,endo-siRNA确实可以通过非完全互补和种子区配对的原则而抑制mRNA的翻译。值得注意的是,Nuf2和Bub3的过表达会导致减数***期染色体排列紊乱和纺锤体组装缺陷,这很好的解释了Ago2敲除后的表型。为了进一步验证Ago2/endo-siRNA介导的翻译抑制是否需要Ago2的切割活性,首先对Ago2进行了点突变(将切割中心的DDH氨基酸突变为ADH),然后将Myc-Ago2和Myc-Ago2ADH mRNA分别显微注射入Ago2敲除的卵子中,免疫荧光染色结果表明缺失了切割活性的Ago2ADH依然可以抑制Bub3翻译(图7中g和h)。这些结果证明Ago2/endo-siRNA介导的翻译抑制过程不需要Ago2的切割活性,再次印证了Ago2/endo-siRNA复合物在***中主要发挥翻译抑制功能。
2.8蛋白质组分析Ago2/endo-siRNA介导的翻译调控
为了在蛋白质水平***分析Ago2/endo-siRNA的调控靶标,从同窝小鼠中分离了~60个Ago2野生型和突变型卵子,并利用最新型的timsTOF Pro质谱进行了蛋白质组分析(图8中a)。该分析共发现了170个上调和80个下调的蛋白,其中包括前述验证的Calm1。发现49%的上调蛋白所对应的mRNA具有Ago2 LACE-seq cluster,提示它们是Ago2/endo-siRNA的直接靶标(图8中b)。利用timsTOF Pro质谱共鉴定了2715个蛋白质,其中1155个蛋白质对应的转录本可被Ago2直接结合,而1560则无结合证据(图8中c)。结果表明:1)Ago2直接结合的转录本在敲除***中蛋白质水平更倾向于上调;2)endo-siRNA靶点多的mRNA,其蛋白质水平也更倾向于上调(图8中d和e)。这两个结果进一步说明,Ago2/endo-siRNA可大规模调控蛋白质翻译。
根据前述研究结果,提出了Ago2/endo-siRNA在***中调控基因表达的模型(图8中f)。Endo-siRNA主要由转座子和假基因产生,其已经报道的作用是对转座子RNA以及假基因对应的蛋白质编码mRNA进行切割。首次发现:1)Ago2与endo-siRNA形成沉默复合物,并以非互补完全配对的方式抑制蛋白质编码mRNA的翻译;2)Ago2/endo-siRNA复合物可抑制或调节逆转座子介导的嵌合体RNA形成,从而保证转录组的完整性和多样性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 中国科学院生物物理研究所
<120> 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用
<160> 6
<170> SIPOSequenceListing 1.0
<210> 1
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
nnnnagatcg gaagagcgtc gtgtagggaa agagtgt 37
<210> 2
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gatcactaat acgactcact atagggacac tctttcccta cacgacgctc ttccgatct 59
<210> 3
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caagcagaag acggcatacg agattttttt tttttttttt ttttvn 46
<210> 4
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gatcactaat acgactcact atagg 25
<210> 5
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
caagcagaag acggcatacg agat 24
<210> 6
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aatgatacgg cgaccaccga gatctacacn nnnnacactc tttccctaca cgacgctctt 60
ccgatct 67

Claims (10)

1.一种在微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,包括以下步骤:
1)将微量细胞样本进行紫外交联,得到交联后的细胞;
2)将步骤1)所述交联后的细胞进行裂解,所得细胞裂解液与目标蛋白特异性抗体混合孵育,富集得到目标蛋白结合的RNA;
3)对步骤2)所述目标蛋白结合的RNA进行片段化处理,对所得片段化RNA进行去磷酸化,加3'末端接头,得到目标蛋白所结合的且3'末端接头连接后的RNA片段;
4)对步骤3)目标蛋白所结合的且3'末端接头连接后的RNA片段进行逆转录,得到一组cDNA片段;
5)对步骤4)所述一组cDNA片段进行3'端加多聚腺苷酸尾巴,合成二链cDNA片段;
6)将步骤5)所述二链cDNA片段进行LACE-seq文库预扩增,得到预扩增产物;
7)将步骤6)所述预扩增产物进行体外转录,得到一组RNA片段;
8)将步骤7)所述一组RNA片段经二次逆转录为cDNA,得到的cDNA进行LACE-seq文库扩增,得到LACE-seq文库;
9)对步骤8)所述LACE-seq文库进行高通量测序,将测序片段比对到所述细胞对应的参考基因组,得到目标蛋白在全转录组内的靶位点。
2.根据权利要求1所述在微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,步骤1)中所述微量细胞样本中含有的细胞数量为1~1000个。
3.根据权利要求1所述微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,步骤1)中所述紫外交联时,紫外线的波长为254nm;所述紫外线的能量为400mJ。
4.根据权利要求1所述在微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,步骤3)中所述片段化处理用酶为微球菌核酸酶;
所述微球菌核酸酶的稀释倍数为6×105~3×106
5.根据权利要求1所述在微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,步骤3)中所述去磷酸化的反应体系为20μl,具体包括:1μlFastAP热敏感性碱性磷酸酶,2μl10×FastAP缓冲液,17μl含所述片段化RNA的无核酸酶水;
所述去磷酸化为在36~38℃的条件下反应9~12min。
6.根据权利要求1所述在微量细胞中鉴定RNA结合蛋白靶位点的方法,其特征在于,步骤3)中所述加3'末端接头的反应体系为20μl,具体包括:0.5μl 1μM的3'末端接头,2μl 10×T4 RNA连接酶缓冲液,0.5μl T4 RNA连接酶2,4μl质量浓度为50%的PEG8000,13μl含去磷酸后的RNA的无核酸酶水;
所述加3'末端接头的反应条件为在24~26℃的条件下反应1.5~2.5h。
7.一种实施权利要求1~6任意一项所述在微量细胞中鉴定RNA结合蛋白靶位点的方法的试剂盒,其特征在于,包括以下组分:
蛋白A/G磁珠、封闭缓冲液、洗涤缓冲液、PNK缓冲液、含EGTA的PNK缓冲液、结合和洗涤缓冲液、SPRI AMPure XP磁珠、SPRI RNA Clean磁珠、C1链霉素磁珠、目标蛋白抗体、3'末端接头、逆转录用引物、LACE-seq文库预扩增用引物、LACE-seq文库扩增用引物和单端分子标签引物。
8.根据权利要求7所述的试剂盒,其特征在于,所述3'末端接头的核苷酸序列如SEQ IDNO:1所示;
所述逆转录用引物的核苷酸序列如SEQ ID NO:2和SEQ ID NO:3所示;
所述LACE-seq文库预扩增用引物的核苷酸序列如SEQ ID NO:4所示;
所述LACE-seq文库扩增用引物的核苷酸序列如SEQ ID NO:5所示;
所述单端分子标签引物的核苷酸序列如SEQ ID NO:6所示。
9.根据权利要求7或8所述的试剂盒,其特征在于,所述试剂盒还包括微球菌核酸酶缓冲液、PBS溶液、质量浓度为0.2%BSA水溶液。
10.权利要求7~9任意一项所述的试剂盒在以下一种或多种方法中的应用:构建RNA结合蛋白靶位点文库、研究蛋白质与RNA互作关系和鉴定或辅助鉴定RNA结合蛋白的结合位点。
CN202110646186.8A 2021-06-10 2021-06-10 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用 Pending CN113215234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110646186.8A CN113215234A (zh) 2021-06-10 2021-06-10 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110646186.8A CN113215234A (zh) 2021-06-10 2021-06-10 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用

Publications (1)

Publication Number Publication Date
CN113215234A true CN113215234A (zh) 2021-08-06

Family

ID=77083526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110646186.8A Pending CN113215234A (zh) 2021-06-10 2021-06-10 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用

Country Status (1)

Country Link
CN (1) CN113215234A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250267A (zh) * 2021-12-13 2022-03-29 南京诺唯赞生物科技股份有限公司 一种构建含修饰位点的rna的测序文库的方法
CN116884488A (zh) * 2023-09-07 2023-10-13 中国医学科学院基础医学研究所 一种男性不育标志物的筛查方法、***及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RUIBAO SU等: "Global profiling of RNA-binding protein target sites by LACE-seq", 《NATURE CELL BIOLOGY》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250267A (zh) * 2021-12-13 2022-03-29 南京诺唯赞生物科技股份有限公司 一种构建含修饰位点的rna的测序文库的方法
CN116884488A (zh) * 2023-09-07 2023-10-13 中国医学科学院基础医学研究所 一种男性不育标志物的筛查方法、***及设备
CN116884488B (zh) * 2023-09-07 2023-11-24 中国医学科学院基础医学研究所 一种男性不育标志物的筛查方法、***及设备

Similar Documents

Publication Publication Date Title
CN113166797B (zh) 基于核酸酶的rna耗尽
Head et al. Library construction for next-generation sequencing: overviews and challenges
Fan et al. Single-cell RNA-seq transcriptome analysis of linear and circular RNAs in mouse preimplantation embryos
EP4107282A1 (en) Capturing genetic targets using a hybridization approach
Su et al. Global profiling of RNA-binding protein target sites by LACE-seq
EP2083090B1 (en) Nucleic acid interaction analysis
CN113215234A (zh) 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用
CN107109698B (zh) Rna stitch测序:用于直接映射细胞中rna:rna相互作用的测定
US20070178482A1 (en) Method for preparing single-stranded dna
CN113308514A (zh) 微量m6A的检测文库构建方法和试剂盒、高通量检测方法
WO2017215517A1 (zh) 测序文库构建中5&#39;和3&#39;接头连接副产物的去除方法
CN111440843A (zh) 一种利用微量临床穿刺样本进行染色质免疫共沉淀文库制备的方法及其应用
CN111909991A (zh) 一种捕获rna原位高级结构及相互作用的方法
AU2017217868B2 (en) Method for target specific RNA transcription of DNA sequence
US20240052412A1 (en) Method for detecting rna structure at whole transcriptome level and use thereof
US11268087B2 (en) Isolation and immobilization of nucleic acids and uses thereof
CN114438168A (zh) 一种全转录组水平rna结构检测方法及其应用
US20240182951A1 (en) Methods for targeted nucleic acid sequencing
JP2002253237A (ja) ノーマライズ/サブトラクトされたcDNAライブラリーの作成方法
KR20230149744A (ko) 태그멘테이션을 이용한 벡터 삽입위치 검출 및 클론 정량 방법
Head et al. Practical Guide
WO2022093701A1 (en) Methods and kits for enriching for polynucleotides
CN116516495A (zh) 一种捕获全长非编码rna测序文库的构建方法与应用
JP2023538537A (ja) 核酸の標的化除去のための方法
CN118302538A (zh) 一种用于检测剪接异构体的靶向高通量测序方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination