CN117551746A

CN117551746A - 一种检测目标核酸及其邻近区域核酸序列的方法

Info

Publication number: CN117551746A
Application number: CN202311635240.4A
Authority: CN
Inventors: 王姣; 邓涛; 常玉俊; 朱修篁; 刘建红; 孙立超
Original assignee: Beijing Capitalbio Medlab Co ltd
Current assignee: Beijing Capitalbio Medlab Co ltd
Priority date: 2023-12-01
Filing date: 2023-12-01
Publication date: 2024-02-13

Abstract

本发明属于生物技术领域，具体涉及一种检测目标核酸及其邻近区域核酸序列的方法。具体地，本发明通过CRISPR‑Cas9靶向靶基因序列的中间位置，通过连接纳米孔测序接头，从靶基因的中间向两侧延伸，同时获取靶基因序列和靶基因两侧的序列信息，在提升靶基因有效检出的同时可以利用长读长测序检测的优势，直接获取靶基因物理位置邻近核酸的序列信息，实现靶基因的物种注释、上下游序列解析等重要功能信息的挖掘。

Description

一种检测目标核酸及其邻近区域核酸序列的方法

技术领域

本发明属于生物技术领域，具体涉及一种检测目标核酸及其邻近区域核酸序列的方法。

背景技术

随着测序技术的发展，二代测序在基因诊断和病原微生物检测方面有着广泛的应用。对临床样本核酸进行全基因组测序(WGS)可以提供全面的遗传信息，但是包含关键诊疗信息的变异区域或者样本中的病原菌及其耐药基因核酸通常只占整体核酸的很小一部分(<1％)。因此，相比于高成本和高解析难度的WGS，靶向测序有着更高的性价比，可避免测序信息浪费，提高临床的普及性。同时，靶向测序可以为关键位点提供更高的测序深度和覆盖度，从而提高诊断的准确性。目前已有的靶向测序技术有探针杂交捕获技术和靶向PCR技术。探针杂交捕获技术虽然探针设计简单，但有着实验操作复杂、实验周期长、成本高等缺点。靶向PCR技术由于引物集设计复杂，通常检测通量较低。值得注意的是，目标核酸序列的上下游序列中通常包含着重要的遗传信息，可用于融合基因的检测或者耐药基因物种的注释等。但现有的靶向测序技术通常无法获取或仅能获取很少邻近序列的信息。靶向PCR技术只检测用于设计引物的目标序列，无法获取相邻序列信息；而常用的探针杂交捕获流程，受限于与二代测序技术的读长较短，也仅能检测较短的相邻序列信息。

为了解决二代测序的不足，三代长读长测序应运而生。目前主要的三代测序方法是来自于美国太平洋生物科学公司的单分子实时测序技术(Single Molec ule Real Timesequencing，SMRT)和牛津生物公司的纳米孔测序技术(Oxfor d Nanopore Technoligies，ONT)。纳米孔测序的概念最早可以追溯至20世纪80年代，目前的纳米孔测序技术主要包括两个部分：纳米孔蛋白和分子马达蛋白。第一个被用于纳米孔测序的纳米孔蛋白为alpha-hemolysin，其内部直径为1.4至2.4纳米；随后，另外一个具有相似内部直径(1.2纳米)的蛋白MspA也被证实可以用于纳米孔测序。分子马达蛋白的作用则主要是将双链DNA或者RNA-DNA杂合体解链为单链分子，使得待测序的DNA或RNA分子穿过纳米孔蛋白。测序过程中，由于纳米孔蛋白(pore)所在的薄膜两侧的电压不一样，DNA、RNA或者蛋白质分子通过pore时便会产生电流，不同碱基由于其结构的差异在经过通道时引起的电流变化不一样从而会被区分开来。

这种方法具有许多优点，包括高通量、实时测序、长读长、低成本和不需要PCR扩增等。纳米孔测序技术在许多领域都有广泛的应用，包括基因组学研究、病原体检测、生物学研究以及临床诊断等。它已经在快速测序、实时监测DNA复制和转录等方面取得了显著的进展，使科学家能够更深入地理解基因组和DNA的功能。由于其独特的优势，纳米孔测序技术在生命科学领域具有重要的潜力。

发明内容

本发明通过CRISPR-Cas9靶向靶基因序列的中间位置，连接纳米孔测序接头，从靶基因的中间向两侧延伸，同时获取靶基因序列和靶基因两侧的序列信息，在提升靶基因有效检出的同时可以利用长读长测序检测的优势，直接获取靶基因物理位置邻近核酸的序列信息，实现靶基因的物种注释、上下游序列解析等重要功能信息的挖掘。

第一方面，本发明提供了一种检测目标核酸及其邻近区域核酸序列的方法，所述测序方法包括在文库制备前对待测样本进行去磷酸化、切割和加A的步骤；

所述切割所使用的试剂是一个或多个Cas-sgRNA复合物，所述sgRNA是X-Y的转录产物，其中，X取自靶基因，Y的转录产物与Cas蛋白结合；

所述方法还包括对文库纯化后上机测序的步骤。

优选地，所述靶基因可以是任意基因，可以来源于任意一种生物，例如真核生物、原核生物、病毒。

优选地，所述真核生物包括人、鼠、猴、牛、羊、猪、马、鸡、拟南芥、马铃薯、甘薯、紫薯、山药、芋类、木薯、菊薯、水稻、小麦、大麦、玉米、高粱。

优选地，所述原核生物包括细菌、放线菌、古细菌、螺旋体、衣原体、支原体、立克次氏体和蓝细菌。

优选地，所述病毒包括腺病毒、肝炎病毒、流感病毒、水痘病毒、Ⅰ型单纯疱疹病毒、Ⅱ型单纯疱疹病毒、牛瘟病毒、呼吸道合胞病毒、巨细胞病毒、海胆病毒、虫媒病毒、汉坦病毒、腮腺炎病毒、新型冠状病毒。

优选地，所述细菌包括革兰氏阴性菌、革兰氏阳性菌。

优选地，所述细菌包括埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属、不动杆菌属、克雷伯氏菌属。

优选地，所述细菌包括鲍曼不动杆菌(Acinetobacter baumannii)、肺炎克雷伯菌(Klebsiella pneumoniae)、大肠杆菌(Escherichia coli)、铜绿假单胞菌(Pseudomonasaeruginosa)

优选地，所述待测样本可以是任意样本，可以来源于任何生物，也可以是环境样本，如采集自医院、养殖场和污水处理厂的空气、水体、土壤或设施表面的样本。

优选地，当所述待测样本来自于动物时，所述待测样本包括来源于动物的一个或更多个细胞、组织或体液的样品。“体液”可以包括但不限于血液、血清、血浆、唾液、脑脊髓液、胸膜液、眼泪、乳腺导管液、淋巴、痰、尿液、羊水或***。样品可以包括是“无细胞(acellular)”的体液。“无细胞体液”包括小于约1％(w/w)的全细胞材料。血浆或血清是无细胞体液的实例。样品可以包括天然或合成来源的样本(specimen，即制成是无细胞的细胞样品)。所述动物包括人。

具体地，所述Cas-sgRNA复合物中Cas是指Cas蛋白，所述的Cas蛋白可以根据结构特征(如结构域)进行下位分类，如Cas12家族包括Cas12a(又名Cpf1)、Cas12b、Cas12c、Cas12i等。还以根据其来源不同而分类为来源于酿脓链球菌(Streptococcus pyogenes)的SpCas9、来源于葡萄球菌(Staphylococcus aureus)的SaCas9。

本发明所述的Cas蛋白可以是野生型或其突变体，所述的突变体的突变类型包括氨基酸的替换、取代或缺失，所述的突变体可以改变也可以不改变Cas蛋白的酶切活性。本领域技术人员所知，现有技术中已报到的多种具有核酸切割活性的Cas蛋白，该公知蛋白或其改造后的变体均可以实现本发明的功能，本文通过引用方式将其纳入保护范围。

优选地，所述Cas是Cas9蛋白。

如发明所述序列Y与Cas蛋白需搭配使用，当选择Cas蛋白后本领域技术人员可以选择相适应的Y序列。

优选地，所述Y的序列如SEQ ID NO.1所示。

优选地，在野生型的靶基因中，X之后的序列为NGG/NG。

优选地，所述X的长度是12-25nt(bp)。

优选地，所述X的长度是19或20nt。

优选地，所述X取自靶基因的任意位置，例如位于全长的10％、20％、30％、40％、50％、60％、70％、80％、90％的位置。

优选地，所述X取自靶基因的中间部位。更具体地，取自靶基因长度10-90％的位置，20-80％、30-70％、40-60％、45％-55％。具体地，例如靶基因长度为1000bp，在第100-120bp的位置取X即认为是在10％长度的位置取X，在第900-920bp的位置取X即认为是在90％长度的位置取X。

优选地，在每个靶基因中设计两个或以上的X，更优选地是在一个具体的靶基因的中间部位选取两个相近的X，例如相差1-500bp，1-400bp，1-300bp，1-200bp，1-100bp，1-50bp，1-40bp，1-30bp，1-20bp，1-10bp或更近。

优选地，所述X的方向是相反或相同的。

更优选地，所述每个靶基因中设计两个X；两个X之间相距1-55bp；最优选地，相距10bp。

最优选地，所述X的序列如SEQ ID NO.8-35所示。

在选择SEQ ID NO.8-35的组合X作为时，所述对靶基因及其上下游序列进行靶向测序的高灵敏度测序方法也可以称为对靶基因进行物种注释的高灵敏度(高检出)测序方法、病原微生物耐药基因检测方法，为了同时获取耐药基因序列及其相邻序列，我们选取了最靠近耐药基因中间位置的两条sgRNA。这样的设计一方面可以更好地处理可能出现的单条sgRNA活性不足或者sgRNA结合位点存在突变的情况，保证Cas9-sgRNA复合物对目标序列的有效切割；另一方面两条sgRNA的切口间隔控制在1-55bp(大多数为10bp)，避免其他组合方式的切割造成目标序列碎片化，不能被纳米孔测序，从而造成序列信息丢失。

本发明具体实施例中通过CRISPR-Cas9靶向耐药基因序列的中间位置，通过连接纳米孔测序接头，从耐药基因的中间向两侧延伸，同时获取耐药基因序列和耐药基因两侧的序列信息，在提升耐药基因有效检出的同时可以利用长读长测序检测的优势，直接获取与耐药基因物理位置关联的物种信息，实现耐药基因的物种注释，为临床感染提供更多的诊疗信息以鉴定感染病原菌并指导用药决策。

如本文中所使用的，术语“指导RNA(single guide RNA，sgRNA)”、“成熟crRNA”、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言，指导RNA基本上由同向重复序列和引导序列(在内源性CRISPR***背景下也称为间隔序列(spacer))组成。在某些情况下，X是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中，当最佳比对时，引导序列与其相应靶序列之间的互补程度为至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、或至少99％。确定最佳比对在本领域的普通技术人员的能力范围内。例如，存在公开和可商购的比对算法和程序，诸如但不限于ClustalW、史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。本领域技术人员根据常规技术则可以排除低质量sgRNA(考虑GC含量、均聚物、双核甘酸重复、发夹结构、人基因组脱靶等因素)。

更优选地，所述上机测序是通过三代测序进行的。

更优选地，所述上机测序是通过的纳米孔测序技术进行的。

更优选地，所述上机测序是通过的ONT纳米孔测序技术进行的。

优选地，所述测序的设备包括MinION、GridION和PromethION。

术语“三代测序”也称为“单分子测序技术”，DNA测序时，不需要经过PCR扩增，实现了对每一条DNA分子的单独测序。主要分为两大技术阵营：第一大阵营是单分子荧光测序，代表性的技术为美国螺旋生物(Helicos)的SMS技术和美国太平洋生物(PacificBioscience)的SMRT技术。脱氧核苷酸用荧光标记，显微镜可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA链的时候，它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候，它的荧光基团就被DNA聚合酶切除，荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性，并且在荧光被切除之后，合成的DNA链和天然的DNA链完全一样。第二大阵营为纳米孔测序，代表性的公司为英国牛津纳米孔公司。新型纳米孔测序法(nanopore sequencing)是采用电泳技术，借助电泳驱动单个分子逐一通过纳米孔来实现测序的。由于纳米孔的直径非常细小，仅允许单个核酸聚合物通过，而ATCG单个碱基的带电性质不一样，通过电信号的差异就能检测出通过的碱基类别，从而实现测序。

或者，所述一种对待测基因及其上下游序列进行靶向测序的高灵敏度测序方法也可以称为制备三代测序文库的方法。

具体地，本发明所述磷酸化、加A是本领域常规方法即可实现的。

本发明所述“靶基因”也可称为“目的基因”，也即需要被检出并进行邻近上下游序列注释的基因，本发明所提供的方法不对靶基因做任何限制，人工序列或自然存在的任意序列皆可以作为靶基因。本发明具体实施例中以多个菌种的耐药基因为靶基因进行了验证。

本发明所述“文库”即核酸片段的集合，本发明中对待测样本进行去磷酸化、切割和加A的步骤后获得的产物即可称为文库，优选地，进行纯化后即可进行测序。

另一方面，本发明提供了一组序列组合物，所述序列是X-Y的转录产物，其中，X取自靶基因，Y的转录产物与Cas蛋白结合。

另一方面，本发明提供了一种试剂组合物，所述试剂组合物中包括Cas-sgRNA复合物和以下任意一种或多种试剂的组合：去磷酸化试剂、DNA末端加A试剂、接头连接试剂和测序所需试剂。

优选地，所述测序所需试剂是三代测序所需试剂。

优选地，所述测序所需试剂是纳米孔测序技术所需试剂。

优选地，所述测序所需试剂是ONT纳米孔测序技术所需试剂。

本发明所述试剂组合物可以包装为试剂盒的形式，其中还可以包含使用以上试剂所需要的器材，如试管等容器、摆放容器所需支架等。

另一方面，本发明提供了Cas蛋白、前述序列组合物、试剂组合物在提高靶基因检出比例中的应用，在测序中检出可物种注释的结果中的应用。

更具体地，在检测鲍曼不动杆菌(Acinetobacter baumannii)、肺炎克雷伯菌(Klebsiella pneumoniae)、大肠杆菌(Escherichia coli)、铜绿假单胞菌(Pseudomonasaeruginosa)中任意一种或多种菌株的耐药基因中的应用。该应用为临床感染提供更多的诊疗信息以鉴定感染病原菌并指导用药决策。

附图说明

图1是技术原理图。

图2是正常纳米孔文库和CRISPR-Cas9靶向纳米孔文库产生的数据中耐药基因reads占比。

图3是正常纳米孔文库和CRISPR-Cas9靶向纳米孔文库产生的数据中比对到每个耐药基因上的reads数。

具体实施方式

下面结合实施例对本发明做进一步的说明，以下所述，仅是对本发明的较佳实施例而已，并非对本发明做其他形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容，依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化，均落在本发明的保护范围内。

实施例1、病原微生物耐药基因检测

宏基因测序检测临床样本中的耐药基因的缺点：1)耐药基因只占样本总DNA很少一部分(<1％)，这使得其在宏基因组测序中很难被捕获到，尤其是对于人源细胞背景含量高的临床样本。2)耐药基因可以通过水平基因转移的方式在多个物种间传播，从而导致基于二代短读长测序平台获取的耐药基因片段，无法从中直接获取耐药基因与物种的关联信息。

本发明通过CRISPR-Cas9靶向捕获临床中重要或常见的耐药基因，并进行纳米孔长读长测序，可有效提升对耐药基因的检出，并可根据耐药基因两侧的序列信息确定耐药基因的物种来源，为临床提供更多的诊疗信息。

1、实验材料

样本：鲍曼不动杆菌ATCC 19606、肺炎克雷伯菌Klebsiella pneumoniae ATCC43816、大肠杆菌Escherichia coli ATCC 11775、铜绿假单胞菌Pseudomonas aeruginosaATCC 27853。

试剂：微生物基因组提取试剂盒、Cas9核酸酶(spCas9)、GridION测序芯片(R9.4)、牛津纳米孔连接测序试剂盒、芯片清洗试剂盒、快速磷酸酶、PCR mix、Taq DNA聚合酶、T7体外转录试剂盒、RNA纯化试剂盒等。

2、实验方法

步骤1：为实验菌株中待测试的14个耐药基因设计sgRNA序列

首先，根据PAM(NGG)序列寻找耐药基因上所有可能的sgRNA，排除低质量sgRNA(考虑GC含量、均聚物、双核甘酸重复、发夹结构、人基因组脱靶等因素)后，然后选择最靠近耐药基因序列中间位置的两个sgRNA(靠近中间位置的设计使得Cas9-sgRNA复合物切割后的序列即含有耐药基因的序列，又向耐药基因两侧延伸以包含更多菌株特异性序列的信息；选择两个sgRNA以增加Cas9-sgRNA复合物切割的效率)。所有的耐药基因的sgRNA共同组成sgRNA库。

步骤2：用于体外转录的sgRNA模板链的制备

根据上述sgRNA序列设计用于体外转录的sgRNA引物。通过PCR合成体外转录用使用的模板DNA。其中模板序列为：

AAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC(SEQ ID NO.2)。

正向引物序列为：

TTCTAATACGACTCACTATAGNNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGA(SEQ ID NO.3)，其中N代表sgRNA的序列。

反向引物序列为：AAAAGCACCGACTCGGTGCC(SEQ ID NO.4)。

扩增体系如表1，扩增条件如表2。

表1、扩增体系

成分	50μl的反应体系
		PCR Mix	12.5μl
10μM正向引物	2.5μl
		10μM反向引物	2.5μl
1μM模板DNA	2μl
		无核酸酶水	18μl

表2、扩增条件

步骤3：PCR产物进行磁珠纯化

反应结束后对PCR产物进行磁珠纯化，纯化步骤如下：取90μl AMPure XP磁珠置于PCR产物中，充分混匀后静置5min。将PCR管置于磁力架中分离磁珠和液体，待溶液澄清后(约3min)，小心移除上清。保持PCR管始终置于磁力架中，加入200μl无核酸酶水新鲜配制的80％乙醇漂洗磁珠，室温孵育30sec后，小心移除上清。重复漂洗一次。用10μl移液器吸干净残留液体。保持PCR管始终置于磁力架中，室温下开盖干燥磁珠。加入22μl无核酸酶水，吹打至充分混匀，室温静置5min。将PCR管短暂离心并置于磁力架中静置，待溶液澄清后(约5min)，小心移取20μl上清至新PCR管中。用Qubit测定回收产物浓度。

步骤4：sgRNA的体外转录

利用T7体外转录试剂盒进行sgRNA的体外转录，步骤如下：清理试验台，防止核糖核酸酶的污染。按顺序向PCR管中添加如下试剂：10μl的NTP Buffer Mix、1μg上一步骤纯化的sgRNA模板DNA，2μl T7 RNA聚合酶Mix，用水补足30μl。反应条件为：37℃，16h。DNA酶处理去除DNA模板。

反应结束后去除模板DNA：每30μl反应加20μl无核酸酶水，再加2μl的DNA酶，混合，37℃孵育15min。

以S000855_1为例，TTTTCTAAGACTTGGTCGAA(SEQ ID NO.8)出自目标基因组，其在目标基因组中之后的三个核苷酸为NGG，其扩展的正向引物是：TTCTAATACGACTCACTATAGTTTTCTAAGACTTGGTCGAAGTTTTAGAGCTAGA(SEQ ID NO.6)，扩增产物为TTCTAATACGACTCACTATAGTTTTCTAAGACTTGGTCGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT(SEQ ID NO.5-4-1)，转录产物是：GUUUUCUAAGACUUGGUCGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO.7)。

步骤5：RNA的纯化

使用RNA纯化试剂盒纯化RNA，利用Qubit测定sgRNA的浓度。

步骤6：Cas9-sgRNA复合物的组装

按照表3体系混合各组分。上述体系在室温(25℃)孵育30min完整组装，组装好的RNP可在4℃保存一周，或者在-80℃保存一个月。

表3、Cas9-sgRNA复合物混合体系

组分	用量
		无核酸酶水	6.4μl
反应缓冲液	2μl
		sgRNA	10μl
HiFi Cas9(6.2μM)	1.6μl

步骤7：提取微生物基因组，制备模拟样本

使用微生物基因组提取试剂盒提取A.baumannii ATCC 19606、K.pneumoniaeATCC 43816、E.coli ATCC 11775和P.aeruginosa ATCC 27853菌株基因组。等质量混合后制成待测模拟样本。

步骤8：模拟样本基因组去磷酸化

准备1μg溶于无核酸酶水中的DNA，根据浓度加无核酸酶水至24μl，轻弹管壁混匀。瞬离；吹打混匀磷酸酶，平衡至室温；在0.2ml薄壁PCR管中混匀表4所示试剂。

表4、去磷酸化试剂

组分或操作	用量
		反应缓冲液	3μl
模拟样本DNA	24μl
		磷酸酶	3μl
总体积	30μl

轻弹混匀并瞬离，在PCR仪上进行如下孵育：37℃，10minutes；80℃，2minutes，实现去磷酸化和失活磷酸酶。

步骤9：模拟样本基因组切割及加A

涡旋混匀dATP，置于冰上，瞬离Taq聚合酶，置于冰上。向上步骤反应管中添加1μldATP、1μl Taq聚合酶和10μl Cas9-sgRNA复合物，轻弹混匀并瞬离后在37℃下孵育45min以完成Cas9-sgRNA复合物的切割。然后72℃反应5min，以实现在切割后的DNA末端上添加A。

步骤10：接头连接与文库纯化

轻弹混匀并瞬离测序接头F和快速T4 DNA连接酶，置于冰上；于室温下解冻连接缓冲液，解冻后轻微离心，并用移液枪吹打混匀，该缓冲液的黏度较高，涡旋振荡会很难混匀，解冻并混匀后，立即置于冰上；将上步骤PCR管中的反应液小心地转移至1.5ml离心管中；在一个新的1.5ml离心管中混匀下述试剂：

表5、接头连接体系

组分	用量
		连接缓冲液	20μl
无核酸酶水	3μl
		T4连接酶	10μl
接头混合液	5μl
		总体积	38μl

轻弹混匀并瞬离后，先添加20μl上述混合液至DNA文库样本中，轻弹混匀，然后立马添加剩余的18μl混合液，轻弹混匀并瞬离；室温下反应15min。涡旋混匀洗脱缓冲液和SPRI稀释缓冲液并瞬离，置于冰上；在室温下解冻短片段缓冲液，涡旋振荡混合后瞬离，置于冰上；向反应液中添加80μlSPRI稀释缓冲液，轻弹混匀；重悬磁珠，添加80μl磁珠，轻弹混匀，室温孵育10min，期间轻柔颠倒；轻微瞬离，置于磁力架上待磁珠和液相分离，保持离心管在磁力架上不动，用移液枪吸去清液；保持试管在磁力架上不动，以200μl短片段缓冲液洗涤磁珠，用移液枪将短片段缓冲液吸走并弃掉；重复上述步骤；将离心管轻微离心后置于磁力架上，用移液枪吸走残留的短片段缓冲液，让磁珠在空气中干燥约5min，但不要干至表面开裂；将离心管从磁力架上移开。将磁珠重悬于15μl洗脱缓冲液中；轻微离心，然后在室温下孵育10分钟。将试管静置于磁力架上，直到磁珠和液相分离，且洗脱液澄清无色，此时，DNA文库溶解于洗脱液中。将此14μl洗脱液转移至一支新的1.5ml离心管管中，取1μl用于Qubit定量。

步骤11：上机测序

按照牛津纳米孔芯片激活操作说明激活测序芯片(Oxford NanoporeTechnoligies，FLO-MIN106D)。配置上机文库：混合37.5μl的纳米孔基因测序缓冲液和25.5μl的纳米孔基因测序芯片上样磁珠，然后添加12μl上步骤制备的测序文库。按照牛津纳米孔上机操作说明在GridION测序仪进行上机测序，通过软件MinKNOW获取测序数据，获得约2G数据量后停止测序。

步骤12：下机数据分析

利用Guppy高精度碱基识别模式完成碱基识别，获得fastq文件。利用porechop软件去除接头序列，然后利用fastcat进行片段长度和reads质量过滤后获得用于后续分析的质控后fastq文件。利用minimap2进行耐药基因的比对和注释，统计耐药基因reads占比。利用kraken2进行物种注释，统计耐药基因实现物种注释的比例和情况。

3、实验结果

基因组DNA末端去掉磷酸基团后，使得双链DNA钝化无法与接头连接；而Cas9-sgRNA复合物可通过sgRNA的引导特异性切割目标DNA序列，产生新的活性末端。因此，在接头连接环节，只有目标的耐药基因序列可以和测序接头连接，从而可通过纳米孔实现测序。

从图2中可以看出，相比于正常纳米孔测序，CRISPR-Cas9靶向纳米孔策略可以有效提升耐药基因reads在总的下机数据中的占比，提升了87.5倍。

从图3可以看出，相比于正常纳米孔测序，CRISPR-Cas9靶向纳米孔测序中比对到每个耐药基因的reads均得到显著提升(Mann–Whitney U test：P<0.05)，平均提高了82.6(±35.2)倍。

表6、比对到耐药基因上的reads实现物种注释结果

A：物种注释工具为kraken2；实现物种注释是指kraken2给出与物种与耐药基因来源菌株物种一致；

B：耐药基因sul2可位于质粒上，因此该基因的正确物种注释需要较长片段，实现物种注释的reads比例较低。

Claims

1.一种检测目标核酸及其邻近区域核酸序列的方法，所述测序方法包括在文库制备时对待测样本进行去磷酸化、切割和加A处理的步骤；

优选地，在靶基因中取2个及以上的X，所述取自同一个靶基因的X之间相差1-500bp；

优选地，所述取自同一个靶基因的X之间相差1-400bp，1-300bp，1-200bp，1-100bp，1-55bp，1-50bp，1-40bp，1-30bp，1-20bp，1-10bp或更近；

最优选地，所述取自同一个靶基因的X之间相差1-55bp；

优选地，所述方法还包括对文库纯化后测序的步骤。

2.如权利要求1所述测序方法，所述测序是通过三代测序进行的；

优选地，所述测序是通过的纳米孔测序技术进行的；

优选地，所述测序是通过的ONT纳米孔测序技术进行的；

优选地，所述测序的芯片包括MinION、GridION或PromethION。

3.如权利要求1所述测序方法，所述Cas蛋白包括Cas9、Cas12；

优选地，所述Cas9蛋白包括SpCas9、SaCas9；

优选地，所述Cas9蛋白是SpCas9；

优选地，所述Cas9蛋白包括保留酶切活性的突变型Cas9。

4.如权利要求1所述测序方法，所述Y的序列如SEQ ID NO.1所示。

5.如权利要求1所述测序方法，所述靶基因来源真核生物、原核生物、病毒；

优选地，所述真核生物包括人、鼠、猴、牛、羊、猪、马、鸡、拟南芥、马铃薯、甘薯、紫薯、山药、芋类、木薯、菊薯、水稻、小麦、大麦、玉米、高粱；

优选地，所述原核生物包括细菌、放线菌、古细菌、螺旋体、衣原体、支原体、立克次氏体和蓝细菌；

优选地，所述病毒包括腺病毒、肝炎病毒、流感病毒、水痘病毒、Ⅰ型单纯疱疹病毒、Ⅱ型单纯疱疹病毒、牛瘟病毒、呼吸道合胞病毒、巨细胞病毒、海胆病毒、虫媒病毒、汉坦病毒、腮腺炎病毒、新型冠状病毒；

优选地，所述细菌包括革兰氏阴性菌、革兰氏阳性菌；

优选地，所述细菌包括埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属、不动杆菌属、克雷伯氏菌属；

优选地，所述细菌包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌或铜绿假单胞菌。

6.如权利要求1所述测序方法，所述待测样本包括来源于动物的一个或更多个细胞、组织或体液的样本，所述待测样本还包括环境样本；

优选地，所述体液包括血液、血清、血浆、唾液、脑脊髓液、胸膜液、眼泪、乳腺导管液、淋巴、痰、尿液、羊水或***；

优选地，所述动物包括人；

优选地，所述环境样本包括采集自医院、养殖场和污水处理厂的空气、水体、土壤或设施表面的样本；

优选地，所述待测样本通过预处理提取核酸后进行测序。

7.如权利要求1所述测序方法，在每个靶基因中涉及两个或以上的X；

优选地，所述X的方向是相反或相同的；

优选地，所述X取自靶基因长度10-90％的位置；

优选地，所述X的长度是12-25nt；

优选地，所述X的长度是19或20nt；

优选地，所述X的序列如SEQ ID NO.8-35所示；

优选地，所述物种注释是通过kraken2实现的。

8.一种试剂组合物，所述试剂组合物中包括Cas-sgRNA复合物和以下任意一种或多种试剂的组合：去磷酸化试剂、DNA末端加A试剂、接头连接试剂和测序所需试剂；

所述sgRNA是X-Y的转录产物，其中，X取自靶基因，Y的转录产物与Cas蛋白结合；

优选地，所述X的长度是12-25nt；

优选地，所述X的长度是19或20nt；

最优选地，所述X的序列如SEQ ID NO.8-35所示；

优选地，所述Y的序列如SEQ ID NO.1所示；

优选地，所述测序所需试剂是三代测序所需试剂；

优选地，所述测序所需试剂是纳米孔测序技术所需试剂；

优选地，所述测序所需试剂是ONT纳米孔测序技术所需试剂。

9.如权利要求8所述试剂组合物，所述靶基因来源真核生物、原核生物、病毒；

优选地，所述细菌包括革兰氏阴性菌、革兰氏阳性菌；

优选地，所述细菌包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌或铜绿假单胞菌；

优选地，所述Cas蛋白是Cas9；

优选地，所述Cas9蛋白是SpCas9；

优选地，所述Cas9蛋白包括保留酶切活性的突变型Cas9。

10.Cas蛋白或权利要求8所述试剂组合物的以下任意一种或多种应用：

1)提高靶基因检出比例、

2)对靶基因进行物种注释、上下游序列解析、

3)提高耐药基因检出能力；

优选地，所述耐药基因包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌、铜绿假单胞菌的耐药基因；

优选地，所述Cas包括Cas9、Cas12；

优选地，所述Cas9蛋白包括SpCas9、SaCas9；

优选地，所述Cas9蛋白是SpCas9；

优选地，所述Cas9蛋白包括保留酶切活性的突变型Cas9。