CN116064758A - 选择抑制性环化辅助序列及应用 - Google Patents

选择抑制性环化辅助序列及应用 Download PDF

Info

Publication number
CN116064758A
CN116064758A CN202211460493.8A CN202211460493A CN116064758A CN 116064758 A CN116064758 A CN 116064758A CN 202211460493 A CN202211460493 A CN 202211460493A CN 116064758 A CN116064758 A CN 116064758A
Authority
CN
China
Prior art keywords
sequence
seq
cyclization
fragment
binding region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211460493.8A
Other languages
English (en)
Inventor
汪彪
吴强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naonda Nanjing Biological Technology Co ltd
Original Assignee
Naonda Nanjing Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naonda Nanjing Biological Technology Co ltd filed Critical Naonda Nanjing Biological Technology Co ltd
Priority to CN202211460493.8A priority Critical patent/CN116064758A/zh
Publication of CN116064758A publication Critical patent/CN116064758A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种选择抑制性环化辅助序列及应用。其中,该选择抑制性环化辅助序列从5'端到3'端依次为干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b,干扰序列结合区a的5'端具有磷酸基团;干扰序列结合区a的5'端特异性结合的干扰序列,与干扰序列结合区b的3’端特异性结合的干扰序列相邻,干扰序列为待测序片段中的干扰序列;接头结合区a和接头结合区b分别用于与双端接头序列特异性结合。能够解决现有技术中的测序数据中存在大量对于不感兴趣序列或干扰序列的测序结果的问题,适用于高通量测序领域。

Description

选择抑制性环化辅助序列及应用
技术领域
本发明涉及高通量测序领域,具体而言,涉及一种选择抑制性环化辅助序列及应用。
背景技术
高通量测序技术是生命科学和医学领域应用极为广泛的基础技术之一。而靶向富集测序通过优先对感兴趣的序列进行测序,大大降低了测序成本和生物信息学分析成本,并且提高了分析的灵敏度。
高通量测序技术大体分为文库制备和上机测序两个阶段。靶向富集通常在文库制备的不同步骤引入。例如,基于PCR技术的多重PCR靶向富集测序是通过多重PCR在模板核酸上扩增出文库;基于杂交捕获的靶向富集测序是在制备预文库后,通过探针与预文库杂交,捕获目标区域,得到靶向富集文库。
对于DNA纳米球测序技术来说,文库制备中需要进行环化,然后以环状单链文库分子为模板线性扩增生成纳米球,即测序模板。但在高通量测序中难以对不感兴趣序列或干扰序列进行剔除,大量测序通量被浪费在对于上述不感兴趣序列或干扰序列的测序中,即降低了对于的感兴趣的序列的测序深度,也产生大量无用测序数据,对数据分析产生影响。
发明内容
本发明的主要目的在于提供一种选择抑制性环化辅助序列及应用,以解决现有技术中的测序数据中存在大量对于不感兴趣序列或干扰序列的测序结果的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种选择抑制性环化辅助序列,该选择抑制性环化辅助序列从5'端到3'端依次为干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b,干扰序列结合区a的5'端具有磷酸基团;干扰序列结合区a的5'端特异性结合的干扰序列,与干扰序列结合区b的3’端特异性结合的干扰序列相邻,干扰序列为待测序片段中的干扰序列;接头结合区a和接头结合区b分别用于与双端接头序列特异性结合。
进一步地,选择抑制性环化辅助序列包括:SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:57、SEQ ID NO:58、SEQ IDNO:61、SEQ ID NO:62、SEQ ID NO:65或SEQ ID NO:66所示序列中的任意一种。
为了实现上述目的,根据本发明的第二个方面,提供了一种单链环化文库的制备方法,该制备方法包括:利用上述选择抑制性环化辅助序列环化单链待测序片段,得到单链环化文库。
进一步地,单链待测序片段按如下方法获得:对待测序片段进行末端修复,获得末端修复片段;对末端修复片段进行接头连接,获得两端分别连接有接头序列的连接片段;将两端分别连接有接头序列的连接片段进行变性,获得单链待测序片段。
进一步地,利用选择抑制性环化辅助序列环化单链待测序片段包括:将单链待测序片段和选择抑制性环化辅助序列混合,进行单链环化,获得与选择抑制性环化辅助序列结合的环状片段;对与选择抑制性环化辅助序列结合的环状片段进行酶切,消化去除选择抑制性环化辅助序列,获得单链环化文库。
进一步地,单链待测序片段包括待测目标片段和/或干扰序列。
进一步地,单链环化包括:将单链待测序片段和选择抑制性环化辅助序列混合,选择抑制性环化辅助序列的接头结合区a和接头结合区b与单链待测序片段两端的接头序列特异性结合,形成接头双链结构区,并在连接酶的作用下使单链待测序片段两端的接头序列首尾连接形成与选择抑制性环化辅助序列结合的环状片段。
进一步地,对于含有干扰序列的单链测序片段,选择抑制性环化辅助序列的干扰序列结合区a和干扰序列结合区b均与干扰序列特异性结合形成,形成干扰序列双链结构区,干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端连接使选择抑制性环化辅助序列连接成环;当干扰序列存在突变时,干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端之间不连接。
进一步地,在酶切步骤中,环状片段与选择抑制性环化辅助序列结合形成含有干扰序列双链结构区且选择抑制性环化辅助序列连接成环的,选择抑制性环化辅助序列不被消化去除,环状片段与选择抑制性环化辅助序列结合未形成含有干扰序列双链结构区的,选择抑制性环化辅助序列被酶切消化去除,和/或环状片段与选择抑制性环化辅助序列结合形成含有干扰序列双链结构区的,但干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端之间不连接的,选择抑制性环化辅助序列被消化去除。
为了实现上述目的,根据本发明的第三个方面,提供了一种DNB测序文库的制备方法,该制备方法包括对上述单链环化文库进行滚环复制,得到DNB测序文库。
为了实现上述目的,根据本发明的第四个方面,提供了一种DNB测序文库的测序方法,该测序方法包括:利用上述制备方法制备得到DNB测序文库;利用DNA纳米球测序平台对DNB测序文库进行测序,获得测序数据。
为了实现上述目的,根据本发明的第五个方面,提供了一种选择抑制性环化辅助序列、或制备方法,或测序方法,在制备DNA纳米球测序平台所需文库、利用DNA纳米球测序平台进行测序、或降低测序数据中干扰序列的占比中的应用。
应用本发明的技术方案,上述含有干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b的选择抑制性环化辅助序列,能够取代现有的DNA纳米球测序文库构建中所用的夹板寡核酸(splint oligo),即具有能与待测DNA上的接头序列特异性结合、并促使DNA成环的接头结合区a、接头结合区b,也具有能够与干扰序列特异性结合的干扰序列结合区a和干扰序列结合区b。在与干扰序列特异性结合形成双链结构后,此种带有双链结构的环状文库分子在后续的DNA纳米球测序中,难以进行滚环复制(rolling circleamplification),从而不能被测序,即实现了减少测序数据中对于干扰序列的测序结果,降低测序成本和提升分析灵敏度。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的选择抑制性环化辅助序列的结构示意图。
图2示出了根据本发明实施例的对于不同待测序片段的制备方法示意图。
图3示出了根据本发明实施例1的选择抑制性环化辅助序列影响干扰序列覆盖深度的结果图。
图4示出了根据本发明实施例3的不同环化方式下的基因频率示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
干扰序列:是指在待测序序列中存在,在测序结果中占据一定比例,但是不提供有效信息的序列。
如背景技术所提到的,在高通量测序中难以对不感兴趣序列或干扰序列进行剔除,大量测序通量被浪费在对于上述不感兴趣序列或干扰序列的测序中,即降低了对感兴趣的序列的测序深度,也产生大量无用测序数据,对数据分析产生不利影响。因而,在本申请中发明人尝试开发了一种选择抑制性环化辅助序列,利用该选择抑制性环化辅助序列既能起到常规splint oligo的辅助单链文库环化的作用,又能够减少DNA纳米球测序平台对于干扰序列的测序深度,在此基础上提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种选择抑制性环化辅助序列,该选择抑制性环化辅助序列从5'端到3'端依次为干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b,干扰序列结合区a的5'端具有磷酸基团(pho);干扰序列结合区a的5'端特异性结合的干扰序列,与干扰序列结合区b的3’端特异性结合的干扰序列相邻,干扰序列为待测序片段中的干扰序列;接头结合区a和接头结合区b分别用于与双端接头序列特异性结合。
上述接头结合区a和接头结合区b的功能与DNA纳米球测序文库构建中所用的夹板寡核酸(splint oligo)相同(包括如SEQ ID NO 67所示的序列),接头结合区a和接头结合区b的序列可以与splint oligo的序列相同。在现有技术中,此种splint oligo能够指导待测的单链DNA片段环化,形成环状DNA单链。选择抑制性环化辅助序列的结构如图1所示。此种选择抑制性环化辅助序列用于DNA纳米球测序文库构建。
SEQ ID NO 67:aagctgacgtactgagaggcatggcgacctaa。
上述与接头结合区a和接头结合区b特异性结合的双端接头序列,是连接在待测序片段两端上的接头序列,帮助完成单链DNA片段环化,也是后续滚环复制制备DNA纳米球的扩增引物结合位点。
上述待测序片段是待进行DNA纳米球测序的、片段化的样本,具有多条DNA序列。对于用于DNA纳米球测序的原始样本,可以是DNA也可以是RNA样本,将RNA样本进行逆转录后获得的DNA能够进行测序。在待测序片段中,部分片段中包括干扰序列,此种干扰序列包括但不限于核糖体RNA的cDNA序列、野生型基因等研究者不感兴趣的序列。上述选择抑制性环化辅助序列能够与干扰序列进行特异性结合,并在环化后生成的“单链环状DNA”实际为具有部分双链结构的环状DNA,具有双环化(单链DNA环状和选择抑制性环化辅助序列成环)的结构。此种环状DNA难以进行滚环复制并被制备为DNA纳米球,因此不能进行DNA纳米球测序,从而能够降低干扰序列在测序数据中的测序深度。
在一种优选的实施例中,选择抑制性环化辅助序列包括但不限于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:33、SEQID NO:34、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:45、SEQID NO:46、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:57、SEQID NO:58、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:65或SEQ ID NO:66所示序列中的任意一种。
在本申请第二种典型的实施方式中,提供了一种单链环化文库的制备方法,该制备方法包括:利用上述选择抑制性环化辅助序列环化单链待测序片段,得到单链环化文库。
在上述制备方法中,利用待测序片段替代现有技术中的splint oligo,能够制备目标抑制文库。
在一种优选的实施例中,单链待测序片段按如下方法获得:对待测序片段进行末端修复,获得末端修复片段;对末端修复片段进行接头连接,获得两端分别连接有接头序列的连接片段;将两端分别连接有接头序列的连接片段进行变性,获得单链待测序片段。
在一种优选的实施例中,利用选择抑制性环化辅助序列环化单链待测序片段包括:将单链待测序片段和选择抑制性环化辅助序列混合,进行单链环化,获得与选择抑制性环化辅助序列结合的环状片段;对与选择抑制性环化辅助序列结合的环状片段进行酶切,消化去除选择抑制性环化辅助序列,获得单链环化文库。
在上述酶切过程中,利用核酸外切酶从暴露的DNA末端处开始切割,消化DNA,环状的DNA没有暴露的末端,因此不受影响。在现有技术中,常规的splint oligo自身不会环化,因而在此步骤中均被消化去除。本方法所采用的带有干扰序列结合区的选择抑制性环化辅助序列,当片段包含干扰序列时,选择抑制性环化辅助序列自身也发生环化,因而无法被清除。
在一种优选的实施例中,单链待测序片段包括待测目标片段和/或干扰序列。
在一种优选的实施例中,单链环化包括:将单链待测序片段和选择抑制性环化辅助序列混合,选择抑制性环化辅助序列的接头结合区a和接头结合区b与单链待测序片段两端的接头序列特异性结合,形成接头双链结构区,并在连接酶的作用下使单链待测序片段两端的接头序列首尾连接形成与选择抑制性环化辅助序列结合的环状片段。
在一种优选的实施例中,对于含有干扰序列的单链测序片段,选择抑制性环化辅助序列的干扰序列结合区a和干扰序列结合区b均与干扰序列特异性结合形成,形成干扰序列双链结构区,干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端连接使选择抑制性环化辅助序列连接成环;当干扰序列存在突变时,干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端之间不连接。
在一种优选的实施例中,在酶切步骤中,环状片段与选择抑制性环化辅助序列结合形成含有干扰序列双链结构区且选择抑制性环化辅助序列连接成环的,选择抑制性环化辅助序列不被消化去除,环状片段与选择抑制性环化辅助序列结合未形成含有干扰序列双链结构区的,选择抑制性环化辅助序列被酶切消化去除,和/或环状片段与选择抑制性环化辅助序列结合形成含有干扰序列双链结构区的,但干扰序列结合区a的5'端的磷酸基团与干扰序列结合区b的3'端之间不连接的,选择抑制性环化辅助序列被消化去除。
在上述制备方法中,使用选择抑制性环化辅助序列环化待测序片段。若待测序片段中不含有干扰序列,待测序片段的末端在接头结合区a、接头结合区b的指导下进行单链环化,获得环状片段。若待测序片段中含有干扰序列,则在获得的环状片段中,除了待测序片段的末端在接头的指导下进行环化外,干扰序列结合区a、干扰序列结合区b能够和带测序片段上的干扰序列特异性结合,干扰序列结合区a的5'端的磷酸基团和干扰序列结合区b的3'端连接。
而对于干扰序列中含有突变的待测序片段,干扰序列结合区a、干扰序列结合区b不能和含有突变的待测序片段进行特异性结合,干扰序列结合区a的5'端的磷酸基团难以与干扰序列结合区b的3'端连接。
突变位置离干扰序列结合区a和干扰序列结合区b的连接点越近,对连接的效率影响越大。优选地,突变位置与连接点为距离≤2bp。针对特定的突变,通过将干扰序列结合区a和b之间的连接点设置在突变的位置的附近,优选设置在突变的位置,可以实现突变片段不受干扰;而未突变的片段产生双环化结构,受到干扰。
在对于环状片段进行酶切(消化)后获得环状文库分子,不含有干扰序列、或含有突变的待测序片段形成的环状文库分子为环状单链DNA;含有干扰序列的待测序片段形成的环状文库分子中,干扰序列与干扰序列结合区a、干扰序列结合区b特异性结合为双链DNA。对于不同待测序片段的制备方法的示意图如图2所示。
在本申请第三种典型的实施方式中,提供了一种DNB测序文库的制备方法,该制备方法包括对上述单链环化文库进行滚环复制,得到DNB测序文库。
在本申请第四种典型的实施方式中,提供了一种DNB测序文库的测序方法,该测序方法包括:利用上述制备方法制备得到DNB测序文库;利用DNA纳米球测序平台对DNB测序文库进行测序,获得测序数据。
在上述DNB测序文库的制备方法和测序方法中,对于环状文库分子进行扩增形成DNA纳米球(DNB)并进行测序。对于不存在双链DNA的环状文库分子,即为单链环状DNA,能够进行滚环复制(rolling circle amplification)扩增为DNA纳米球从而完成测序。对于存在双链DNA的环状文库分子,难以完成滚环复制扩增为DNA纳米球。因此携带有干扰序列的环状文库分子不能在DNA纳米球测序平台中完成测序。利用上述上述制备方法制备干扰序列抑制文库,并利用DNA纳米球测序平台对干扰序列抑制文库进行测序,能够减少对于干扰序列的测序,从而降低干扰序列的测序深度。
在本申请第五种典型的实施方式中,提供了一种上述选择抑制性环化辅助序列、或制备方法,或测序方法,在制备DNA纳米球测序平台所需文库、利用DNA纳米球测序平台进行测序、或降低测序数据中干扰序列的占比中的应用。
上述选择抑制性环化辅助序列,一方面承担辅助文库片段环化的功能(通过接头结合区),另一方面,在待测序序列包含特定序列时(这里称作干扰序列,需要对其进行抑制\降低\排除),选择抑制性环化辅助序列自身也会环化,产生双环化结构,在后续的消化处理中,双环无法被消化,维持其状态,无法进一步生成纳米球,无法被测序。从而最终降低测序数据中的干扰序列的占比。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1
RNA样本中,核糖体RNA通常占据主要部分,通常被认为是干扰序列,需要在制备RNA测序文库之前或在制备过程中去除,节省的测序成本通常高于mRNA富集或rRNA去除步骤的成本。靶向测序可以在一定程度上排除核糖体RNA,例如杂交捕获RNA测序通常不需要制备去除核糖体RNA的测序文库,总RNA文库在杂交捕获后核糖体RNA序列占比降低,但通常仍有残留。
根据人核糖体序列,按照本方法设计一条选择抑制性环化辅助序列Probe1,序列如SEQ ID NO:1所示,测试其降低干扰序列比例的效果。
Probe1:5'pho-gtccaagaatttcacctctaaaaagctgacgtactgagaggcatggcgaccttaactctggtccgtcttgcgccg-3'(SEQ ID NO:1)。
此选择抑制性环化辅助序列可以结合18S核糖体RNA序列,参考基因组hg19上对应区域为chrUn_gl000220:110031-110070(以及chrUn_gl000220:154003-154042)。RNA测序文库,使用
Figure BDA0003955240880000072
通用环化试剂盒v2(纳昂达,1002241)环化,分别使用原splint oligo,或以上述选择抑制性环化辅助序列代替原splint oligo。环化文库MGI2000测序。测序数据以STAR软件比对到hg19参考基因组上。加入上述选择抑制性环化辅助序列后,这一区域的覆盖深度有明显降低,但由于仅抑制了包含正向序列的文库,降低幅度低于50%。
进一步加入SEQ ID NO:2所示的选择抑制性环化辅助序列Probe2。此选择抑制性环化辅助序列针对的是反向互补序列,参考基因组hg19上对应区域为chrUn_gl000220:110071-110110和chrUn_gl000220:154043-154082,避免与上一条选择抑制性环化辅助序列重叠互补。选择抑制性环化辅助序列同时代替splint oligo功能,因此其总浓度与原splint oligo相等。
Probe2:5'pho-gttttcattaatcaagaacgaaaagctgacgtactgagaggcatggcgaccttaacgaaagcatttgccaagaat-3'(SEQ ID NO:2)。
同时加入两条选择抑制性环化辅助序列后,相应区域(干扰序列)覆盖深度进一步下降(如图3所示)。如果需要进一步抑制所有的rRNA,则需要进一步补充选择抑制性环化辅助序列。
实施例2
低频突变检测是肿瘤液体活检,微小残留病灶监测,癌症早筛等领域的基础技术。对于低频率的突变进行高通量测序,绝大部分测到的序列都是野生型序列,这部分序列占据大量测序成本的同时,也提高了通过增加测序量提升灵敏度的难度。通过本方法,设计选择性抑制野生型序列的选择抑制性环化辅助序列,可以大幅提高稀有的突变序列在测序数据中的比例。
选取在两个健康人A和B之间存在差异的16个单碱基突变位点。A和B的基因组DNA按照99比1的比例混合。16个位点以多重PCR扩增,制备MGI平台测序文库。文库分为两部分,分别以标准
Figure BDA0003955240880000071
通用环化试剂盒v2(纳昂达,1002241)以及将splint oligo更换为16种选择抑制性环化辅助序列的定制环化试剂盒环化。MGI2000测序仪分别测序。A和B的基因组DNA按照99:1混合,当B的基因组DNA的差异位点为纯合时,B基因频率为1%;当B的基因组DNA的差异位点为杂合时,B基因频率为0.5%。
多重PCR引物及选择抑制性环化辅助序列如下表1所示。
表1
Figure BDA0003955240880000081
Figure BDA0003955240880000091
Figure BDA0003955240880000101
在人工混合样本中,16个位点的理论基因频率如下表2所示。以标准试剂盒环化测序,基因频率与理论值相符。利用上述选择抑制性环化辅助序列环化,基因频率有至少4倍的提升。实验结果如表2所示。
表2
Figure BDA0003955240880000102
实施例3
扩增子测序文库不包含原始片段的断裂位置信息,而杂交捕获文库则包含这一重要的信息。结合双端分子标签,可以对原始片段溯源提高分析的准确性。针对实例2中所述的16个位点,定制杂交捕获探针(NAD Probes定制探针,纳昂达)。A和B的基因组DNA按照99比1的比例混合后,以
Figure BDA0003955240880000103
dsDNA
Figure BDA0003955240880000104
片段化。以
Figure BDA0003955240880000105
血浆游离DNA双端分子标签文库构建试剂盒(for MGI)制备双端分子标签文库,投入量10ng。以
Figure BDA0003955240880000106
HybridCapture Reagents进行杂交捕获。捕获后文库分别以标准
Figure BDA0003955240880000107
通用环化试剂盒v2(纳昂达,1002241)以及将splint oligo更换为16组选择抑制性环化辅助序列(表1中所示的选择抑制性环化辅助序列)的定制环化试剂盒环化。MGI2000测序仪测序。
利用双端分子标签对测序数据进行去重和溯源,生成一致性序列。对一致性序列进行变异分析,两种环化方式得到的B基因频率如下表所示。测序数据中包含的A/B基因型一致性序列覆盖深度及原始序列覆盖深度如下表3和表4所示。
表3
Figure BDA0003955240880000111
表4
Figure BDA0003955240880000112
如图4所示,以原始序列分析,将splint oligo更换为16组选择抑制性环化辅助序列使得B基因频率明显提升。但是以一致性序列分析,这种提升的幅度降低,这是因为对于每个原始片段产生的A基因型测序序列,选择抑制性环化辅助序列都是以一定比例抑制,而每个原始片段都仍然有机会被测序。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:利用含有干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b的选择抑制性环化辅助序列,能够取代现有的DNA纳米球测序文库构建中所用的splint oligo,即具有能与待测DNA上的接头序列特异性结合、并促使DNA成环的接头结合区a、接头结合区b,也具有能够与干扰序列特异性结合的干扰序列结合区a和干扰序列结合区b。在环化步骤加入对目标区域和非目标区域的筛选,在与干扰序列特异性结合形成双链结构后,此种带有双链结构的环状文库分子在后续的DNA纳米球测序中,难以进行滚环复制,从而不能被测序,即实现了减少测序数据中对于干扰序列的测序结果,降低测序成本和提升分析灵敏度。且此种对于干扰序列的筛选过程,与文库环化步骤整合,不增加试验步骤,便于试验的正常进行。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种选择抑制性环化辅助序列,其特征在于,所述选择抑制性环化辅助序列从5'端到3'端依次为干扰序列结合区a、接头结合区a、接头结合区b和干扰序列结合区b,所述干扰序列结合区a的5'端具有磷酸基团;
所述干扰序列结合区a的5'端特异性结合的干扰序列,与所述干扰序列结合区b的3’端特异性结合的干扰序列相邻,所述干扰序列为待测序片段中的干扰序列;
所述接头结合区a和所述接头结合区b分别用于与双端接头序列特异性结合。
2.根据权利要求1所述的选择抑制性环化辅助序列,其特征在于,所述选择抑制性环化辅助序列包括:
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:33、SEQID NO:34、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:65或SEQ IDNO:66所示序列中的任意一种。
3.一种单链环化文库的制备方法,其特征在于,所述制备方法包括:
利用权利要求1或2所述的选择抑制性环化辅助序列环化单链待测序片段,得到单链环化文库。
4.根据权利要求3所述的制备方法,其特征在于,所述单链待测序片段按如下方法获得:
对所述待测序片段进行末端修复,获得末端修复片段;
对所述末端修复片段进行接头连接,获得两端分别连接有接头序列的连接片段;
将两端分别连接有接头序列的所述连接片段进行变性,获得所述单链待测序片段。
5.根据权利要求3所述的制备方法,其特征在于,利用所述选择抑制性环化辅助序列环化所述单链待测序片段包括:
将所述单链待测序片段和所述选择抑制性环化辅助序列混合,进行单链环化,获得与所述选择抑制性环化辅助序列结合的环状片段;
对与选择抑制性环化辅助序列结合的所述环状片段进行酶切,消化去除所述选择抑制性环化辅助序列,获得所述单链环化文库。
6.根据权利要求5所述的制备方法,其特征在于,所述单链待测序片段包括待测目标片段和/或所述干扰序列。
7.根据权利要求5所述的制备方法,其特征在于,所述单链环化包括:将所述单链待测序片段和所述选择抑制性环化辅助序列混合,所述选择抑制性环化辅助序列的所述接头结合区a和所述接头结合区b与所述单链待测序片段两端的所述接头序列特异性结合,形成接头双链结构区,并在连接酶的作用下使所述单链待测序片段两端的所述接头序列首尾连接形成与所述选择抑制性环化辅助序列结合的所述环状片段。
8.根据权利要求6所述的制备方法,其特征在于,对于含有所述干扰序列的所述单链测序片段,所述选择抑制性环化辅助序列的所述干扰序列结合区a和所述干扰序列结合区b均与所述干扰序列特异性结合形成,形成干扰序列双链结构区,所述干扰序列结合区a的5'端的磷酸基团与所述干扰序列结合区b的3'端连接使所述选择抑制性环化辅助序列连接成环;
当所述干扰序列存在突变时,所述干扰序列结合区a的5'端的磷酸基团与所述干扰序列结合区b的3'端之间不连接。
9.根据权利要求8所述的制备方法,其特征在于,在所述酶切步骤中,所述环状片段与所述选择抑制性环化辅助序列结合形成含有所述干扰序列双链结构区且所述选择抑制性环化辅助序列连接成环的,所述选择抑制性环化辅助序列不被消化去除,
所述环状片段与所述选择抑制性环化辅助序列结合,且未形成含有所述干扰序列双链结构区的,所述选择抑制性环化辅助序列被酶切消化去除,和/或
所述环状片段与所述选择抑制性环化辅助序列结合形成含有所述干扰序列双链结构区的,但所述干扰序列结合区a的5'端的磷酸基团与所述干扰序列结合区b的3'端之间不连接的,所述选择抑制性环化辅助序列被消化去除。
10.一种DNB测序文库的制备方法,其特征在于,所述制备方法包括对权利要求3至9中任一项所述的单链环化文库进行滚环复制,得到所述DNB测序文库。
11.一种DNB测序文库的测序方法,其特征在于,所述测序方法包括:
利用权利要求3至9中任一项所述的制备方法制备得到所述DNB测序文库;
利用DNA纳米球测序平台对所述DNB测序文库进行测序,获得测序数据。
12.权利要求1或2所述的选择抑制性环化辅助序列、或权利要求3至9中任一项所述的制备方法,或权利要求11所述的测序方法,在制备DNA纳米球测序平台所需文库、利用DNA纳米球测序平台进行测序、或降低测序数据中干扰序列的占比中的应用。
CN202211460493.8A 2022-11-17 2022-11-17 选择抑制性环化辅助序列及应用 Pending CN116064758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211460493.8A CN116064758A (zh) 2022-11-17 2022-11-17 选择抑制性环化辅助序列及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211460493.8A CN116064758A (zh) 2022-11-17 2022-11-17 选择抑制性环化辅助序列及应用

Publications (1)

Publication Number Publication Date
CN116064758A true CN116064758A (zh) 2023-05-05

Family

ID=86169029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211460493.8A Pending CN116064758A (zh) 2022-11-17 2022-11-17 选择抑制性环化辅助序列及应用

Country Status (1)

Country Link
CN (1) CN116064758A (zh)

Similar Documents

Publication Publication Date Title
JP6679576B2 (ja) 小胞性リンカー、ならびに核酸ライブラリ構築およびシーケンシングにおけるその使用
CN106554957B (zh) 测序文库及其制备和应用
US11261479B2 (en) Methods and compositions for enrichment of target nucleic acids
CN111378720A (zh) 长链非编码rna的测序文库构建方法及其应用
WO2013079649A1 (en) Method and kit for characterizing rna in a composition
Darbeheshti et al. Recent developments in mutation enrichment and detection technologies
CN115109842A (zh) 用于准确的平行定量核酸的高灵敏度方法
CN114214408A (zh) 一种高通量、高灵敏度检测肿瘤ctDNA甲基化的方法、探针库及试剂盒
CN107236727B (zh) 多基因捕获测序的单链探针制备方法
CN110452958B (zh) 一种微量碎片化核酸甲基化检测的接头、引物、试剂盒及其应用
CN114277114B (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN116064758A (zh) 选择抑制性环化辅助序列及应用
WO2020259303A1 (zh) 一种快速构建rna 3'端基因表达文库的方法
US11680290B2 (en) Efficient methods and compositions for multiplex target amplification PCR
WO2018081666A1 (en) Methods of single dna/rna molecule counting
CN111748621A (zh) 一种检测肺癌相关41基因的探针库、试剂盒及其应用
CN110612355B (zh) 用于定量pcr扩增的组合物及其应用
Liu et al. LM-PCR permits highly representative whole genome amplification of DNA isolated from small number of cells and paraffin-embedded tumor tissue sections
US20210040540A1 (en) Parallel liquid-phase hybrid capture method for simultaneously capturing sense and antisense double strands of genomic target region
CN110225979B (zh) 基于滚环扩增的基因组目标区域富集方法及其应用
JP2905192B2 (ja) 遺伝子発現の定量方法
Van Cauwenbergh et al. Genetic testing techniques
CN117265116A (zh) 一种tfe3融合基因的检测方法、试剂盒以及探针库
KR20240032630A (ko) 핵산의 정확한 병렬 검출 및 정량화 방법
CN117660617A (zh) 用于检测myh7、mybpc3、tnnt2和tnni3基因的试剂盒及其使用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination