CN110491448B - 一种处理pcr引物的方法、***、平台及存储介质 - Google Patents

一种处理pcr引物的方法、***、平台及存储介质 Download PDF

Info

Publication number
CN110491448B
CN110491448B CN201910636484.1A CN201910636484A CN110491448B CN 110491448 B CN110491448 B CN 110491448B CN 201910636484 A CN201910636484 A CN 201910636484A CN 110491448 B CN110491448 B CN 110491448B
Authority
CN
China
Prior art keywords
primer
primers
target
candidate
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910636484.1A
Other languages
English (en)
Other versions
CN110491448A (zh
Inventor
朱奇
曾晓杰
廖传荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Genephar Biotechnology Co ltd
Original Assignee
Guangzhou Genephar Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Genephar Biotechnology Co ltd filed Critical Guangzhou Genephar Biotechnology Co ltd
Priority to CN201910636484.1A priority Critical patent/CN110491448B/zh
Publication of CN110491448A publication Critical patent/CN110491448A/zh
Application granted granted Critical
Publication of CN110491448B publication Critical patent/CN110491448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及生物技术领域,具体涉及一种处理PCR引物的方法、***、平台及存储介质。获取待处理目标引物数据信息;根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;对目标引物区域进行分割划分;根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;将候选引物分装到不同的分组中,并生成PCR引物设计报告。可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计,可以大大缩短此类引物的设计时间,而且还可以实现目标区域的全覆盖。

Description

一种处理PCR引物的方法、***、平台及存储介质
技术领域
本发明涉及生物技术领域,具体涉及一种处理PCR引物的方法、***、平台及存储介质。
背景技术
聚合酶链式反应简称PCR(Polymerase Chain Reaction)(又称:多聚酶链式反应)PCR是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火(复性)及适温延伸等反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。它不仅可用于基因分离、克隆和核酸序列分析等基础研究,还可用于疾病的诊断或任何有DNA,RNA的地方。而多重PCR(multiplex PCR),又称多重引物PCR或复合PCR,它是在同一PCR反应体系里加上二对以上引物,同时扩增出多个核酸片段的PCR反应,其反应原理,反应试剂和操作过程与一般PCR相同,多重PCR技术是高通量基因测序技术中捕获特定感兴趣区域的DNA片段进行测序的重要技术手段。
目前多数的PCR应用都以某些基因或某些热点区域为研究的对象,而基因中生物学意义最为重要的部分是基因的外显子区域。而目前的PCR设计方法中,大多需要手动查询公共数据库网站获取目标基因的外显子片段序列或热点目标区域序列,然后利用引物设计软件进行手动的设计,最后还需要用手动的方法检查引物的特异性和是否存在引物二聚体等情况。这些步骤比较繁琐,费时费力。
发明内容
针对以上骤比较繁琐,费时费力的技术问题,本发明提供一种处理PCR引物的方法、***、平台及存储介质,可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计,可以大大缩短此类引物的设计时间,而且还可以实现目标区域的全覆盖。
一种处理PCR引物的方法,所述的方法具体包括如下步骤:
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告。
进一步地,所述的目标引物数据信息具体包括:
目标基因名称、NCBI数据库snp位点的rs号、转录本号和热点区域。
进一步地,所述的对目标引物区域进行分割划分,具体为:
根据自定义的扩增片段长度范围,将较长目标区域分割成较小的目标引物区域。
进一步地,所述的自定义参数,具体包括:
扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量和最大退火温度差异。
进一步地,于步骤将候选引物分装到不同的分组中,并生成PCR引物设计报告之中,还包括步骤:
获取引物设计参数信息、引物分组信息、引物序列和引物属性。
为实现上述目的,本发明还提供一种处理PCR引物的***,所述的***具体包括:
第一获取单元,用于获取待处理目标引物数据信息;
第二获取单元,用于根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
分割划分单元,用于对目标引物区域进行分割划分;
第三获取单元,用于根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
处理单元,用于根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
生成单元,用于将候选引物分装到不同的分组中,并生成PCR引物设计报告。
进一步地,所述的***还包括:
第一获取模块,用于获取引物设计参数信息、引物分组信息、引物序列和引物属性。
为实现上述目的,本发明还提供一种处理PCR引物的平台,包括:
处理器、存储器以及处理PCR引物平台控制程序;
其中在所述的处理器执行所述处理PCR引物平台控制程序,所述处理PCR引物平台控制程序被存储在所述存储器中,所述的处理PCR引物平台控制程序,实现所述的处理PCR引物的方法步骤。
为实现上述目的,本发明还提供一种计算机可读取存储介质,所述计算机可读取存储介质存储有处理PCR引物平台控制程序,所述处理PCR引物平台控制程序,实现所述的处理PCR引物的方法步骤。
与现有技术相比,本发明具有以下有益效果:
本发明通过一种处理PCR引物的方法,
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告。
及相应地***单元和模块:
第一获取单元,用于获取待处理目标引物数据信息;
第二获取单元,用于根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
分割划分单元,用于对目标引物区域进行分割划分;
第三获取单元,用于根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
处理单元,用于根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
生成单元,用于将候选引物分装到不同的分组中,并生成PCR引物设计报告。进一步地,所述的***还包括:
第一获取模块,用于获取引物设计参数信息、引物分组信息、引物序列和引物属性。
及相应地平台及存储介质;
可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计,可以大大缩短此类引物的设计时间,而且还可以实现目标区域的全覆盖。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种处理PCR引物的方法架构流程示意图;
图2为本发明一种处理PCR引物的方法架构优选实施例示意图;
图3为本发明一种处理PCR引物的***架构示意图;;
图4为本发明一种处理PCR引物的平台架构示意图;
图5为本发明一种实施例中计算机可读取存储介质架构示意图;
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为便于更好的理解本发明的目的、技术方案和优点更加清楚,下面结合附图和具体的实施方式对本发明作进一步说明,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。
本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。其次,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
优选地,本发明一种处理PCR引物的方法应用在一个或者多个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
本发明为实现一种处理PCR引物的方法、***、平台及存储介质。
如图1所示,是本发明实施例提供的处理PCR引物的方法的流程图。
在本实施例中,所述处理PCR引物的方法,可以应用于具备显示功能的终端或者固定终端中,所述终端并不限定于个人电脑、智能手机、平板电脑、安装有摄像头的台式机或一体机等。
所述处理PCR引物的方法也可以应用于由终端和通过网络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于:广域网、城域网或局域网。本发明实施例的处理PCR引物的方法可以由服务器来执行,也可以由终端来执行,还可以是由服务器和终端共同执行。
例如,对于需要进行处理PCR引物的终端,可以直接在终端上集成本发明的方法所提供的处理PCR引物的功能,或者安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以软件开发工具包(Software Development Kit,SDK)的形式运行在服务器等设备上,以SDK的形式提供处理PCR引物的功能的接口,终端或其他设备通过所提供的接口即可实现处理PCR引物的功能。
如图1所示,本发明提供了一种处理PCR引物的方法,所述方法具体包括如下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告。
具体地,所述的目标引物数据信息具体包括:
目标基因名称、NCBI数据库snp位点的rs号、转录本号和热点区域。
所述的对目标引物区域进行分割划分,具体为:
根据自定义的扩增片段长度范围,将较长目标区域分割成较小的目标引物区域。
所述的自定义参数,具体包括:
扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量和最大退火温度差异。
在本发明实施例中,于步骤将候选引物分装到不同的分组中,并生成PCR引物设计报告之中,还包括步骤:
获取引物设计参数信息、引物分组信息、引物序列和引物属性。
也就是说,如附图2所示,为实现基因全外显子、snp位点或其他热点区域的全自动引物设计,本发明包含以下模块即方法步骤:
步骤一,输入设计引物的目标,输入类型包括目标基因名称、NCBI数据库snp位点的rs号、转录本号、热点区域,运行getTar.py程序,获取目标区域在参考基因组上的坐标;
具体地,输入文件的格式如下表所示,可以多类型,包括通过基因名称(如EGFR)获取外显子区域(Exon)或蛋白编码区域(CDS)、通过转录本号(如NM_005228)获取外显子目标区域和蛋白编码目标区域(CDS)、通过基因组坐标(chr:123456-123457)获取引物设计目标区域以及通过rs号(如rs13035)获取引物设计目标区域批量自动获取目标区域在参考基因组上的位置:
query type
rs13035 snp
chr:123456-123457 Coordinate
EGFR Gene Exon Only
BRAF Gene CDS Only
NM_005228 Transcript CDS only
NM_005228 Transcript Exon only
步骤二,根据自定义的扩增片段长度范围,分割将较长目标区域分割成较小的目标区域;
也就是说,自定义引物设计参数。设定返回的引物数量,范围为1-999999;设定引物长度,设定范围为15-40;设定引物GC含量,设定范围为15%-85%;设定引物溶解温度,设定范围为50-70℃;设定最大连续相同碱基数量,设定范围为3-6;,设定扩增片段长度,设定范围为60-400。设定最大分pool数量,设定范围为1-5。本发明实例中可以根据实际实验要求,自定义以上各种参数。
步骤三,将分割好的目标区域对应到人类参考基因组上,获取到目标区域的DNA序列;
步骤四,将扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量、最大退火温度差异等自定义参数写在一个文档文件中,以该文件以及步骤三中获取的DNA序列作为输入参数,运行primer软件,获得满足自定义参数条件的候选引物;
步骤五,以步骤四所获得候选引物为输入文件,运行以blast软件为基础的引物特异性检测,筛选得到特异性扩增的候选引物;
步骤六,读取筛选得到的特异性扩增的候选引物,运行以pooler软件为基础的引物二聚体筛选得到无引物二聚体的候选引物;在全外显子多重PCR引物设计中,因需要覆盖全部外显子区域,会存在overlap(扩增片段相互叠加)的情况,读取上步骤中得到的候选引物,运行以pooler软件为基础的overlap检测,如果存在overlap情况,则自动将候选引物分装到不同的分组中,避免多重PCR引物overlap情况的发生。
步骤七,读取引物设计参数信息、引物分组信息、引物序列、引物属性,整合输出到一份文档文件中,即得到最终的多重PCR引物设计结果。
换言之,在本发明实施例中,为实现基因全外显子、snp位点或其他热点区域的全自动引物设计,本发明包含以下模块:
步骤一、输入设计引物的目标,输入类型包括目标基因名称、NCBI数据库snp/rs号、转录本号、热点区域,运行getTar.py程序,获取目标区域在参考基因组上的坐标;输入文件的格式如下表所示,可以多类型,包括通过基因名称(如EGFR)获取外显子区域(Exon)或蛋白编码区域(CDS)、通过转录本号(如NM_005228)获取外显子目标区域和蛋白编码目标区域(CDS)、通过基因组坐标(chr:123456-123457)获取引物设计目标区域以及通过rs号(如rs13035)获取引物设计目标区域批量自动获取目标区域在参考基因组上的位置:
query type
rs13035 snp
chr:123456-123457 Coordinate
EGFR Gene Exon Only
BRAF Gene CDS Only
NM_005228 Transcript CDS only
NM_005228 Transcript Exon only
步骤二、自定义引物设计参数。设定返回的引物数量,范围为1-999999;设定引物长度,设定范围为15-40;设定引物GC含量,设定范围为15%-85%;设定引物溶解温度,设定范围为50-70℃;设定最大连续相同碱基数量,设定范围为3-6;,设定扩增片段长度,设定范围为60-400。设定最大分pool数量,设定范围为1-5。本发明可以根据实际实验要求,自定义以上各种参数。
步骤三、目标区域分割,根据自定义的扩增片段长度范围,运行目标区域分割程序,分割将较长目标区域分割成较小的目标区域,例如设定的扩增片段长度范围为80-200,而目标区域长度为2000,将被自动分割成10个以上的较小的目标区域;
步骤四、将分割好的目标区域对应到人类参考基因组(hg19)上,获取到目标区域的DNA序列,文件的格式为fasta;
步骤五、运行primer3软件,获得满足自定义参数条件的所有候选引物,每个区域返回设定数量的引物保存到候选引物结果文件;
步骤六、以步骤五所获得候选引物为输入文件,循环读取每对引物,运行以blast软件为基础,使用启发式搜索来找出参考基因组上与候选引物对相关的序列,如只有唯一对应的序列,则引物特异,如有两个以上的对应序列,则引物非特异。筛选得到特异性扩增的候选引物,如无特异性引物,则返回上一步骤,返回另外一组设定数量的候选引物;
较佳地,步骤六进一步包括以下步骤:
1、移除引物序列中之低复杂度以及有串接重复现象的区域,将引物序列中每k个字的组合做成一个表,列出我们所关心的所有可能之字组,将这些经筛选后剩下的高分字组组织成快速搜索树的结构。
2、对每个引物序列中的字组重复步骤1,并得到所有相应的高分字组、扫描数据库中的序列,看看是否有跟剩下的高分字组完全匹配的情形、将这些完全匹配的地方扩展为高分序对。
3、将所有分数够高的高分序对列出来、评估这些留下来的高分序对它们的分数是否具有意义、将一个数据库序列中的多个高分序对区域结合成一个更长的排比;
4、显示引物序列和所有之前找到可能相关的数据库序列之有间隙区域排比、列出上一步骤中期望分数E低于我们所要求的门槛值之数据库序列,最终得到与引物最为相关的参考序列相关区域;
5、判断得到的参考序列相关区域是否唯一,如唯一则特异,否则为非特异。
步骤七、根据步骤五筛选结果,读取筛选得到的特异性扩增的候选引物,运行以pooler软件为基础的引物二聚体检测程序,得到引物之间可能存在的二聚体情况;
进一步的,步骤七包括以下步骤:
1.读取输入候选引物序列,序列输入格式如下:
输入内容 内容说明
>IRF1_4-F 正链引物名称
TGGCAAGATCCACACGAAAA 正链引物序列
>IRF1_4-R 负链引物名称
GGAAAGTGGGGTCCTTCGG 负链引物序列
2.循环读取每个引物,每个引物与其他所有引物组成配对,计算引物之间形成双链所需的吉布斯自由能(ΔG kcal/mol),计算公式如下:ΔG=ΔH-TΔS,如引物之间的吉布斯自由能大于-5.0,则存在引物二聚体的可能性较低,如小于-5.0则存在引物二聚体的可能性较大。将此结果记录在引物二聚体检测结果文件中,如引物AMPL000727与引物rs4885963之间存在的二聚体可能性情况如下所示:
输入内容 内容说明
AMPL000727-F versus rs4885963-R 可能存在二聚体引物对的名称
dG=-6.68 吉布斯自由能数值
5'-GGATTGAGGGCCAGGTCATG-3' 引物序列
x|xxx||||||||||xxx| “|”表示互补配对,“X”表示不互补配对
3'-ATCTATCCCGGTCCACACCA-5 引物序列
步骤八、在全外显子多重PCR引物设计中,因需要覆盖全部外显子区域,会存在overlap(扩增片段相互叠加)的情况,读取上步骤中得到的候选引物,运行以pooler软件为基础的overlap检测。
进一步的,步骤八包含以下步骤:
1、运用步骤六所用算法,将找到每个引物对比对到参考基因组上的位置;
2、循环读取每个引物对在参考基因组上的位置信息,与其他引物对的位置信息进行比较,判断是否存在区域相互叠加的现象。判断结果记录在如下格式文件中:
Overlapping amplicons:
EGFR-001_2-F:EGFR-001_2-R(chr7:56375642+56375763)/EGFR-001_1-F:E GFR-001_1-R(56375577+56375696)
EGFR-002_2-F:EGFR-002_2-R(chr7:56378410+56378520)/EGFR-002_1-F:E GFR-002_1-R(56378355+56378462)
EGFR-002_3-F:EGFR-002_3-R(chr7:56378468+56378584)/EGFR-002_2-F:E GFR-002_2-R(56378410+56378520)
EGFR-002_4-F:EGFR-002_4-R(chr7:56378502+56378622)/EGFR-002_3-F:E GFR-002_3-R(56378468+56378584)
EGFR-002_5-F:EGFR-002_5-R(chr7:56378551+56378662)/EGFR-002_3-F:E GFR-002_4-R(56378502+56378622)
EGFR-002_6-F:EGFR-002_6-R(chr7:56378613+56378726)/EGFR-002_5-F:E GFR-002_5-R(56378551+56378662)
EGFR-002_7-F:EGFR-002_7-R(chr7:56378668+56378789)/EGFR-002_6-F:E GFR-002_6-R(56378613+56378726)
EGFR-002_8-F:EGFR-002_8-R(chr7:56378726+56378838)/EGFR-002_7-F:E GFR-002_7-R(56378668+56378789)
8 overlaps found
步骤九、读取候选引物序列,根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息。自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中,避免同一反应体系中,引物二聚体和引物扩增区域相互叠加的情况。
步骤十、判断分组数量是否大于步骤二中定义的最大分pool数量,如不大于,则将最终的引物信息写入到最终的结果文件中;如大于,则自动返回步骤五,从候选引物文件中读取其余的符合步骤二中参数的其他引物,重复步骤五到步骤十步骤。最终获取实验所需设计引物或仍有部分引物因设计区域复杂度过低或设置参数不合理而缺失,则需要重新定义参数后重新运行程序。
具体地,实施例一:
步骤一、输入类型包括目标基因名称MEN1,获取MEN1基因全外显子在参考基因组上的坐标;输入如下内容:
query type
MEN1 Gene Exon Only
运行目标区域获取程序,得到10段目标区域,结果如下:
chr11 64570982 64572293 MEN1-001
chr11 64572500 64572675 MEN1-002
chr11 64573101 64573247 MEN1-003
chr11 64573698 64573845 MEN1-004
chr11 64574477 64574575 MEN1-005
chr11 64574645 64574696 MEN1-006
chr11 64575018 64575157 MEN1-007
chr11 64575357 64575576 MEN1-008
chr11 64577116 64578218 MEN1-009
chr11 64578280 64578771 MEN1-010
步骤二、自定义引物设计参数:设定引物返回数量为20,引物长度最小为18,引物长度最大长度为27,引物GC含量最低值为20%,引物GC含量最高值为80%,最小Tm(引物溶解温度)值为58℃,最大Tm值为61℃,最大连续相同碱基数量为4,最小扩增片段长度默认为100,最大扩增片段长度为275。最大分pool数量默认为2。
步骤三、根据自定义的扩增片段大小范围为100-275,运行目标区域分割程序,将10个目标区域分割共成37较小的目标区域,部分分割结果如下;
chr11 64570944 64571122 MEN1-001_1
chr11 64571066 64571245 MEN1-001_2
chr11 64571174 64571334 MEN1-001_3
chr11 64571283 64571459 MEN1-001_4
chr11 64571403 64571572 MEN1-001_5
chr11 64571520 64571695 MEN1-001_6
chr11 64571635 64571820 MEN1-001_7
chr11 64571735 64571920 MEN1-001_8
chr11 64571854 64572027 MEN1-001_9
chr11 64571977 64572157 MEN1-001_10
chr11 64572098 64572283 MEN1-001_11
chr11 64572164 64572325 MEN1-001_12
chr11 64572459 64572622 MEN1-002_1
chr11 64572527 64572708 MEN1-002_2
chr11 64573064 64573246 MEN1-003_1
chr11 64573101 64573286 MEN1-003_2
chr11 64573656 64573838 MEN1-004_1
chr11 64573777 64573955 MEN1-004_2
chr11 64574434 64574604 MEN1-005_1
chr11 64574584 64574756 MEN1-006_1
步骤四、将分割好的目标区域比对到人类参考基因组(hg19)上,获取到目标区域的DNA序列,文件的格式为fasta;
步骤五、读取步骤五中的目标区域DNA序列,调用primer3软件设计引物,获得满足自定义参数条件的所有候选引物,每个设计区域共返回20对候选引物,保存到候选引物结果文件,作为输入引物进行后续筛选步骤;
步骤六、以步骤五所获得每个设计区域的20对候选引物为输入文件,循环每个设计区域,在循环读取每个设计区域的20对候选引物,调用blast软件,使用启发式搜索来找出人类参考基因组上与候选引物对相识度最高的序列,如只有唯一对应的序列,则引物特异,如有两个以上的对应序列,则引物非特异。筛选得到特异性扩增的候选引物,如无特异性引物,则返回上一步骤,返回另外20对的候选引物;
步骤六进一步包括以下步骤:
1、移除引物序列中之低复杂度以及有串接重复现象的区域,将引物序列中每k个字的组合做成一个表,列出我们所关心的所有可能之字组,将这些经筛选后剩下的高分字组组织成快速搜索树的结构。
2、对每个引物序列中的字组重复步骤1,并得到所有相应的高分字组、扫描数据库中的序列,看看是否有跟剩下的高分字组完全匹配的情形、将这些完全匹配的地方扩展为高分序对。
3、将所有分数够高的高分序对列出来、评估这些留下来的高分序对它们的分数是否具有意义、将一个数据库序列中的多个高分序对区域结合成一个更长的排比;
4、显示引物序列和所有之前找到可能相关的数据库序列之有间隙区域排比、列出上一步骤中期望分数E低于我们所要求的门槛值之数据库序列,最终得到与引物最为相关的参考序列相关区域;
5、判断得到的参考序列相关区域是否唯一,如唯一则特异,否则为非特异。
步骤七、根据步骤六筛选结果,读取筛选得到的特异性扩增的候选引物,共得到37对特异性引物,调用pooler软件,检查引物二聚体筛情况,将引物二聚体情况记录在二聚体检测结果文件中。
进一步的,步骤七包括以下步骤:
1.读取输入候选的37对引物序列,部分输入序列如下:
>MEN1-001_2-F
TGTCACCCACTCCTAACCCT
>MEN1-001_2-R
TCTGGGACACAAAACTCCGC
>MEN1-001_4-F
TCTGGAGCAGGACTGAAGTT
>MEN1-001_4-R
GCTCCTCCCAGCTTGTAGGA
>MEN1-001_6-F
GGCTGGGCCTTTAAAGACTG
>MEN1-001_6-R
CAAACCCTAGGTTCCCGGTC
>MEN1-001_8-F
CATGGGCTCAGAGTTGGGG
>MEN1-001_8-R
CGCCATCAAGCTGCAACTC
2.循环读取每个引物,每个引物与其他所有引物组成配对,计算引物之间形成双链所需的吉布斯自由能(ΔG kcal/mol),计算公式如下:ΔG=ΔH-TΔS,如引物之间的吉布斯自由能大于-5.0,则存在引物二聚体的可能性较低,如小于-5.0则存在引物二聚体的可能性较大。检测结果显示有两对引物之间存在引物二聚体情况。将此结果记录在引物二聚体检测结果文件中,MEN1-005_1-R引物与MEN1-006_1-F引物之间可能存在引物二聚体情况,结果如下:
MEN1-005_1-R versus MEN1-006_1-F
dG=-12.9
5'-CTGGGTGGCAGCCTGAATTA-3'
||||||||||||||||||||
3'-GACCCACCGTCGGACTTAAT-5'
步骤八、在全外显子多重PCR引物设计中,因需要覆盖全部外显子区域,会存在overlap(扩增片段相互叠加)的情况,读取上步骤中得到的候选引物,运行以pooler软件为基础的overlap检测
进一步的,步骤八包含以下步骤:
1.运用步骤六所用算法,将找到每个引物对比对到参考基因组上的位置;
2.循环读取每个引物对在参考基因组上的位置信息,与其他引物对的位置信息进行比较,判断是否存在区域相互叠加的现象。检查结果发现存在14对引物之间存在overlap情况。
步骤九、读取候选引物序列,根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息。自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中,运行结果显示分组数为2。
步骤十、引物分组数量为2,自定义最大分组数量为2,判断分组数量符合自定义最大分组数量。最终获取MEN1基因全外显子所需引物。部分最终引物结果显示如下,第一列为引物名称,第二列为正向引物序列,第三列为反向引物序列,第四列为引物扩增片段长度,第五列为染色体号,第六列为扩增子开始位置,第七列为***片段开始位置,第八列为***片段结束位置,第九列为扩增子结束位置,第十列为分组名称,结果文件如下:
Figure BDA0002130502320000171
为实现上述目的,如图3所示,本发明还提供一种处理PCR引物的***,所述的***包括:
第一获取单元,用于获取待处理目标引物数据信息;
第二获取单元,用于根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
分割划分单元,用于对目标引物区域进行分割划分;
第三获取单元,用于根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
处理单元,用于根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
生成单元,用于将候选引物分装到不同的分组中,并生成PCR引物设计报告。
进一步地,所述的***还包括:
第一获取模块,用于获取引物设计参数信息、引物分组信息、引物序列和引物属性。
本发明还提出一种处理PCR引物的平台,如图4所示,包括:
处理器、存储器以及处理PCR引物平台控制程序;
其中在所述的处理器执行所述处理PCR引物平台控制程序,所述处理PCR引物平台控制程序被存储在所述存储器中,所述处理PCR引物平台控制程序,实现所述的处理PCR引物的方法步骤,例如:
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告。
步骤具体细节已在上文阐述,此处不再赘述;
本发明实施例中,所述的处理PCR引物的平台内置处理器,可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器利用各种接口和线路连接取各个部件,通过运行或执行存储在存储器内的程序或者单元,以及调用存储在存储器内的数据,以执行处理PCR引物的各种功能和处理数据;
存储器用于存储程序代码和各种数据,安装在处理PCR引物的平台中,并在运行过程中实现高速、自动地完成程序或数据的存取。
所述存储器包括只读存储器(Read-Only Memory,ROM),随机存储器(RandomAccess Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
本发明还提出一种计算机可读取存储介质,如图5所示,所述计算机可读取存储介质存储有处理PCR引物平台控制程序,所述处理PCR引物平台控制程序,实现所述的处理PCR引物的方法步骤,例如,
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告。
步骤具体细节已在上文阐述,此处不再赘述;
在本发明的实施方式的描述中,需要说明的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理模块的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读取介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。
另外,计算机可读取介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
通过本发明的方法步骤、***、平台及存储介质,可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计,可以大大缩短此类引物的设计时间,而且还可以实现目标区域的全覆盖。
也就是说,相比于目前多数的引物设计方法,该发明可以自动根据基因名称,转录本名称,rs号,以及其他热点区域,自动获取目标区域,无须手动在数据库网站查询相应的设计区域;
将整个引物设计的流程自动化运行,中间无须人工干预,只需要输入基因名称,转录本名称等,就可全自动输出特异性、高扩增效率多重PCR引物,而且可以将引物自动分组,避免overlap情况的发生。可以大大的节约引物设计的时间,避免人工干预产生的错误,提高引物设计的质量和效率,而且做到如基因全外显子、转变本等目标区域的全覆盖。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种处理PCR引物的方法,其特征在于,所述的方法具体包括如下步骤:
获取待处理目标引物数据信息;
根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
对目标引物区域进行分割划分;
根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
将候选引物分装到不同的分组中,并生成PCR引物设计报告;
以所获得候选引物为输入文件,循环读取每对引物,运行以blast软件为基础,使用启发式搜索来找出参考基因组上与候选引物对相关的序列,如只有唯一对应的序列,则引物特异,如有两个以上的对应序列,则引物非特异;筛选得到特异性扩增的候选引物,如无特异性引物,则返回筛选候选引物,返回另外一组设定数量的候选引物;
根据候选引物筛选结果,读取筛选得到的特异性扩增的候选引物,运行以pooler软件为基础的引物二聚体检测程序,得到引物之间可能存在的二聚体情况;
在全外显子多重PCR引物设计中,因需要覆盖全部外显子区域,会存在overlap的情况,读取得到的候选引物,运行以pooler软件为基础的overlap检测;
读取候选引物序列,根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息;自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中,避免同一反应体系中,引物二聚体和引物扩增区域相互叠加的情况;
判断分组数量是否大于自定义参数的最大分pool数量,如不大于,则将最终的引物信息写入到最终的结果文件中;如大于,则自动返回筛选候选引物,从候选引物文件中读取其余的符合自定义参数的其他引物,最终获取实验所需设计引物或仍有部分引物因设计区域复杂度过低或设置参数不合理而缺失,则需要重新定义参数后重新运行程序。
2.根据权利要求1所述的一种处理PCR引物的方法,其特征在于,所述的目标引物数据信息具体包括:
目标基因名称、NCBI数据库snp位点的rs号、转录本号和热点区域。
3.根据权利要求1所述的一种处理PCR引物的方法,其特征在于,所述的对目标引物区域进行分割划分,具体为:
根据自定义的扩增片段长度范围,将较长目标区域分割成较小的目标引物区域。
4.根据权利要求1所述的一种处理PCR引物的方法,其特征在于,所述的自定义参数,具体包括:
扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量和最大退火温度差异。
5.根据权利要求1所述的一种处理PCR引物的方法,其特征在于,于步骤将候选引物分装到不同的分组中,并生成PCR引物设计报告之中,还包括步骤:
获取引物设计参数信息、引物分组信息、引物序列和引物属性。
6.一种处理PCR引物的***,其特征在于,所述的***具体包括:
第一获取单元,用于获取待处理目标引物数据信息;
第二获取单元,用于根据待处理目标引物数据信息,获取目标引物区域在参考基因组上的坐标数据;
分割划分单元,用于对目标引物区域进行分割划分;
第三获取单元,用于根据分割划分完成的标引物区域和参考基因组,获取目标引物区域的DNA序列;
处理单元,用于根据目标引物区域的DNA序列和自定义参数,处理得到候选引物;
生成单元,用于将候选引物分装到不同的分组中,并生成PCR引物设计报告;以所获得候选引物为输入文件,循环读取每对引物,运行以blast软件为基础,使用启发式搜索来找出参考基因组上与候选引物对相关的序列,如只有唯一对应的序列,则引物特异,如有两个以上的对应序列,则引物非特异;筛选得到特异性扩增的候选引物,如无特异性引物,则返回筛选候选引物,返回另外一组设定数量的候选引物;
根据候选引物筛选结果,读取筛选得到的特异性扩增的候选引物,运行以pooler软件为基础的引物二聚体检测程序,得到引物之间可能存在的二聚体情况;
在全外显子多重PCR引物设计中,因需要覆盖全部外显子区域,会存在overlap的情况,读取得到的候选引物,运行以pooler软件为基础的overlap检测;
读取候选引物序列,根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息;自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中,避免同一反应体系中,引物二聚体和引物扩增区域相互叠加的情况;
判断分组数量是否大于自定义参数的最大分pool数量,如不大于,则将最终的引物信息写入到最终的结果文件中;如大于,则自动返回筛选候选引物,从候选引物文件中读取其余的符合自定义参数的其他引物,最终获取实验所需设计引物或仍有部分引物因设计区域复杂度过低或设置参数不合理而缺失,则需要重新定义参数后重新运行程序。
7.根据权利要求6所述的一种处理PCR引物的***,其特征在于,所述的***还包括:
第一获取模块,用于获取引物设计参数信息、引物分组信息、引物序列和引物属性。
8.一种处理PCR引物的平台,其特征在于,包括:
处理器、存储器以及处理PCR引物平台控制程序;
其中在所述的处理器执行所述处理PCR引物平台控制程序,所述处理PCR引物平台控制程序被存储在所述存储器中,所述的处理PCR引物平台控制程序,实现如权利要求1至5中任一项所述的处理PCR引物的方法步骤。
9.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有处理PCR引物平台控制程序,所述处理PCR引物平台控制程序,实现如权利要求1至5中任一项所述的处理PCR引物的方法步骤。
CN201910636484.1A 2019-07-15 2019-07-15 一种处理pcr引物的方法、***、平台及存储介质 Active CN110491448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910636484.1A CN110491448B (zh) 2019-07-15 2019-07-15 一种处理pcr引物的方法、***、平台及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910636484.1A CN110491448B (zh) 2019-07-15 2019-07-15 一种处理pcr引物的方法、***、平台及存储介质

Publications (2)

Publication Number Publication Date
CN110491448A CN110491448A (zh) 2019-11-22
CN110491448B true CN110491448B (zh) 2023-02-07

Family

ID=68547135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910636484.1A Active CN110491448B (zh) 2019-07-15 2019-07-15 一种处理pcr引物的方法、***、平台及存储介质

Country Status (1)

Country Link
CN (1) CN110491448B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101899438A (zh) * 2010-04-16 2010-12-01 陕西北美基因股份有限公司 一种扩增人类egfr基因的多重pcr引物及其设计方法
CN102634507A (zh) * 2012-04-10 2012-08-15 凯晶生物科技(苏州)有限公司 多基因多区域的特异性捕获方法
WO2013134341A1 (en) * 2012-03-07 2013-09-12 Dow Agrosciences Llc Primer designing pipeline for targeted sequencing
CN103614472A (zh) * 2013-11-27 2014-03-05 扬州创日畜牧科技有限公司 一种检测猪基因组拷贝数变异的pcr试剂盒及检测方法
CN105718759A (zh) * 2016-02-17 2016-06-29 湖南圣维基因科技有限公司 一种基于Primer3的bPrimer批量PCR引物设计方法
CN106609296A (zh) * 2015-10-22 2017-05-03 北京泰格瑞分子检验有限公司 含反义碱基的探针法实时荧光pcr

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103547681B (zh) * 2011-08-01 2015-03-11 深圳华大基因科技有限公司 目标区域捕获方法及其生物信息处理方法和***
CN103642912B (zh) * 2013-11-29 2015-03-18 中国农业科学院作物科学研究所 基于转录组测序开发绿豆ssr引物的方法
WO2018036176A1 (zh) * 2016-08-26 2018-03-01 广州永诺生物科技有限公司 一种扩增brca1/2基因的多重pcr引物及一种多重pcr引物的设计方法
CN108034696B (zh) * 2018-02-02 2020-07-28 中南大学 一种基于转录组测序开发ssr引物的方法
CN109266744A (zh) * 2018-09-14 2019-01-25 广州奇辉生物科技有限公司 基于umi单分子标签降噪技术的靶向测序检测肺癌基因的多重pcr引物、试剂盒及方法
CN109658982B (zh) * 2018-12-25 2020-06-19 人和未来生物科技(长沙)有限公司 一种用于基因测序的引物设计方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101899438A (zh) * 2010-04-16 2010-12-01 陕西北美基因股份有限公司 一种扩增人类egfr基因的多重pcr引物及其设计方法
WO2013134341A1 (en) * 2012-03-07 2013-09-12 Dow Agrosciences Llc Primer designing pipeline for targeted sequencing
CN102634507A (zh) * 2012-04-10 2012-08-15 凯晶生物科技(苏州)有限公司 多基因多区域的特异性捕获方法
CN103614472A (zh) * 2013-11-27 2014-03-05 扬州创日畜牧科技有限公司 一种检测猪基因组拷贝数变异的pcr试剂盒及检测方法
CN106609296A (zh) * 2015-10-22 2017-05-03 北京泰格瑞分子检验有限公司 含反义碱基的探针法实时荧光pcr
CN105718759A (zh) * 2016-02-17 2016-06-29 湖南圣维基因科技有限公司 一种基于Primer3的bPrimer批量PCR引物设计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Enhanced simultaneous overlap extension-PCR by gold nanoparticles;WenchaoYangPhD等;《Nanomedicine: Nanotechnology, Biology and Medicine》;20171030;第13卷(第7期);2263-2266 *
Primer Spanner:一个高效的定点突变PCR引物设计在线工具;裴智勇等;《中国生物工程杂志》;20150921;第35卷(第10期);53-58 *
应用于靶向测序的多重PCR引物设计***;王亚恒;《中国优秀硕士学位论文全文数据库基础科学辑》;20190615;A006-61 *

Also Published As

Publication number Publication date
CN110491448A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
US11488688B2 (en) Methods and systems for detecting sequence variants
EP2718862B1 (en) Method for assembly of nucleic acid sequence data
Schwartz et al. Human–mouse alignments with BLASTZ
KR102446941B1 (ko) 서열 변이체 검출 방법 및 시스템
US20180276335A1 (en) Systems and methods for detecting structural variants
Cao et al. Accurate loop calling for 3D genomic data with cLoops
Yohe et al. Clinical validation of targeted next-generation sequencing for inherited disorders
CN107075571B (zh) 用于检测结构变异体的***和方法
KR20160068953A (ko) 질환-유도된 돌연변이를 확인하기 위한 방법 및 시스템
Kankainen et al. POBO, transcription factor binding site verification with bootstrapping
Volinia et al. GOAL: automated Gene Ontology analysis of expression profiles
Iida et al. MACON: a web tool for computing DNA methylation data obtained by the Illumina Infinium Human DNA methylation BeadArray
Hurgobin Short read alignment using SOAP2
US10573405B2 (en) Genome analysis and visualization using coverages for bin sizes and ranges of genomic base coordinates calculated and stored before an output request
EP3844760A1 (en) Genetic variant detection based on merged and unmerged reads
Coleman et al. Analysis of unannotated equine transcripts identified by mRNA sequencing
Zhang et al. GeneHub-GEPIS: digital expression profiling for normal and cancer tissues based on an integrated gene database
CN110491448B (zh) 一种处理pcr引物的方法、***、平台及存储介质
Coonrod et al. Next-generation sequencing of custom amplicons to improve coverage of HaloPlex multigene panels
Reverter et al. A rapid method for computationally inferring transcriptome coverage and microarray sensitivity
Wang et al. MetaProm: a neural network based meta-predictor for alternative human promoter prediction
Minnier et al. RNA-Seq and expression arrays: Selection guidelines for genome-wide expression profiling
Swiercz et al. GRASShopPER—An algorithm for de novo assembly based on GPU alignments
Levin et al. LEMONS–a tool for the identification of splice junctions in transcriptomes of organisms lacking reference genomes
Naderi et al. Analysis of long non-coding RNA expression in hemophilia A patients

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant