CN110491448B

CN110491448B - 一种处理pcr引物的方法、***、平台及存储介质

Info

Publication number: CN110491448B
Application number: CN201910636484.1A
Authority: CN
Inventors: 朱奇; 曾晓杰; 廖传荣
Original assignee: Guangzhou Genephar Biotechnology Co ltd
Current assignee: Guangzhou Genephar Biotechnology Co ltd
Priority date: 2019-07-15
Filing date: 2019-07-15
Publication date: 2023-02-07
Anticipated expiration: 2039-07-15
Also published as: CN110491448A

Abstract

本发明涉及生物技术领域，具体涉及一种处理PCR引物的方法、***、平台及存储介质。获取待处理目标引物数据信息；根据待处理目标引物数据信息，获取目标引物区域在参考基因组上的坐标数据；对目标引物区域进行分割划分；根据分割划分完成的标引物区域和参考基因组，获取目标引物区域的DNA序列；根据目标引物区域的DNA序列和自定义参数，处理得到候选引物；将候选引物分装到不同的分组中，并生成PCR引物设计报告。可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计，可以大大缩短此类引物的设计时间，而且还可以实现目标区域的全覆盖。

Description

一种处理PCR引物的方法、***、平台及存储介质

技术领域

本发明涉及生物技术领域，具体涉及一种处理PCR引物的方法、***、平台及存储介质。

背景技术

聚合酶链式反应简称PCR(Polymerase Chain Reaction)(又称：多聚酶链式反应)PCR是体外酶促合成特异DNA片段的一种方法，由高温变性、低温退火(复性)及适温延伸等反应组成一个周期，循环进行，使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。它不仅可用于基因分离、克隆和核酸序列分析等基础研究,还可用于疾病的诊断或任何有DNA，RNA的地方。而多重PCR(multiplex PCR)，又称多重引物PCR或复合PCR，它是在同一PCR反应体系里加上二对以上引物，同时扩增出多个核酸片段的PCR反应，其反应原理，反应试剂和操作过程与一般PCR相同，多重PCR技术是高通量基因测序技术中捕获特定感兴趣区域的DNA片段进行测序的重要技术手段。

目前多数的PCR应用都以某些基因或某些热点区域为研究的对象，而基因中生物学意义最为重要的部分是基因的外显子区域。而目前的PCR设计方法中，大多需要手动查询公共数据库网站获取目标基因的外显子片段序列或热点目标区域序列，然后利用引物设计软件进行手动的设计，最后还需要用手动的方法检查引物的特异性和是否存在引物二聚体等情况。这些步骤比较繁琐，费时费力。

发明内容

针对以上骤比较繁琐，费时费力的技术问题，本发明提供一种处理PCR引物的方法、***、平台及存储介质，可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计，可以大大缩短此类引物的设计时间，而且还可以实现目标区域的全覆盖。

一种处理PCR引物的方法，所述的方法具体包括如下步骤：

获取待处理目标引物数据信息；

根据待处理目标引物数据信息，获取目标引物区域在参考基因组上的坐标数据；

对目标引物区域进行分割划分；

根据分割划分完成的标引物区域和参考基因组，获取目标引物区域的DNA序列；

根据目标引物区域的DNA序列和自定义参数，处理得到候选引物；

将候选引物分装到不同的分组中，并生成PCR引物设计报告。

进一步地，所述的目标引物数据信息具体包括：

目标基因名称、NCBI数据库snp位点的rs号、转录本号和热点区域。

进一步地，所述的对目标引物区域进行分割划分，具体为：

根据自定义的扩增片段长度范围，将较长目标区域分割成较小的目标引物区域。

进一步地，所述的自定义参数，具体包括：

扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量和最大退火温度差异。

进一步地，于步骤将候选引物分装到不同的分组中，并生成PCR引物设计报告之中，还包括步骤：

获取引物设计参数信息、引物分组信息、引物序列和引物属性。

为实现上述目的，本发明还提供一种处理PCR引物的***，所述的***具体包括：

第一获取单元，用于获取待处理目标引物数据信息；

第二获取单元，用于根据待处理目标引物数据信息，获取目标引物区域在参考基因组上的坐标数据；

分割划分单元，用于对目标引物区域进行分割划分；

第三获取单元，用于根据分割划分完成的标引物区域和参考基因组，获取目标引物区域的DNA序列；

处理单元，用于根据目标引物区域的DNA序列和自定义参数，处理得到候选引物；

生成单元，用于将候选引物分装到不同的分组中，并生成PCR引物设计报告。

进一步地，所述的***还包括：

第一获取模块，用于获取引物设计参数信息、引物分组信息、引物序列和引物属性。

为实现上述目的，本发明还提供一种处理PCR引物的平台，包括：

处理器、存储器以及处理PCR引物平台控制程序；

其中在所述的处理器执行所述处理PCR引物平台控制程序，所述处理PCR引物平台控制程序被存储在所述存储器中，所述的处理PCR引物平台控制程序，实现所述的处理PCR引物的方法步骤。

为实现上述目的，本发明还提供一种计算机可读取存储介质，所述计算机可读取存储介质存储有处理PCR引物平台控制程序，所述处理PCR引物平台控制程序，实现所述的处理PCR引物的方法步骤。

与现有技术相比，本发明具有以下有益效果：

本发明通过一种处理PCR引物的方法，

获取待处理目标引物数据信息；

对目标引物区域进行分割划分；

将候选引物分装到不同的分组中，并生成PCR引物设计报告。

及相应地***单元和模块：

第一获取单元，用于获取待处理目标引物数据信息；

分割划分单元，用于对目标引物区域进行分割划分；

生成单元，用于将候选引物分装到不同的分组中，并生成PCR引物设计报告。进一步地，所述的***还包括：

及相应地平台及存储介质；

可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计，可以大大缩短此类引物的设计时间，而且还可以实现目标区域的全覆盖。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种处理PCR引物的方法架构流程示意图；

图2为本发明一种处理PCR引物的方法架构优选实施例示意图；

图3为本发明一种处理PCR引物的***架构示意图；；

图4为本发明一种处理PCR引物的平台架构示意图；

图5为本发明一种实施例中计算机可读取存储介质架构示意图；

本发明目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为便于更好的理解本发明的目的、技术方案和优点更加清楚，下面结合附图和具体的实施方式对本发明作进一步说明，本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。

本发明亦可通过其它不同的具体实例加以施行或应用，本说明书中的各项细节亦可基于不同观点与应用，在不背离本发明的精神下进行各种修饰与变更。

需要说明，若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，若本发明实施例中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。其次，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时，应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

优选地，本发明一种处理PCR引物的方法应用在一个或者多个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

本发明为实现一种处理PCR引物的方法、***、平台及存储介质。

如图1所示，是本发明实施例提供的处理PCR引物的方法的流程图。

在本实施例中，所述处理PCR引物的方法，可以应用于具备显示功能的终端或者固定终端中，所述终端并不限定于个人电脑、智能手机、平板电脑、安装有摄像头的台式机或一体机等。

所述处理PCR引物的方法也可以应用于由终端和通过网络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于：广域网、城域网或局域网。本发明实施例的处理PCR引物的方法可以由服务器来执行，也可以由终端来执行，还可以是由服务器和终端共同执行。

例如，对于需要进行处理PCR引物的终端，可以直接在终端上集成本发明的方法所提供的处理PCR引物的功能，或者安装用于实现本发明的方法的客户端。再如，本发明所提供的方法还可以软件开发工具包(Software Development Kit，SDK)的形式运行在服务器等设备上，以SDK的形式提供处理PCR引物的功能的接口，终端或其他设备通过所提供的接口即可实现处理PCR引物的功能。

如图1所示，本发明提供了一种处理PCR引物的方法，所述方法具体包括如下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

获取待处理目标引物数据信息；

对目标引物区域进行分割划分；

将候选引物分装到不同的分组中，并生成PCR引物设计报告。

具体地，所述的目标引物数据信息具体包括：

所述的对目标引物区域进行分割划分，具体为：

所述的自定义参数，具体包括：

在本发明实施例中，于步骤将候选引物分装到不同的分组中，并生成PCR引物设计报告之中，还包括步骤：

也就是说，如附图2所示，为实现基因全外显子、snp位点或其他热点区域的全自动引物设计，本发明包含以下模块即方法步骤：

步骤一，输入设计引物的目标，输入类型包括目标基因名称、NCBI数据库snp位点的rs号、转录本号、热点区域，运行getTar.py程序，获取目标区域在参考基因组上的坐标；

具体地，输入文件的格式如下表所示，可以多类型，包括通过基因名称(如EGFR)获取外显子区域(Exon)或蛋白编码区域(CDS)、通过转录本号(如NM_005228)获取外显子目标区域和蛋白编码目标区域(CDS)、通过基因组坐标(chr:123456-123457)获取引物设计目标区域以及通过rs号(如rs13035)获取引物设计目标区域批量自动获取目标区域在参考基因组上的位置：

query	type
		rs13035	snp
chr:123456-123457	Coordinate
		EGFR	Gene Exon Only
BRAF	Gene CDS Only
		NM_005228	Transcript CDS only
NM_005228	Transcript Exon only

步骤二，根据自定义的扩增片段长度范围，分割将较长目标区域分割成较小的目标区域；

也就是说，自定义引物设计参数。设定返回的引物数量，范围为1-999999；设定引物长度，设定范围为15-40；设定引物GC含量，设定范围为15％-85％；设定引物溶解温度，设定范围为50-70℃；设定最大连续相同碱基数量，设定范围为3-6；，设定扩增片段长度，设定范围为60-400。设定最大分pool数量，设定范围为1-5。本发明实例中可以根据实际实验要求，自定义以上各种参数。

步骤三，将分割好的目标区域对应到人类参考基因组上，获取到目标区域的DNA序列；

步骤四，将扩增片段长度范围、引物长度范围、引物GC含量范围、引物退火温度范围、返回引物数量、最大退火温度差异等自定义参数写在一个文档文件中，以该文件以及步骤三中获取的DNA序列作为输入参数，运行primer软件，获得满足自定义参数条件的候选引物；

步骤五，以步骤四所获得候选引物为输入文件，运行以blast软件为基础的引物特异性检测，筛选得到特异性扩增的候选引物；

步骤六，读取筛选得到的特异性扩增的候选引物，运行以pooler软件为基础的引物二聚体筛选得到无引物二聚体的候选引物；在全外显子多重PCR引物设计中，因需要覆盖全部外显子区域，会存在overlap(扩增片段相互叠加)的情况，读取上步骤中得到的候选引物，运行以pooler软件为基础的overlap检测，如果存在overlap情况，则自动将候选引物分装到不同的分组中，避免多重PCR引物overlap情况的发生。

步骤七，读取引物设计参数信息、引物分组信息、引物序列、引物属性，整合输出到一份文档文件中，即得到最终的多重PCR引物设计结果。

换言之，在本发明实施例中，为实现基因全外显子、snp位点或其他热点区域的全自动引物设计，本发明包含以下模块：

步骤一、输入设计引物的目标，输入类型包括目标基因名称、NCBI数据库snp/rs号、转录本号、热点区域，运行getTar.py程序，获取目标区域在参考基因组上的坐标；输入文件的格式如下表所示，可以多类型，包括通过基因名称(如EGFR)获取外显子区域(Exon)或蛋白编码区域(CDS)、通过转录本号(如NM_005228)获取外显子目标区域和蛋白编码目标区域(CDS)、通过基因组坐标(chr:123456-123457)获取引物设计目标区域以及通过rs号(如rs13035)获取引物设计目标区域批量自动获取目标区域在参考基因组上的位置：

步骤二、自定义引物设计参数。设定返回的引物数量，范围为1-999999；设定引物长度，设定范围为15-40；设定引物GC含量，设定范围为15％-85％；设定引物溶解温度，设定范围为50-70℃；设定最大连续相同碱基数量，设定范围为3-6；，设定扩增片段长度，设定范围为60-400。设定最大分pool数量，设定范围为1-5。本发明可以根据实际实验要求，自定义以上各种参数。

步骤三、目标区域分割，根据自定义的扩增片段长度范围，运行目标区域分割程序，分割将较长目标区域分割成较小的目标区域，例如设定的扩增片段长度范围为80-200，而目标区域长度为2000，将被自动分割成10个以上的较小的目标区域；

步骤四、将分割好的目标区域对应到人类参考基因组(hg19)上，获取到目标区域的DNA序列，文件的格式为fasta；

步骤五、运行primer3软件，获得满足自定义参数条件的所有候选引物，每个区域返回设定数量的引物保存到候选引物结果文件；

步骤六、以步骤五所获得候选引物为输入文件，循环读取每对引物，运行以blast软件为基础，使用启发式搜索来找出参考基因组上与候选引物对相关的序列，如只有唯一对应的序列，则引物特异，如有两个以上的对应序列，则引物非特异。筛选得到特异性扩增的候选引物，如无特异性引物，则返回上一步骤，返回另外一组设定数量的候选引物；

较佳地，步骤六进一步包括以下步骤：

1、移除引物序列中之低复杂度以及有串接重复现象的区域，将引物序列中每k个字的组合做成一个表，列出我们所关心的所有可能之字组，将这些经筛选后剩下的高分字组组织成快速搜索树的结构。

2、对每个引物序列中的字组重复步骤1，并得到所有相应的高分字组、扫描数据库中的序列，看看是否有跟剩下的高分字组完全匹配的情形、将这些完全匹配的地方扩展为高分序对。

3、将所有分数够高的高分序对列出来、评估这些留下来的高分序对它们的分数是否具有意义、将一个数据库序列中的多个高分序对区域结合成一个更长的排比；

4、显示引物序列和所有之前找到可能相关的数据库序列之有间隙区域排比、列出上一步骤中期望分数E低于我们所要求的门槛值之数据库序列，最终得到与引物最为相关的参考序列相关区域；

5、判断得到的参考序列相关区域是否唯一，如唯一则特异，否则为非特异。

步骤七、根据步骤五筛选结果，读取筛选得到的特异性扩增的候选引物，运行以pooler软件为基础的引物二聚体检测程序，得到引物之间可能存在的二聚体情况；

进一步的，步骤七包括以下步骤：

1.读取输入候选引物序列，序列输入格式如下：

输入内容	内容说明
		>IRF1_4-F	正链引物名称
TGGCAAGATCCACACGAAAA	正链引物序列
		>IRF1_4-R	负链引物名称
GGAAAGTGGGGTCCTTCGG	负链引物序列

2.循环读取每个引物，每个引物与其他所有引物组成配对，计算引物之间形成双链所需的吉布斯自由能(ΔG kcal/mol)，计算公式如下：ΔG＝ΔH－TΔS，如引物之间的吉布斯自由能大于-5.0，则存在引物二聚体的可能性较低，如小于-5.0则存在引物二聚体的可能性较大。将此结果记录在引物二聚体检测结果文件中，如引物AMPL000727与引物rs4885963之间存在的二聚体可能性情况如下所示：

输入内容	内容说明
		AMPL000727-F versus rs4885963-R	可能存在二聚体引物对的名称
dG＝-6.68	吉布斯自由能数值
		5'-GGATTGAGGGCCAGGTCATG-3'	引物序列
x\|xxx\|\|\|\|\|\|\|\|\|\|xxx\|	“\|”表示互补配对，“X”表示不互补配对
		3'-ATCTATCCCGGTCCACACCA-5	引物序列

步骤八、在全外显子多重PCR引物设计中，因需要覆盖全部外显子区域，会存在overlap(扩增片段相互叠加)的情况，读取上步骤中得到的候选引物，运行以pooler软件为基础的overlap检测。

进一步的，步骤八包含以下步骤：

1、运用步骤六所用算法，将找到每个引物对比对到参考基因组上的位置；

2、循环读取每个引物对在参考基因组上的位置信息，与其他引物对的位置信息进行比较，判断是否存在区域相互叠加的现象。判断结果记录在如下格式文件中：

Overlapping amplicons:

EGFR-001_2-F:EGFR-001_2-R(chr7:56375642+56375763)/EGFR-001_1-F:E GFR-001_1-R(56375577+56375696)

EGFR-002_2-F:EGFR-002_2-R(chr7:56378410+56378520)/EGFR-002_1-F:E GFR-002_1-R(56378355+56378462)

EGFR-002_3-F:EGFR-002_3-R(chr7:56378468+56378584)/EGFR-002_2-F:E GFR-002_2-R(56378410+56378520)

EGFR-002_4-F:EGFR-002_4-R(chr7:56378502+56378622)/EGFR-002_3-F:E GFR-002_3-R(56378468+56378584)

EGFR-002_5-F:EGFR-002_5-R(chr7:56378551+56378662)/EGFR-002_3-F:E GFR-002_4-R(56378502+56378622)

EGFR-002_6-F:EGFR-002_6-R(chr7:56378613+56378726)/EGFR-002_5-F:E GFR-002_5-R(56378551+56378662)

EGFR-002_7-F:EGFR-002_7-R(chr7:56378668+56378789)/EGFR-002_6-F:E GFR-002_6-R(56378613+56378726)

EGFR-002_8-F:EGFR-002_8-R(chr7:56378726+56378838)/EGFR-002_7-F:E GFR-002_7-R(56378668+56378789)

8 overlaps found

步骤九、读取候选引物序列，根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息。自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中，避免同一反应体系中，引物二聚体和引物扩增区域相互叠加的情况。

步骤十、判断分组数量是否大于步骤二中定义的最大分pool数量，如不大于，则将最终的引物信息写入到最终的结果文件中；如大于，则自动返回步骤五，从候选引物文件中读取其余的符合步骤二中参数的其他引物，重复步骤五到步骤十步骤。最终获取实验所需设计引物或仍有部分引物因设计区域复杂度过低或设置参数不合理而缺失，则需要重新定义参数后重新运行程序。

具体地，实施例一：

步骤一、输入类型包括目标基因名称MEN1,获取MEN1基因全外显子在参考基因组上的坐标；输入如下内容：

query	type
		MEN1	Gene Exon Only

运行目标区域获取程序，得到10段目标区域，结果如下：

chr11	64570982	64572293	MEN1-001
				chr11	64572500	64572675	MEN1-002
chr11	64573101	64573247	MEN1-003
				chr11	64573698	64573845	MEN1-004
chr11	64574477	64574575	MEN1-005
				chr11	64574645	64574696	MEN1-006
chr11	64575018	64575157	MEN1-007
				chr11	64575357	64575576	MEN1-008
chr11	64577116	64578218	MEN1-009
				chr11	64578280	64578771	MEN1-010

步骤二、自定义引物设计参数：设定引物返回数量为20，引物长度最小为18，引物长度最大长度为27，引物GC含量最低值为20％，引物GC含量最高值为80％，最小Tm(引物溶解温度)值为58℃，最大Tm值为61℃，最大连续相同碱基数量为4，最小扩增片段长度默认为100，最大扩增片段长度为275。最大分pool数量默认为2。

步骤三、根据自定义的扩增片段大小范围为100-275，运行目标区域分割程序，将10个目标区域分割共成37较小的目标区域，部分分割结果如下；

chr11	64570944	64571122	MEN1-001_1
				chr11	64571066	64571245	MEN1-001_2
chr11	64571174	64571334	MEN1-001_3
				chr11	64571283	64571459	MEN1-001_4
chr11	64571403	64571572	MEN1-001_5
				chr11	64571520	64571695	MEN1-001_6
chr11	64571635	64571820	MEN1-001_7
				chr11	64571735	64571920	MEN1-001_8
chr11	64571854	64572027	MEN1-001_9
				chr11	64571977	64572157	MEN1-001_10
chr11	64572098	64572283	MEN1-001_11
				chr11	64572164	64572325	MEN1-001_12
chr11	64572459	64572622	MEN1-002_1
				chr11	64572527	64572708	MEN1-002_2
chr11	64573064	64573246	MEN1-003_1
				chr11	64573101	64573286	MEN1-003_2
chr11	64573656	64573838	MEN1-004_1
				chr11	64573777	64573955	MEN1-004_2
chr11	64574434	64574604	MEN1-005_1
				chr11	64574584	64574756	MEN1-006_1

步骤四、将分割好的目标区域比对到人类参考基因组(hg19)上，获取到目标区域的DNA序列，文件的格式为fasta；

步骤五、读取步骤五中的目标区域DNA序列，调用primer3软件设计引物，获得满足自定义参数条件的所有候选引物，每个设计区域共返回20对候选引物，保存到候选引物结果文件，作为输入引物进行后续筛选步骤；

步骤六、以步骤五所获得每个设计区域的20对候选引物为输入文件，循环每个设计区域，在循环读取每个设计区域的20对候选引物，调用blast软件，使用启发式搜索来找出人类参考基因组上与候选引物对相识度最高的序列，如只有唯一对应的序列，则引物特异，如有两个以上的对应序列，则引物非特异。筛选得到特异性扩增的候选引物，如无特异性引物，则返回上一步骤，返回另外20对的候选引物；

步骤六进一步包括以下步骤：

步骤七、根据步骤六筛选结果，读取筛选得到的特异性扩增的候选引物，共得到37对特异性引物，调用pooler软件，检查引物二聚体筛情况，将引物二聚体情况记录在二聚体检测结果文件中。

进一步的，步骤七包括以下步骤：

1.读取输入候选的37对引物序列，部分输入序列如下：

>MEN1-001_2-F

TGTCACCCACTCCTAACCCT

>MEN1-001_2-R

TCTGGGACACAAAACTCCGC

>MEN1-001_4-F

TCTGGAGCAGGACTGAAGTT

>MEN1-001_4-R

GCTCCTCCCAGCTTGTAGGA

>MEN1-001_6-F

GGCTGGGCCTTTAAAGACTG

>MEN1-001_6-R

CAAACCCTAGGTTCCCGGTC

>MEN1-001_8-F

CATGGGCTCAGAGTTGGGG

>MEN1-001_8-R

CGCCATCAAGCTGCAACTC

2.循环读取每个引物，每个引物与其他所有引物组成配对，计算引物之间形成双链所需的吉布斯自由能(ΔG kcal/mol)，计算公式如下：ΔG＝ΔH－TΔS，如引物之间的吉布斯自由能大于-5.0，则存在引物二聚体的可能性较低，如小于-5.0则存在引物二聚体的可能性较大。检测结果显示有两对引物之间存在引物二聚体情况。将此结果记录在引物二聚体检测结果文件中，MEN1-005_1-R引物与MEN1-006_1-F引物之间可能存在引物二聚体情况，结果如下：

MEN1-005_1-R versus MEN1-006_1-F

dG＝-12.9

5'-CTGGGTGGCAGCCTGAATTA-3'

||||||||||||||||||||

3'-GACCCACCGTCGGACTTAAT-5'

步骤八、在全外显子多重PCR引物设计中，因需要覆盖全部外显子区域，会存在overlap(扩增片段相互叠加)的情况，读取上步骤中得到的候选引物，运行以pooler软件为基础的overlap检测

进一步的，步骤八包含以下步骤：

1.运用步骤六所用算法，将找到每个引物对比对到参考基因组上的位置；

2.循环读取每个引物对在参考基因组上的位置信息，与其他引物对的位置信息进行比较，判断是否存在区域相互叠加的现象。检查结果发现存在14对引物之间存在overlap情况。

步骤九、读取候选引物序列，根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息。自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中，运行结果显示分组数为2。

步骤十、引物分组数量为2，自定义最大分组数量为2，判断分组数量符合自定义最大分组数量。最终获取MEN1基因全外显子所需引物。部分最终引物结果显示如下，第一列为引物名称，第二列为正向引物序列，第三列为反向引物序列,第四列为引物扩增片段长度，第五列为染色体号，第六列为扩增子开始位置，第七列为***片段开始位置，第八列为***片段结束位置，第九列为扩增子结束位置，第十列为分组名称，结果文件如下：

为实现上述目的，如图3所示，本发明还提供一种处理PCR引物的***，所述的***包括：

第一获取单元，用于获取待处理目标引物数据信息；

分割划分单元，用于对目标引物区域进行分割划分；

进一步地，所述的***还包括：

本发明还提出一种处理PCR引物的平台，如图4所示，包括：

处理器、存储器以及处理PCR引物平台控制程序；

其中在所述的处理器执行所述处理PCR引物平台控制程序，所述处理PCR引物平台控制程序被存储在所述存储器中，所述处理PCR引物平台控制程序，实现所述的处理PCR引物的方法步骤，例如：

获取待处理目标引物数据信息；

对目标引物区域进行分割划分；

将候选引物分装到不同的分组中，并生成PCR引物设计报告。

步骤具体细节已在上文阐述，此处不再赘述；

本发明实施例中，所述的处理PCR引物的平台内置处理器，可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器利用各种接口和线路连接取各个部件，通过运行或执行存储在存储器内的程序或者单元，以及调用存储在存储器内的数据，以执行处理PCR引物的各种功能和处理数据；

存储器用于存储程序代码和各种数据，安装在处理PCR引物的平台中，并在运行过程中实现高速、自动地完成程序或数据的存取。

所述存储器包括只读存储器(Read-Only Memory，ROM)，随机存储器(RandomAccess Memory，RAM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

本发明还提出一种计算机可读取存储介质，如图5所示，所述计算机可读取存储介质存储有处理PCR引物平台控制程序，所述处理PCR引物平台控制程序，实现所述的处理PCR引物的方法步骤，例如，

获取待处理目标引物数据信息；

对目标引物区域进行分割划分；

将候选引物分装到不同的分组中，并生成PCR引物设计报告。

步骤具体细节已在上文阐述，此处不再赘述；

在本发明的实施方式的描述中，需要说明的是，流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理模块的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，“计算机可读取介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。

另外，计算机可读取介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

通过本发明的方法步骤、***、平台及存储介质，可以实现基因全外显子、snp位点、转录本以及其他热点区域的多重PCR引物的全自动设计，可以大大缩短此类引物的设计时间，而且还可以实现目标区域的全覆盖。

也就是说，相比于目前多数的引物设计方法，该发明可以自动根据基因名称，转录本名称，rs号，以及其他热点区域，自动获取目标区域，无须手动在数据库网站查询相应的设计区域；

将整个引物设计的流程自动化运行，中间无须人工干预，只需要输入基因名称，转录本名称等，就可全自动输出特异性、高扩增效率多重PCR引物，而且可以将引物自动分组，避免overlap情况的发生。可以大大的节约引物设计的时间，避免人工干预产生的错误，提高引物设计的质量和效率，而且做到如基因全外显子、转变本等目标区域的全覆盖。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种处理PCR引物的方法，其特征在于，所述的方法具体包括如下步骤：

获取待处理目标引物数据信息；

对目标引物区域进行分割划分；

将候选引物分装到不同的分组中，并生成PCR引物设计报告；

以所获得候选引物为输入文件，循环读取每对引物，运行以blast软件为基础，使用启发式搜索来找出参考基因组上与候选引物对相关的序列，如只有唯一对应的序列，则引物特异，如有两个以上的对应序列，则引物非特异；筛选得到特异性扩增的候选引物，如无特异性引物，则返回筛选候选引物，返回另外一组设定数量的候选引物；

根据候选引物筛选结果，读取筛选得到的特异性扩增的候选引物，运行以pooler软件为基础的引物二聚体检测程序，得到引物之间可能存在的二聚体情况；

在全外显子多重PCR引物设计中，因需要覆盖全部外显子区域，会存在overlap的情况，读取得到的候选引物，运行以pooler软件为基础的overlap检测；

读取候选引物序列，根据引物ID获取引物关联的引物二聚体和引物扩增区域相互叠加的信息；自动将存在引物二聚体和引物扩增区域相互叠加的引物对分配到不同的分组中，避免同一反应体系中，引物二聚体和引物扩增区域相互叠加的情况；

判断分组数量是否大于自定义参数的最大分pool数量，如不大于，则将最终的引物信息写入到最终的结果文件中；如大于，则自动返回筛选候选引物，从候选引物文件中读取其余的符合自定义参数的其他引物，最终获取实验所需设计引物或仍有部分引物因设计区域复杂度过低或设置参数不合理而缺失，则需要重新定义参数后重新运行程序。

2.根据权利要求1所述的一种处理PCR引物的方法，其特征在于，所述的目标引物数据信息具体包括：

3.根据权利要求1所述的一种处理PCR引物的方法，其特征在于，所述的对目标引物区域进行分割划分，具体为：

4.根据权利要求1所述的一种处理PCR引物的方法，其特征在于，所述的自定义参数，具体包括：

5.根据权利要求1所述的一种处理PCR引物的方法，其特征在于，于步骤将候选引物分装到不同的分组中，并生成PCR引物设计报告之中，还包括步骤：

6.一种处理PCR引物的***，其特征在于，所述的***具体包括：

第一获取单元，用于获取待处理目标引物数据信息；

分割划分单元，用于对目标引物区域进行分割划分；

生成单元，用于将候选引物分装到不同的分组中，并生成PCR引物设计报告；以所获得候选引物为输入文件，循环读取每对引物，运行以blast软件为基础，使用启发式搜索来找出参考基因组上与候选引物对相关的序列，如只有唯一对应的序列，则引物特异，如有两个以上的对应序列，则引物非特异；筛选得到特异性扩增的候选引物，如无特异性引物，则返回筛选候选引物，返回另外一组设定数量的候选引物；

7.根据权利要求6所述的一种处理PCR引物的***，其特征在于，所述的***还包括：

8.一种处理PCR引物的平台，其特征在于，包括：

处理器、存储器以及处理PCR引物平台控制程序；

其中在所述的处理器执行所述处理PCR引物平台控制程序，所述处理PCR引物平台控制程序被存储在所述存储器中，所述的处理PCR引物平台控制程序，实现如权利要求1至5中任一项所述的处理PCR引物的方法步骤。

9.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质存储有处理PCR引物平台控制程序，所述处理PCR引物平台控制程序，实现如权利要求1至5中任一项所述的处理PCR引物的方法步骤。