CN104182658A - 一种串联质谱谱图鉴定方法 - Google Patents

一种串联质谱谱图鉴定方法 Download PDF

Info

Publication number
CN104182658A
CN104182658A CN201410382707.3A CN201410382707A CN104182658A CN 104182658 A CN104182658 A CN 104182658A CN 201410382707 A CN201410382707 A CN 201410382707A CN 104182658 A CN104182658 A CN 104182658A
Authority
CN
China
Prior art keywords
spectrogram
quality
peptide section
search
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410382707.3A
Other languages
English (en)
Other versions
CN104182658B (zh
Inventor
何昆
曾文锋
付岩
迟浩
贺思敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201410382707.3A priority Critical patent/CN104182658B/zh
Publication of CN104182658A publication Critical patent/CN104182658A/zh
Application granted granted Critical
Publication of CN104182658B publication Critical patent/CN104182658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种串联质谱谱图鉴定方法,其特征在于,包括下列步骤:1)对于待鉴定谱图数据集中的每张谱图,分别在全局序列库中进行限制性搜索,获得各谱图的匹配肽段;2)根据步骤1)所得各谱图的匹配肽段,构建局部序列库,对于待鉴定谱图数据集的每张谱图,分别在所述局部序列库中进行开放式搜索,获得与一部分谱图相匹配的带修饰的肽段,并获得所带修饰的质量和误差区间;3)对于待鉴定谱图数据集中的每张谱图,根据步骤2)所匹配的修饰的质量和误差区间以及当前待鉴定谱图的质量,设定限制性搜索区间,并在全局序列库中进行搜索,获得最终的匹配结果。本发明能够提高串联质谱谱图鉴定的鉴定率和准确度,并且具有较高的搜索速度。

Description

一种串联质谱谱图鉴定方法
技术领域
本发明涉及生物信息学技术领域,具体地说,本发明涉及一种串联质谱谱图鉴定方法。
背景技术
串联质谱鉴定技术是蛋白质组学研究中的关键技术,也是大规模蛋白质序列和修饰鉴定的主要方法。序列库搜索是一种常规的串联质谱谱图鉴定方法。在进行通常的序列库搜索时,对每张谱图均划定一个以该谱图质量m为中心的质量区间,然后把该谱图与序列库中处于相应质量区间内的所有肽段(肽段也可称为肽段序列)进行匹配,得到肽-谱匹配打分,打分最好的肽段即作为这张谱图的鉴定结果。由于序列库包含待测序物种的所有已知肽段,如人类库的肽段数目的数量级大致为109,因此在常规的序列库搜索中,所划定的质量区间很狭窄,一般不超过1Da,例如[m-0.00002m,m+0.00002m],这样落在这个质量区间范围内的肽段数目相对较小,可以较为快速的完成串联质谱谱图的鉴定。然而,众所周知,蛋白质翻译后修饰会造成由蛋白质得到的肽段额外多加一个基团或者丢失一个基团。肽段加上修饰之后,会引起其质量的改变。因此,由带修饰的肽段生成的谱图的质量同肽段的原始质量之间存在一个质量差。这个质量差一般很大,甚至可以达到上百Da。因此,用带修饰的谱图(即由带修饰的肽段生成的谱图)去查询数据库中的肽段(数据库中的肽段都是不带修饰的原始形式),如果只开小窗口,如1Da,就无法把谱图鉴定出来。所以,上述串联质谱鉴定方法无法鉴定带有未知修饰的肽段,对于同批次蛋白质酶切样品所得的谱图数据集,其鉴定率(又称为解析率)较低,通常不到30%。
另一方面,现有技术中还存在一种开放式序列库搜索,为了提高鉴定率,它考虑到了串联质谱谱图可能带有未知修饰的情况,对于每个谱图使用较大的质量区间(即开放的窗口)在序列库中进行搜索。例如:预估修饰的质量范围为[-200Da,200Da],则质量为m的谱图需要同质量区间[m-200Da,m+200Da]之内的所有肽段进行肽-谱匹配。这种开放式序列库搜索理论上可以有效鉴定出串联质谱数据中的修饰谱图。然而,由于采用的质量区间相对较大,需要匹配的肽段数量十分巨大,假设落在区间[m-0.00002m,m+0.00002m]之内的肽段数为n,则落入区间[m-200Da,m+200Da]之内的肽段可能超过400n,这导致现有技术中的开放式序列库搜索计算量十分巨大,搜索速度大幅降低。另外,由于开放式序列库搜索的搜索空间过大,同每张谱图进行匹配打分的肽段数量急剧增加。在众多错误肽段的竞争下,正确的肽段很有可能无法获得最高的肽-谱匹配打分。因此,开放式序列库搜索对谱图鉴定准确度的提升很有限。
发明内容
因此,本发明的任务是提供一种既能提高鉴定率又能保持较高搜索速度的串联质谱谱图鉴定方法。
本发明提供了一种串联质谱谱图快速鉴定方法,其特征在于,包括下列步骤:
1)对于待鉴定谱图数据集中的每张谱图,分别在全局序列库中进行限制性搜索,获得各谱图的匹配肽段;
2)根据步骤1)所得各谱图的匹配肽段,构建局部序列库,对于待鉴定谱图数据集的每张谱图,分别在所述局部序列库中进行开放式搜索,获得与一部分谱图相匹配的带修饰的肽段,并获得所带修饰的质量和误差区间;
3)对于待鉴定谱图数据集中的每张谱图,根据步骤2)得到的修饰的质量和误差区间以及当前待鉴定谱图的质量,设定限制性搜索区间,并在全局序列库中进行搜索,获得最终的匹配结果。
其中,所述步骤1)中,所述全局序列库为包含待测序物种的全部蛋白质序列的序列库。
其中,所述步骤1)中,所述限制性搜索中,以待鉴定谱图的质量为中心,结合肽段的质量误差,确定肽段质量区间。
其中,所述步骤2)中,所述开放式搜索中,以待鉴定谱图的质量为中心,结合修饰所引起的肽段质量变化,确定肽段质量区间。
其中,所述步骤2)包括下列子步骤:
21)根据步骤1)所得各谱图的匹配肽段,构建局部序列库,对于待鉴定谱图数据集的每张谱图,分别在所述局部序列库中进行开放式搜索,鉴定出待鉴定谱图数据集中部分带有修饰的肽段;
22)对于步骤21)所获得的带有修饰的肽段,在已知的修饰数据库搜索与其匹配的修饰,抛弃无法获得匹配修饰的肽段;
23)对经过步骤22)处理的带有修饰的肽段,计算其所带修饰的质量和误差区间。
其中,所述步骤23)包括下列子步骤:
231)对经过步骤22)处理的带有修饰的肽段,根据修饰的数目选取其中的高丰度修饰,抛弃其它修饰;
232)计算高丰度修饰的质量和误差区间。
其中,所述步骤3)包括下列子步骤:
31)根据步骤2)得到的的高丰度修饰的质量和误差区间以及当前待鉴定谱图的质量,设定限制性搜索区间,并在全局序列库中进行搜索,获得匹配肽段;
32)利用基于SVM的算法对步骤31)所得的匹配肽段进行过滤,得到最终的匹配结果。
其中,所述步骤31)中,将当前待鉴定谱图的质量和高丰度修饰的质量之差设置为中心,再根据高丰度修饰的误差区间设置边界,从而获得所述限制性搜索区间。
其中,所述步骤1)、2)和3)中,在进行搜索时,根据肽-谱匹配打分获得匹配结果。
其中,所述肽-谱匹配打分采用KSDP打分、XCorr打分或者E-value打分。
与现有技术相比,本发明具有下列技术效果:
1、能够提高串联质谱谱图鉴定的鉴定率。
2、具有较高的搜索速度。
3、能够提高鉴定结果的准确度。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1示出了本发明一个实施例的串联质谱谱图鉴定方法的流程图。
具体实施方式
图1示出了本发明一个实施例的串联质谱谱图鉴定方法的流程图,该串联质谱谱图鉴定方法包括下列步骤:
步骤1:对待鉴定串联质谱谱图数据集,对其中每张串联质谱谱图(串联质谱谱图是质谱仪输出的信号,为便于描述,下文中简称为谱图),分别基于全局序列库在小质量窗口内进行搜索,鉴定出部分肽段。本步骤的搜索就是在全局序列库上的常规搜索(即非开放式搜索,又称为限制性搜索),其中小窗口是指以待鉴定谱图质量为中心的质量区间,且该质量区间较为狭窄。例如,待鉴定谱图质量为m,则相应的小窗口为[m-0.00002m,m+0.00002m],0.00002m通常小于1Da。本实施例中,全局序列库包含待鉴定谱图数据集所对应的待测序物种的所有已知肽段,通常地,全局序列库中的肽段数目巨大,如人类库中肽段数目的量级大致为109。本步骤中,谱图数据集是同一批次蛋白质样品酶切后经串联质谱测试所得的谱图数据集。
步骤2:用步骤1搜索出的肽段构造局部序列库,然后对待鉴定谱图数据集中的每张谱图,分别基于所构造的局部序列库进行开放式搜索,鉴定出部分带有修饰的肽段。如前文所述,开放式搜索是在一个大质量区间内的搜索。假如将修饰的质量范围设定为[-200Da,200Da],则开放式搜索的质量区间为[m-200Da,m+200Da],其中m为待鉴定谱图的质量。
在一个实施例中,所述步骤2包括下列子步骤:
步骤21:基于步骤1的搜索结果,解析出待鉴定谱图数据集中每个谱图所匹配到的肽段和肽-谱匹配打分,如KSDP打分(参考文献Fu,Y.,et al.,Exploiting the kernel trick to correlate fragment ions for peptide identification via tandem mass spectrometry.Bioinformatics,2004.20(12):p.1948.)、XCorr打分(参考文献Eng,J.K.,A.L.McCormack,andJ.R.Yates Iii,An approach to correlate tandem mass spectral data of peptides with amino acid sequences ina protein database.Journal of the American Society for Mass Spectrometry,1994.5(11):p.976-989.)或者E-value打分(参考文献Fenyo,D.and R.C.Beavis,A method for assessing the statisticalsignificance of mass spectrometry-based protein identifications using general scoring schemes.AnalyticalChemistry,2003.75(4):p.768-774.),把所有的匹配肽段按打分由高到低排序。如果匹配肽段数多于20000,则进一步取前20000名匹配对应的肽段。
步骤22:利用步骤21得到的肽段构造一个局部序列库。
步骤23:酶切步骤22得到的局部数据库,开±200Da的大窗口进行开放式搜索,鉴定出待鉴定谱图数据集中部分带有修饰的肽段。
在一个谱图数据集中,往往同时存在着某条肽段的非修饰形式和修饰形式。步骤1中通过通常的序列库搜索,可以鉴定到部分非修饰肽段。而步骤2中,利用这部分非修饰的肽段,可以进一步找到这些肽段对应的修饰形式,从而发现谱图数据集中的高丰度修饰。高丰度修饰是指在谱图数据集中,带有该类修饰的谱图数目较多(如多于30张)的修饰。
步骤3:对第2步的搜索结果进行重排序,把谱图对应的更可信的鉴定结果排在前面。
在一个实施例中,所述步骤3包括下列子步骤:
步骤31:在Unimod数据库中查询每个修饰谱图所带的修饰。Unimod数据库是一种修饰数据库,它汇总了在之前的研究中已经被发现过的修饰。如果某个谱图所匹配的肽段所带的修饰不存在于Unimod数据库中,则意味着这个修饰以前没有被人发现过,此时判定该匹配肽段不太可信,并去掉该匹配肽段。
步骤32:把一张谱图对应的多个匹配肽段按肽-谱匹配打分由高到低排序。如果该谱图存在若干相同的匹配打分,则把这些匹配肽段随机排序。
步骤4:基于第3步的重排序的结果,解析待鉴定谱图数据集中的高丰度修饰。解析高丰度修饰后,能够获得该高丰度修饰的质量均值和质量误差窗口,以作为后续步骤的依据。如前文所述,高丰度修饰是指在谱图数据集中,带有该类修饰的谱图数目较多(如多于30张)的修饰。
在一个实施例中,所述步骤4包括下列子步骤:
步骤41:依据每个匹配的谱图质量和肽段质量之差(以后简写为deltaMass)和肽-谱匹配打分等信息,去掉那些不可信的匹配结果。
步骤42:把所有匹配按照deltaMass进行聚类。
步骤43:将每一类中全部匹配的打分相加,作为这一类的总匹配打分。把所有的类按照各自总匹配打分由高到低进行排序,取总匹配打分最大的前20个类。
步骤44:为步骤43中确定的每一个类,计算deltaMass的均值和误差窗口大小。每一个类的deltaMass的均值作为一个高丰度修饰的质量均值,相应的误差窗口作为该高丰度修饰的质量误差窗口。
步骤5:依据所发现的高丰度修饰的质量和质量误差窗口,对于每个待鉴定谱图,在全局序列库中,根据谱图质量和高丰度修饰的质量以及质量误差窗口进行搜索。本步骤中,搜索质量窗口的大小与高丰度修饰的质量误差窗口一致,远小于现有的开放式搜索,所以搜索速度较高。
在一个实施例中,所述步骤5包括下列子步骤:
步骤51:利用第4步搜索得到的deltaMass的均值和误差窗口,计算谱图对应的误差窗口。若第4步中得到了三个类,其deltaMass的均值和误差窗口大小分别为(0.1Da,±0.015Da)、(15.99Da,±0.010Da)和(43.00Da,±0.010Da),对于一张质量为m的谱图,其需要和质量区间[m-0.085Da,m-0.115Da]、[m-15.98Da,m-16Da]和区间[m-42.99Da,m-43.01Da]之内的所有肽段进行匹配。
步骤52:将目标数据库中的蛋白反转,构造目标诱饵库。本步骤的目标诱饵库将用于后续步骤7中SVM的训练。在步骤7中,会利用来自于目标库蛋白的匹配构造正样本,用来自于诱饵库蛋白的匹配构造负样本,以进行SVM的训练。
步骤53:为每一张谱图开多个小窗口,在全局序列库内进行开放式搜索。
步骤6:对步骤5的搜索结果进行重排序,把谱图对应的更可信的鉴定结果排在前面。本步骤通过查询Unimod数据库,利用关于修饰的先验知识,对步骤5的搜索结果进行修正,从而提高鉴定准确度。
在一个实施例中,所述步骤6包括下列子步骤:
步骤61:在Unimod数据库中查询每个修饰谱图所带的修饰。如果某个谱图所匹配的肽段所带的修饰不存在于Unimod数据库中,则意味着这个修饰以前没有被人发现过,此时判定该匹配肽段不太可信,并去掉该匹配肽段。
步骤62:把一张谱图对应的多个匹配肽段按肽-谱匹配打分由高到低排序。如果该谱图存在若干相同的匹配打分,则把这些匹配肽段随机排序。
步骤7:利用基于SVM的机器学习方法,对步骤6的搜索结果进行过滤,得到最终的谱图鉴定结果。SVM全称为Support Vector Machine,译名为支持向量机。通过利用SVM进行分类,本步骤能够区分开正确的匹配和错误的匹配,从而去除不太可信的鉴定结果,仅保留高可信的鉴定结果。需要说明的是,基于SVM对匹配肽段进行过滤得到最终的匹配结果是本领域的常用技术之一,下文中结合本发明的一个实施例,示例性地介绍了一种基于SVM的匹配肽段过滤流程。
在一个实施例中,所述步骤7包括下列子步骤:
步骤71:把所有的匹配肽段按匹配打分由高到低排序,按照FDR小于等于1%的条件进行过滤,将得到的来自目标库的肽谱匹配作为正样本。将来自诱饵库的随机匹配结果作为负样本。
步骤72:从正负样本的肽谱匹配提取肽谱匹配特征,包括肽段长度、匹配谱峰占谱图谱峰总数的比例、匹配谱峰占理论谱峰的比例,谱图电荷数等特征。
步骤73:从所有的正样本中提取各个意外修饰的统计信息,包括修饰的质量和带该类修饰的正样本占全部正样本的比例,将此比例作为一个特征。
步骤74:将提取特征的方法应用到所有的样本中(所有样本包括已通过过滤的来自于目标库的匹配、未通过过滤的来自于目标库的匹配和来自于诱饵库的匹配)。
步骤75:将以上提取的特征值设置好,使用线性SVM算法对正负样本进行分类训练。
步骤76:将SVM训练得到的参数应用到全部样本中,得到每个样本的新打分svm_score。
步骤77:利用svm_score重新排序,按照FDR小于等于1%过滤,重新得到正样本、负样本,并重复执行步骤72到步骤76,得到新的svm_score。
步骤78:重复步骤77,直到得到的正样本数不再增加,把此时的svm_score作为最终的打分,即svm_final_score。
步骤79:把所有的匹配按svm_final_score排序,并按照指定的FDR阈值过滤。通过过滤的来自于目标库的匹配即为指定FDR阈值下可信的鉴定结果。
综上所述,本发明能够有效地鉴定串联谱图中的修饰谱图,从而提升串联质谱谱图的鉴定率。并且,相对于现有的基于全局序列库的开放式搜索,本发明能够在高精度的小质量区间内进行搜索,大大减少了需要搜索的肽段数目,计算量较小,搜索速度显著提高,在许多数据集上,本发明的速度提升高达10倍以上。另一方面,由于本发明大大减少了需要搜索的肽段数目,有利于降低错误肽段被匹配(即错误肽段对同谱图的匹配效果比正确肽段的匹配效果还要好)的概率,这样正确的肽段更容易脱颖而出,从而提升搜索准确度(即搜索精度),在许多数据集上,本发明的精度提升超过20%。
最后应说明的是,以上实施例仅用以描述本发明的技术方案而不是对本技术方法进行限制,本发明在应用上可以延伸为其它的修改、变化、应用和实施例,并且因此认为所有这样的修改、变化、应用、实施例都在本发明的精神和教导范围内。

Claims (10)

1.一种串联质谱谱图鉴定方法,其特征在于,包括下列步骤:
1)对于待鉴定谱图数据集中的每张谱图,分别在全局序列库中进行限制性搜索,获得各谱图的匹配肽段;
2)根据步骤1)所得各谱图的匹配肽段,构建局部序列库,对于待鉴定谱图数据集的每张谱图,分别在所述局部序列库中进行开放式搜索,获得与一部分谱图相匹配的带修饰的肽段,并获得所带修饰的质量和误差区间;
3)对于待鉴定谱图数据集中的每张谱图,根据步骤2)所匹配的修饰的质量和误差区间以及当前待鉴定谱图的质量,设定限制性搜索区间,并在全局序列库中进行搜索,获得最终的匹配结果。
2.根据权利要求1所述的串联质谱谱图鉴定方法,其特征在于,所述步骤1)中,所述全局序列库为包含待测序物种的全部蛋白质序列的序列库。
3.根据权利要求1所述的串联质谱谱图鉴定方法,其特征在于,所述步骤1)中,所述限制性搜索中,以待鉴定谱图的质量为中心,结合肽段的质量误差,确定肽段质量区间。
4.根据权利要求3所述的串联质谱谱图鉴定方法,其特征在于,所述步骤2)中,所述开放式搜索中,以待鉴定谱图的质量为中心,结合修饰所引起的肽段质量变化,确定肽段质量区间。
5.根据权利要求4所述的串联质谱谱图鉴定方法,其特征在于,所述步骤2)包括下列子步骤:
21)根据步骤1)所得各谱图的匹配肽段,构建局部序列库,对于待鉴定谱图数据集的每张谱图,分别在所述局部序列库中进行开放式搜索,鉴定出待鉴定谱图数据集中部分带有修饰的肽段;
22)对于步骤21)所获得的带有修饰的肽段,在已知的修饰数据库搜索与其匹配的修饰,抛弃无法获得匹配修饰的肽段;
23)对经过步骤22)处理的带有修饰的肽段,计算其所带修饰的质量和误差区间。
6.根据权利要求5所述的串联质谱谱图鉴定方法,其特征在于,所述步骤23)包括下列子步骤:
231)对经过步骤22)处理的带有修饰的肽段,根据修饰的数目选取其中的高丰度修饰,抛弃其它修饰;
232)计算高丰度修饰的质量和误差区间。
7.根据权利要求6所述的串联质谱谱图鉴定方法,其特征在于,所述步骤3)包括下列子步骤:
31)根据步骤2)得到的的高丰度修饰的质量和误差区间以及当前待鉴定谱图的质量,设定限制性搜索区间,并在全局序列库中进行搜索,获得匹配肽段;
32)基于SVM算法对步骤31)所得的匹配肽段进行过滤,得到最终的匹配结果。
8.根据权利要求7所述的串联质谱谱图鉴定方法,其特征在于,所述步骤31)中,将当前待鉴定谱图的质量和高丰度修饰的质量之差为中心,再根据高丰度修饰的误差区间设置边界,从而获得所述限制性搜索区间。
9.根据权利要求1所述的串联质谱谱图鉴定方法,其特征在于,所述步骤1)、2)和3)中,在进行搜索时,根据肽-谱匹配打分获得匹配结果。
10.根据权利要求9所述的串联质谱谱图鉴定方法,其特征在于,所述肽-谱匹配打分采用KSDP打分、XCorr打分或者E-value打分。
CN201410382707.3A 2014-08-06 2014-08-06 一种串联质谱谱图鉴定方法 Active CN104182658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410382707.3A CN104182658B (zh) 2014-08-06 2014-08-06 一种串联质谱谱图鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410382707.3A CN104182658B (zh) 2014-08-06 2014-08-06 一种串联质谱谱图鉴定方法

Publications (2)

Publication Number Publication Date
CN104182658A true CN104182658A (zh) 2014-12-03
CN104182658B CN104182658B (zh) 2017-05-03

Family

ID=51963693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410382707.3A Active CN104182658B (zh) 2014-08-06 2014-08-06 一种串联质谱谱图鉴定方法

Country Status (1)

Country Link
CN (1) CN104182658B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033501A (zh) * 2015-03-16 2016-10-19 中国科学院计算技术研究所 一种交联二肽快速鉴定方法
CN106198706A (zh) * 2016-06-29 2016-12-07 中国科学院计算技术研究所 一种对多肽交联肽段进行质谱鉴定的假发现率控制方法
CN106248844A (zh) * 2016-10-25 2016-12-21 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及***
CN106529204A (zh) * 2016-10-18 2017-03-22 中国科学院计算技术研究所 一种基于半监督学习的交联质谱多谱排序方法
CN107622184A (zh) * 2017-09-29 2018-01-23 中国科学院计算技术研究所 氨基酸可信度和修饰位点定位的评估方法
CN110349621A (zh) * 2019-06-04 2019-10-18 中国科学院计算技术研究所 肽段-谱图匹配可信度检验方法、***、存储介质及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5538897A (en) * 1994-03-14 1996-07-23 University Of Washington Use of mass spectrometry fragmentation patterns of peptides to identify amino acid sequences in databases
CN101477089A (zh) * 2009-01-09 2009-07-08 中国科学院计算技术研究所 一种蛋白质翻译后修饰的发现方法
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
CN102140496A (zh) * 2010-01-29 2011-08-03 赵英明 真核细胞中高化学计量的非遗传性突变的鉴定方法
CN103678950A (zh) * 2012-08-30 2014-03-26 中国科学院计算技术研究所 一种开放式蛋白质鉴定的分布式加速方法及其***
CN103810200A (zh) * 2012-11-12 2014-05-21 中国科学院计算技术研究所 开放式蛋白质鉴定的数据库搜索方法及其***
CN103852513A (zh) * 2012-11-29 2014-06-11 中国科学院计算技术研究所 一种基于hcd与etd质谱图的肽段从头测序方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5538897A (en) * 1994-03-14 1996-07-23 University Of Washington Use of mass spectrometry fragmentation patterns of peptides to identify amino acid sequences in databases
CN101477089A (zh) * 2009-01-09 2009-07-08 中国科学院计算技术研究所 一种蛋白质翻译后修饰的发现方法
CN102140496A (zh) * 2010-01-29 2011-08-03 赵英明 真核细胞中高化学计量的非遗传性突变的鉴定方法
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
CN103678950A (zh) * 2012-08-30 2014-03-26 中国科学院计算技术研究所 一种开放式蛋白质鉴定的分布式加速方法及其***
CN103810200A (zh) * 2012-11-12 2014-05-21 中国科学院计算技术研究所 开放式蛋白质鉴定的数据库搜索方法及其***
CN103852513A (zh) * 2012-11-29 2014-06-11 中国科学院计算技术研究所 一种基于hcd与etd质谱图的肽段从头测序方法及***

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033501A (zh) * 2015-03-16 2016-10-19 中国科学院计算技术研究所 一种交联二肽快速鉴定方法
CN106198706A (zh) * 2016-06-29 2016-12-07 中国科学院计算技术研究所 一种对多肽交联肽段进行质谱鉴定的假发现率控制方法
CN106198706B (zh) * 2016-06-29 2019-02-01 中国科学院计算技术研究所 一种对多肽交联肽段进行质谱鉴定的假发现率控制方法
CN106529204A (zh) * 2016-10-18 2017-03-22 中国科学院计算技术研究所 一种基于半监督学习的交联质谱多谱排序方法
CN106529204B (zh) * 2016-10-18 2019-05-07 中国科学院计算技术研究所 一种基于半监督学习的交联质谱多谱排序方法
CN106248844A (zh) * 2016-10-25 2016-12-21 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及***
CN107622184A (zh) * 2017-09-29 2018-01-23 中国科学院计算技术研究所 氨基酸可信度和修饰位点定位的评估方法
CN107622184B (zh) * 2017-09-29 2020-01-21 中国科学院计算技术研究所 氨基酸可信度和修饰位点定位的评估方法
CN110349621A (zh) * 2019-06-04 2019-10-18 中国科学院计算技术研究所 肽段-谱图匹配可信度检验方法、***、存储介质及装置
CN110349621B (zh) * 2019-06-04 2021-08-27 中国科学院计算技术研究所 肽段-谱图匹配可信度检验方法、***、存储介质及装置

Also Published As

Publication number Publication date
CN104182658B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN104182658A (zh) 一种串联质谱谱图鉴定方法
CN101871945B (zh) 一种利用质谱图库鉴定蛋白质及其修饰的方法
CN110838340B (zh) 一种不依赖数据库搜索的蛋白质生物标志物鉴定方法
EP1766394B1 (en) System and method for grouping precursor and fragment ions using selected ion chromatograms
CN107328842B (zh) 基于质谱谱图的无标蛋白质定量方法
CN104076115B (zh) 基于峰强度识别能力的蛋白质二级质谱鉴定方法
CN103852513B (zh) 一种基于hcd与etd质谱图的肽段从头测序方法及***
CN103810200B (zh) 开放式蛋白质鉴定的数据库搜索方法及其***
CN103245714B (zh) 基于候选肽段区分度标记图谱的蛋白质二级质谱鉴定方法
CN105334279A (zh) 一种高分辨质谱数据的处理方法
CN105574474A (zh) 一种基于质谱信息的生物特征图像识别方法
CN104034792A (zh) 基于质荷比误差识别能力的蛋白质二级质谱鉴定方法
CN104215729B (zh) 串联质谱数据母离子检测模型训练方法及母离子检测方法
JP2014112068A (ja) 質量分析におけるピーク検出方法及びそのシステム
CN106033501B (zh) 一种交联二肽快速鉴定方法
CN105823883A (zh) 基于泊松分布模型的蛋白质二级质谱鉴定方法
Zou et al. Charge state determination of peptide tandem mass spectra using support vector machine (SVM)
KR101311412B1 (ko) 당 동정을 위한 새로운 생물정보처리 분석 방법
CN109100461B (zh) 一种利用蛋白组学技术区分有机大米和非有机大米的方法
Cooper et al. An assessment of AcquireX and Compound Discoverer software 3.3 for non-targeted metabolomics
GB2575168A (en) Precursor selection for data-dependent tandem mass spectrometry
JP5983371B2 (ja) ペプチド構造解析方法及び装置
CN112464804A (zh) 一种基于神经网络框架的肽段信号匹配方法
CN102809600A (zh) 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法
Victor et al. MAZIE: A mass and charge inference engine to enhance database searching of tandem mass spectra

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant