CN107609352A - 一种蛋白质自相互作用的预测方法 - Google Patents

一种蛋白质自相互作用的预测方法 Download PDF

Info

Publication number
CN107609352A
CN107609352A CN201711062661.7A CN201711062661A CN107609352A CN 107609352 A CN107609352 A CN 107609352A CN 201711062661 A CN201711062661 A CN 201711062661A CN 107609352 A CN107609352 A CN 107609352A
Authority
CN
China
Prior art keywords
matrix
protein
interaction
self
pssm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711062661.7A
Other languages
English (en)
Other versions
CN107609352B (zh
Inventor
陈沾衡
尤著宏
李晓
蒋同海
王延斌
方昱斌
陈沾兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang Technical Institute of Physics and Chemistry of CAS
Original Assignee
Xinjiang Technical Institute of Physics and Chemistry of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang Technical Institute of Physics and Chemistry of CAS filed Critical Xinjiang Technical Institute of Physics and Chemistry of CAS
Priority to CN201711062661.7A priority Critical patent/CN107609352B/zh
Publication of CN107609352A publication Critical patent/CN107609352A/zh
Application granted granted Critical
Publication of CN107609352B publication Critical patent/CN107609352B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种蛋白质自相互作用的预测方法,该方法包括数据集的选择与建立,PSSM矩阵的生成,傅里叶描述子提取特征值,训练集和测试集的构建,分类器模型构建步骤完成,该方法是利用傅里叶描述子提取样本集的特征值,使计算机计算数据集的离散傅里叶变换所需的乘法次数大为减少,也节省了计算量;本发明能够利用随机投影的方法构建模型,大大提高了预测精度,能够得到比较好的预测效果;本发明方法计算代价低,功耗小;可以有效地预测蛋白质的自相互作用,预测效果可以达到93%以上。

Description

一种蛋白质自相互作用的预测方法
技术领域
本发明涉及机器学习和生物信息学领域,具体涉及一种蛋白质自相互作用的预测方法。
背景技术
本发明涉及机器学习和生物信息学领域,具体涉及一种蛋白质自相互作用的预测方法。蛋白质自身能否进行相互作用是一项具有挑战性的任务。近年来,许多研究都表明同质齐聚化在生物过程中发挥着重要的作用,例如,基因表达调控,信号传导、酶激活与免疫应答等。总之,蛋白质自相互作用对于细胞功能的调节是一项非常重要的因素。此外,蛋白质自相互作用有利于提高蛋白质的稳定性,并通过减少其表面积防止蛋白质变性。到目前为止,大多数预测蛋白质相互作用的计算方法对蛋白质自相互作用检测有一定的局限性。这些局限性在于,这些方法通常考虑蛋白质对之间的相关信息,如共表达、共定位和协同进化等。然而,这样的信息对于蛋白质自相互作用是不可用的。
发明内容
本发明的目的在于,提供一种蛋白质自相互作用的预测方法,该方法包括数据集的选择与建立,PSSM矩阵的生成,傅里叶描述子提取特征值,训练集和测试集的构建,分类器模型构建步骤完成,该方法是利用傅里叶描述子提取样本集的特征值,使计算机计算数据集的离散傅里叶变换所需的乘法次数大为减少,也节省了计算量;本发明能够利用随机投影的方法构建模型,大大提高了预测精度,能够得到比较好的预测效果;本发明方法计算代价低,功耗小;可以有效地预测蛋白质的自相互作用,预测效果可以达到93%以上。解决了预测蛋白质是否发生自相互作用的问题。
本发明所述的一种蛋白质自相互作用的预测方法,按下列步骤进行:
a、数据集的选择与建立:利用UniProt数据库中的human和yeast两个黄金标准数据集构建预测蛋白质自相互作用的数据集;
b、PSSM矩阵的生成:将每一个蛋白质序列的位置都表示为一个M×20的矩阵,其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,通过使用BLAST的位置特异性PSI-BLAST将每个蛋白质都转换成PSSM矩阵;
c、傅里叶描述子提取特征值:将步骤b中每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵,然后计算矩阵的傅里叶描述子,再计算傅里叶的逆描述子,最终每一个蛋白质提取出20×2个特征值;
d、训练集和测试集的构建:利用放回抽样方式对样本进行抽样,将human和yeast的阴阳数据集构造成均衡数据集,然后组成用于模型构建的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;
e、分类器模型构建:利用高维空间中的随机投影方式构建分类器的训练模型。
所述步骤a中UniProt数据库中的两个黄金标准数据集:human和yeast,其中human数据集由1441个阳性自相互作用蛋白质和15938个阴性非自相互作用蛋白质组成,yeast数据集由710阳性样本和5511个阴性样本组成;
所述步骤b中每一个蛋白质序列的位置都表示为一个M×20的矩阵L={Liji:1=1…M,j=1…20},其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,评分Lij表示第i个位置的第j个氨基酸.p(i,k)表示第k个氨基酸在第i个位置出现的频率,q(j,k)是第j和第k个氨基酸之间Dayhoff变异矩阵的值,为获得较高和广泛的同源序列,PSI-BLAST的e值参数设置为0.001并选择三次迭代方式。
所述步骤c中将每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵;然后计算矩阵的傅里叶描述子,公式为:
其中z(x)为一个复函数,x是PSSM矩阵封闭边界距离,L是封闭边界长度。
步骤d中利用放回抽样方式对样本进行抽样将human和yeast的阴阳数据集构造成均衡数据集,得到human数据集为31876×40,阴阳数据集分别为15938×40,yeast数据集为11022×40,阴阳数据集分别为5511×40。
为实现上述目的本发明采用的技术方案是:
a、数据集的选择与建立:利用UniProt数据库中的human和yeast两个黄金标准数据集构建预测蛋白质自相互作用的数据集;
b、PSSM矩阵的生成:将每一个蛋白质序列的位置都表示为一个M×20的矩阵,其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,通过使用BLAST的位置特异性PSI-BLAST将每个蛋白质都转换成PSSM矩阵;
c、傅里叶描述子提取特征值:将步骤b中每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵,然后计算矩阵的傅里叶描述子,再计算傅里叶的逆描述子,最终每一个蛋白质提取出20×2个特征值;
d、训练集和测试集的构建:利用放回抽样方式对样本进行抽样,将human和yeast的阴阳数据集构造成均衡数据集,然后组成用于模型构建的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;
e、分类器模型构建:利用高维空间中的随机投影方式构建分类器的训练模型。
所述步骤a中数据集的选择与建立:
数据集的选择与建立,UniProt数据库中的两个黄金标准数据集:human和yeast,其中human数据集由1441个阳性自相互作用蛋白质和15938个阴性非自相互作用蛋白质组成,yeast数据集由710阳性样本和5511个阴性样本组成;
所述步骤b中生成的PSSM矩阵:
每一个蛋白质序列的位置都可以表示为一个M×20的矩阵L={Liji:1=1…M,j=1…20},其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,评分Lij表示第i个位置的第j个氨基酸.p(i,k)表示第k个氨基酸在第i个位置出现的频率,q(j,k)是第j和第k个氨基酸之间Dayhoff变异矩阵的值,为获得较高和广泛的同源序列,PSI-BLAST的e值参数设置为0.001并选择三次迭代方式。
所述步骤c中傅里叶描述子提取特征值:
将每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵;
然后计算矩阵的傅里叶描述子,公式如下:
其中z(x)为一个复函数,x是PSSM矩阵封闭边界距离,L是封闭边界长度;
对所得的傅里叶描述子进行逆变换,最终每一个蛋白质可以提取出20×2个特征值;
所述步骤d中训练集和测试集的构建:
利用放回抽样方式对样本进行抽样将human和yeast的阴阳数据集构造成均衡数据集,可以得到human数据集为31876×40,阴阳数据集分别为15938×40,yeast数据集为11022×40,阴阳数据集分别为5511×40;
构建用于模型分类的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;
所述步骤e中分类器模型的构建:
设xi∈Rn为原始高维数据空间中的一组列向量,n为维度,降维就是将向量从高维Rn嵌入到一个低维空间Rq中,而且q<<n,输出结果也是在低维空间中的列向量;
其中q是接近Γ的内在维度;
为了利用随机投影降低Γ的维度,必须构建一个随机向量集其中ri∈Rq,构建方式有两种:(1)向量通常分布在q维的单位球面上,(2)向量的矢量符合伯努利+1/1分布并且将向量标准化为||ri||l2=1,i=1,…,n,然后生成一个q×n维的矩阵R,它的列由γ中的向量组成,得到的映射结果如下:
生成一个大小为n×N的矩阵G,而G是由Γ的列向量组成的;
G=(x1|x2…|xN)
构造k维随机矩阵大小为q×n,通过将G映射到上从而获得训练集Ti=Ri·Gi=1,…,k这些训练集被输入到基本分类器中,结果是一组分类器为了用分类器对一个新的集合u进行分类,首先u要映射到目标空间Rq,将u映射到随机矩阵上Ri
其中是映射结果,的分类结果通过li生成;
40维的数据被划分为10块互不重叠的部分.选择块大小为4进行投影,用留一法(leave-one-out)评估测试误差,利用K近邻法(KNN)作为基础分类器,其中k=seq(1,25,by=3),将训练样本数据集中的交互对先验概率作为投票参数。
本发明的有益效果是:
本发明提出一种蛋白质自相互作用的预测方法,该方法是利用傅里叶描述子提取样本集的特征值,使计算机计算数据集的离散傅里叶变换所需的乘法次数大为减少,也节省了计算量;本发明能够利用随机投影的方法构建模型,大大提高了预测精度,能够得到比较好的预测效果;本发明方法计算代价低,功耗小;可以有效地预测蛋白质的自相互作用,预测效果可以达到93%以上。
附图说明
图1为本发明实施例预测方法的流程图;
图2为本发明实施例预测结果ROC对比图,其中┅为支持向量机,━为随机投影。
具体实施方式
以下结合附图对本发明优选实施例做进一步说明:
如图1所示,一种蛋白质自相互作用的预测方法,包括如下步骤:
步骤101:数据集的选择与建立,利用UniProt数据库中的human和yeast两个黄金标准数据集构建预测蛋白质自相互作用的数据集;
步骤102:PSSM矩阵的生成,将每一个蛋白质序列的位置都可以表示为一个M×20的矩阵,其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,通过使用BLAST的位置特异性(PSI-BLAST)将每个蛋白质都转换成PSSM矩阵;
步骤103:傅里叶描述子提取特征值,首先将每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵,然后计算矩阵的傅里叶描述子,再计算傅里叶的逆描述子,最终每一个蛋白质可以提取出20×2个特征值;
步骤104:训练集和测试集的构建,利用放回抽样方式对样本进行抽样将human和yeast的阴阳数据集构造成均衡数据集,然后组成用于模型构建的数据集,以4:1的比例随机切割数据集得到训练集和测试集;
步骤105:分类器模型构建,利用高维空间中的随机投影方式构建分类器的训练模型。
所述步骤101中数据集的选择与建立:
数据集的选择与建立,UniProt数据库中的两个黄金标准数据集:human和yeast,其中human数据集由1441个阳性自相互作用蛋白质和15938个阴性非自相互作用蛋白质组成,yeast数据集由710阳性样本和5511个阴性样本组成;
所述步骤102中生成的PSSM矩阵:
每一个蛋白质序列的位置都可以表示为一个M×20的矩阵L={Liji:1=1…M,j=1…20},其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,评分Lij表示第i个位置的第j个氨基酸.p(i,k)表示第k个氨基酸在第i个位置出现的频率,q(j,k)是第j和第k个氨基酸之间Dayhoff变异矩阵的值,为获得较高和广泛的同源序列,PSI-BLAST的e值参数设置为0.001并选择三次迭代方式;
所述步骤103中傅里叶描述子提取特征值:
将每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵;
然后计算矩阵的傅里叶描述子,公式如下:
其中z(x)为一个复函数,x是PSSM矩阵封闭边界距离,L是封闭边界长度;
对所得的傅里叶描述子进行逆变换,最终每一个蛋白质可以提取出20×2个特征值;
所述步骤104中训练集和测试集的构建:
利用放回抽样方式对样本进行抽样将human和yeast的阴阳数据集构造成均衡数据集,可以得到human数据集为31876×40,阴阳数据集分别为15938×40,yeast数据集为11022×40,阴阳数据集分别为5511×40;
构建用于模型分类的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;
所述步骤105中分类器模型的构建:
设xi∈Rn为原始高维数据空间中的一组列向量,n为维度,降维就是将向量从高维Rn嵌入到一个低维空间Rq中,而且q<<n,输出结果也是在低维空间中的列向量;
其中q是接近Γ的内在维度;
为了利用随机投影降低Γ的维度,必须构建一个随机向量集其中ri∈Rq,构建方式有两种:(1)向量通常分布在q维的单位球面上,(2)向量的矢量符合伯努利+1/1分布并且将向量标准化为||ri||l2=1,i=1,…,n,然后生成一个q×n维的矩阵R,它的列由γ中的向量组成,得到的映射结果如下:
生成一个大小为n×N的矩阵G,而G是由Γ的列向量组成的;
G=(x1|x2…|xN)
构造k维随机矩阵大小为q×n,通过将G映射到上从而获得训练集Ti=Ri·G i=1,…,k这些训练集被输入到基本分类器中,结果是一组分类器为了用分类器li对一个新的集合u进行分类,首先u要映射到目标空间Rq,将u映射到随机矩阵上Ri
其中是映射结果,的分类结果通过li生成;
40维的数据被划分为10块互不重叠的部分.选择块大小为4进行投影,用留一法(leave-one-out)评估测试误差,利用K近邻法(KNN)作为基础分类器,其中k=seq(1,25,by=3),将训练样本数据集中的交互对先验概率作为投票参数,见表1,表2;
表1 yeasr数据集上随机投影和支持向量机结果对比
表2 human数据集上随机投影和支持向量机结果对比
从表中可以看出:为了能够更好的说明本发明预测方法的效果,将此预测方法与目前最流行的支持向量机方法对比,结合matlab和RGUI对算法进行实现,在yeast数据集上进行测试,本发明所获得的准确率、灵敏度、精度和Mathews相关系数都高于支持向量机的方法,在human数据集上进行测试,本发明所获得的准确率、灵敏度和Mathews相关系数都高于支持向量机的方法,精度虽然比支持向量机略低,但也十分接近;
如图2所示,为了能够更好的说明本发明预测方法的效果,将此预测方法与目前最流行的支持向量机方法对比,结合matlab和RGUI对算法进行实现,分别画出了yeast数据集上性能表现的ROC曲线图和human数据集上性能表现的ROC曲线图,本发明预测方法所获得的ROC曲线靠近左上角,最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数也是最少的。
最后应说明的是:以上所述仅为发明的优选实施例而已,并不用于限制发明,尽管参照前述实施例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在发明的保护范围之内。

Claims (5)

1.一种蛋白质自相互作用的预测方法,其特征在于,按下列步骤进行:
a、数据集的选择与建立:利用UniProt数据库中的human和yeast两个黄金标准数据集构建预测蛋白质自相互作用的数据集;
b、PSSM矩阵的生成:将每一个蛋白质序列的位置都表示为一个M×20的矩阵,其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,通过使用BLAST的位置特异性PSI-BLAST将每个蛋白质都转换成PSSM矩阵;
c、傅里叶描述子提取特征值:将步骤b中每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵,然后计算矩阵的傅里叶描述子,再计算傅里叶的逆描述子,最终每一个蛋白质提取出20×2个特征值;
d、训练集和测试集的构建:利用放回抽样方式对样本进行抽样,将human和yeast的阴阳数据集构造成均衡数据集,然后组成用于模型构建的数据集,以数量比4:1随机切割数据集得到训练集和测试集,然后进行5折交叉验证;
e、分类器模型构建:利用高维空间中的随机投影方式构建分类器的训练模型。
2.如权利要求1所述的一种蛋白质自相互作用的预测方法,其特征在于,所述步骤a中UniProt数据库中的两个黄金标准数据集:human和yeast,其中human数据集由1441个阳性自相互作用蛋白质和15938个阴性非自相互作用蛋白质组成,yeast数据集由710阳性样本和5511个阴性样本组成。
3.如权利要求1所述的一种蛋白质自相互作用的预测方法,其特征在于,所述步骤b中每一个蛋白质序列的位置都表示为一个M×20的矩阵L={Liji:1=1…M,j=1…20},其中M代表一种蛋白质残基的数目,矩阵的列代表了20种氨基酸,评分Lij表示第i个位置的第j个氨基酸.p(i,k)表示第k个氨基酸在第i个位置出现的频率,q(j,k)是第j和第k个氨基酸之间Dayhoff变异矩阵的值,为获得较高和广泛的同源序列,PSI-BLAST的e值参数设置为0.001并选择三次迭代方式。
4.如权利要求1所述的一种蛋白质自相互作用的预测方法,其特征在于,所述步骤c中将每一个蛋白质转换的PSSM转置矩阵与原PSSM矩阵进行相乘,这样每个蛋白质序列被转化为一个20×20的矩阵;然后计算矩阵的傅里叶描述子,公式为:
<mrow> <mi>F</mi> <mi>T</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>L</mi> </mfrac> <msubsup> <mo>&amp;Integral;</mo> <mn>0</mn> <mi>L</mi> </msubsup> <mi>z</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mrow> <mo>(</mo> <mn>2</mn> <mi>&amp;pi;</mi> <mo>/</mo> <mi>L</mi> <mo>)</mo> </mrow> <mi>n</mi> <mi>x</mi> </mrow> </msup> <mi>d</mi> <mi>x</mi> </mrow>
其中z(x)为一个复函数,x是PSSM矩阵封闭边界距离,L是封闭边界长度。
5.如权利要求1所述的一种蛋白质自相互作用的预测方法,其特征在于,所述步骤d中利用放回抽样方式对样本进行抽样将human和yeast的阴阳数据集构造成均衡数据集,得到human数据集为31876×40,阴阳数据集分别为15938×40,yeast数据集为11022×40,阴阳数据集分别为5511×40。
CN201711062661.7A 2017-11-02 2017-11-02 一种蛋白质自相互作用的预测方法 Expired - Fee Related CN107609352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711062661.7A CN107609352B (zh) 2017-11-02 2017-11-02 一种蛋白质自相互作用的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711062661.7A CN107609352B (zh) 2017-11-02 2017-11-02 一种蛋白质自相互作用的预测方法

Publications (2)

Publication Number Publication Date
CN107609352A true CN107609352A (zh) 2018-01-19
CN107609352B CN107609352B (zh) 2020-07-28

Family

ID=61084895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711062661.7A Expired - Fee Related CN107609352B (zh) 2017-11-02 2017-11-02 一种蛋白质自相互作用的预测方法

Country Status (1)

Country Link
CN (1) CN107609352B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763861A (zh) * 2018-04-16 2018-11-06 深圳大学 蛋白质间相互作用的预测方法、装置、终端及介质
CN109243527A (zh) * 2018-08-09 2019-01-18 中国人民解放军军事科学院军事医学研究院 一种酶切概率辅助的肽段可检测性预测方法
CN109767814A (zh) * 2019-01-17 2019-05-17 中国科学院新疆理化技术研究所 一种基于GloVe模型的氨基酸全局特征向量表示方法
CN110335640A (zh) * 2019-07-09 2019-10-15 河南师范大学 一种药物-DBPs结合位点的预测方法
CN111128295A (zh) * 2019-12-26 2020-05-08 杭州纽安津生物科技有限公司 一种预测多肽毒性的方法
CN111427101A (zh) * 2020-04-07 2020-07-17 江苏省气象科学研究所 雷雨大风分级预警方法、***、存储介质、计算机程序
CN112259157A (zh) * 2020-10-28 2021-01-22 杭州师范大学 一种蛋白质相互作用预测方法
CN115565607A (zh) * 2022-10-20 2023-01-03 抖音视界有限公司 确定蛋白质信息的方法、装置、可读介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006020126A2 (en) * 2004-07-14 2006-02-23 Protometrix, Inc. Method for providing protein microarrays
CN101231677A (zh) * 2007-11-30 2008-07-30 中国科学院合肥物质科学研究院 基于序列谱中心和遗传优化处理的残基间的远程相互作用预测方法
CN103955628A (zh) * 2014-04-22 2014-07-30 南京理工大学 基于子空间融合的蛋白质-维他命绑定位点预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006020126A2 (en) * 2004-07-14 2006-02-23 Protometrix, Inc. Method for providing protein microarrays
CN101231677A (zh) * 2007-11-30 2008-07-30 中国科学院合肥物质科学研究院 基于序列谱中心和遗传优化处理的残基间的远程相互作用预测方法
CN103955628A (zh) * 2014-04-22 2014-07-30 南京理工大学 基于子空间融合的蛋白质-维他命绑定位点预测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763861A (zh) * 2018-04-16 2018-11-06 深圳大学 蛋白质间相互作用的预测方法、装置、终端及介质
CN109243527A (zh) * 2018-08-09 2019-01-18 中国人民解放军军事科学院军事医学研究院 一种酶切概率辅助的肽段可检测性预测方法
CN109767814A (zh) * 2019-01-17 2019-05-17 中国科学院新疆理化技术研究所 一种基于GloVe模型的氨基酸全局特征向量表示方法
CN110335640A (zh) * 2019-07-09 2019-10-15 河南师范大学 一种药物-DBPs结合位点的预测方法
CN110335640B (zh) * 2019-07-09 2022-01-25 河南师范大学 一种药物-DBPs结合位点的预测方法
CN111128295A (zh) * 2019-12-26 2020-05-08 杭州纽安津生物科技有限公司 一种预测多肽毒性的方法
CN111427101A (zh) * 2020-04-07 2020-07-17 江苏省气象科学研究所 雷雨大风分级预警方法、***、存储介质、计算机程序
CN111427101B (zh) * 2020-04-07 2022-04-26 南京气象科技创新研究院 一种雷雨大风分级预警方法、***、存储介质
CN112259157A (zh) * 2020-10-28 2021-01-22 杭州师范大学 一种蛋白质相互作用预测方法
CN112259157B (zh) * 2020-10-28 2023-10-03 杭州师范大学 一种蛋白质相互作用预测方法
CN115565607A (zh) * 2022-10-20 2023-01-03 抖音视界有限公司 确定蛋白质信息的方法、装置、可读介质及电子设备
CN115565607B (zh) * 2022-10-20 2024-02-23 抖音视界有限公司 确定蛋白质信息的方法、装置、可读介质及电子设备

Also Published As

Publication number Publication date
CN107609352B (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN107609352B (zh) 一种蛋白质自相互作用的预测方法
Kang et al. Structured graph learning for clustering and semi-supervised classification
Chen et al. A comprehensive review and comparison of different computational methods for protein remote homology detection
Lin et al. Identifying sigma70 promoters with novel pseudo nucleotide composition
Yang et al. Finding correlated biclusters from gene expression data
CN111667884A (zh) 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型
CN105631416B (zh) 采用新型密度聚类进行人脸识别的方法
Lan et al. Robust feature selection via simultaneous sapped norm and sparse regularizer minimization
Yu et al. Identifying protein-kinase-specific phosphorylation sites based on the bagging–adaboost ensemble approach
Pavlenko et al. Covariance structure approximation via gLasso in high-dimensional supervised classification
Dou et al. Accurate identification of RNA D modification using multiple features
Lan et al. JLONMFSC: Clustering scRNA-seq data based on joint learning of non-negative matrix factorization and subspace clustering
Huang et al. Multiple spatial pooling for visual object recognition
Wu et al. Unified deep learning architecture for modeling biology sequence
Aydin et al. Constructing structural profiles for protein torsion angle prediction
Guan et al. MV-H-RKM: A Multiple View-Based Hypergraph Regularized Restricted Kernel Machine for Predicting DNA-Binding Proteins
Tang et al. Feature selection algorithm based on k-means clustering
Wang et al. Generating new protein sequences by using dense network and attention mechanism
Chen et al. Deeparc: an attention-based hybrid model for predicting transcription factor binding sites from positional embedded dna sequence
Kecman et al. Adaptive local hyperplane for regression tasks
Lu et al. Combining multiple clusterings using fast simulated annealing
Liao et al. Locally Linear Discriminant Embedding for Feature Gene Extraction Based on Dynamical Neighborhood
Shamima et al. Protein secondary structure prediction using a fully complex-valued relaxation network
Lu et al. A boosted manifold learning for automatic face recognition
Narra et al. Use of extended phylogenetic profiles with E-values and support vector machines for protein family classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200728

CF01 Termination of patent right due to non-payment of annual fee