CN103310229B - 一种用于图像分类的多任务机器学习方法及其装置 - Google Patents

一种用于图像分类的多任务机器学习方法及其装置 Download PDF

Info

Publication number
CN103310229B
CN103310229B CN201310240633.5A CN201310240633A CN103310229B CN 103310229 B CN103310229 B CN 103310229B CN 201310240633 A CN201310240633 A CN 201310240633A CN 103310229 B CN103310229 B CN 103310229B
Authority
CN
China
Prior art keywords
matrix
regression
view data
label
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310240633.5A
Other languages
English (en)
Other versions
CN103310229A (zh
Inventor
杨名
李英明
张仲非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310240633.5A priority Critical patent/CN103310229B/zh
Publication of CN103310229A publication Critical patent/CN103310229A/zh
Application granted granted Critical
Publication of CN103310229B publication Critical patent/CN103310229B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于图像分类的多任务机器学习方法及其装置,本发明特点在于同时利用残差结构和回归矩阵协方差阵的低秩逼近,并对残差结构、回归矩阵、回归矩阵的低秩分解矩阵及回归矩阵的协方差矩阵进行概率建模,最后通过变分推断或者采样的方法对概率模型的参数进行学习,最后得到准确度较高的回归矩阵并用其进行图像分类。通过利用本发明所述的方案,一方面,残差结构中存在的多任务间相关关系信息得到了利用能提高参数学习准确度以提高分类精度,另一方面通过对回归矩阵协方差矩阵进行低秩逼近能有效的降低算法的计算复杂度。

Description

一种用于图像分类的多任务机器学习方法及其装置
技术领域
本发明属于图像处理技术领域,涉及一种图像分类的多任务机器学习方法,特别涉及一种利用残差结构和回归矩阵协方差矩阵低秩逼近进行图像分类的多任务机器学习方法。
背景技术
随着大数据时代的到来,海量数据挖掘显得尤为重要。在海量数据挖掘中,如何利用从已有数据中挖掘出来的信息来指导新数据的挖掘已成为一个新的研究热点。特别是当某些任务的样本数量较少时,利用多任务学习能够有效的减少海量数据挖掘的时间成本并提高信息获取准确度。例如,在图像数据分类任务中,利用图像数据不同分类任务之间的相关性可以提高任务的分类精度;在生物信息学中,利用DNA不同检测任务之间的相关性可以提升任务的检测精度。
多任务机器学习问题可以被视为如下的多输出回归问题:
Y = W X + μ 1 N T + ∈
为N样本d输出的标签矩阵;
为N样本D维特征的观测矩阵;为回归矩阵;为任务的偏置向量;1N为N维全1列向量,上标T表示矩阵的转秩;∈为d×N的残差矩阵。其中维数N,d是自然数。传统的多任务机器学习方法通过求解误差损失函数加上回归系数矩阵正则约束的优化问题来学习W:
min W | Y - W X | F 2 + R ( W )
其中|·|F为矩阵F范数;R(W)为W的正则约束,常见的约束是矩阵F范数,矩阵l2,1范数,矩阵lp,q范数等。但这一类范数的正则约束项只引入了任务之间的正相关性,而没有建立任务之间的负相关性。
为了引入任务之间的负相关性,有必要对W进行任务之间相关性的建模。一种常用的约束是tr(Σ-1-1WT)+R(Σ,Ω)。这里将W视为一个服从矩阵高斯分布的随机变量,其中是矩阵Kronecker乘积符号。此时求解误差损失函数加上回归矩阵协方差矩阵约束的优化问题来学习W。
但上述的机器学习方法都忽略了残差矩阵∈的结构。残差矩阵中也包含了任务之间的相关信息,如果能够进一步利用残差矩阵中所包含的任务之间相关性信息能进一步提升学习回归矩阵W的准确度。同时由于协方差矩阵∑和Ω维数可能较大,若不能对其进行有效的逼近,可能会使多任务机器学习算法复杂度过大。
发明内容
本发明的目的在于克服上述已有技术缺点,提出一种基于残差结构和回归矩阵协方差矩阵低秩逼近的图像分类的多任务机器学习方法及其装置,从而能够有效的提升回归矩阵的预测准确度进而提升图像数据分类的精度。
为实现上述目的,本发明的用于图像分类的多任务机器学习方法首先引入几十幅各个分类任务的图像数据及其相对应的标签数据;进而对上述数据建立概率模型,通过利用残差结构和回归矩阵协方差矩阵低秩逼近的多任务机器学习方法,对回归矩阵进行学习;最后利用多任务学习到的回归矩阵对测试图像进行分类。具体步骤包括:
S10,输入分类任务的训练图像数据及其对应的标签数据,对图像数据使用图像处理的方法提取特征,得到图像数据的观测矩阵和标签矩阵;
S20,通过计算标签矩阵和回归矩阵乘以观测矩阵之间的差,对残差结构进行概率建模,即设定残差矩阵服从某一概率分布∈~F(·),由此标签矩阵Y服从均值为的分布F(·);
S30,对回归矩阵W的协方差矩阵低秩逼近进行概率建模,其中:
S301,设定回归矩阵的低秩分解为W=VZ,其中V和Z为低秩矩阵,以VVT的形式逼近行协方差矩阵∑,以ZTZ的形式逼近列协方差矩阵Ω。并对W,V,Z进行概率建模:
W~FW(VZ)
V~Fv(Σ)
Z~Fz(Ω)
其中FW,Fv,Fz分别为W,V,Z设定的概率分布;
S302,对回归矩阵W的行协方差矩阵∑和列协方差矩阵Ω分别设定概率分布F,FΩ
S40,通过变分推断或采样的方法对S20及S30中所述的概率模型中的参数进行学习。
S50,重复步骤S40,直至诸参数收敛。
S60,利用多任务机器学习方法学习得到的回归矩阵W,乘以输入的测试图像的观测矩阵得到测试图像标签矩阵的估计值,以此估计标签矩阵对测试图像数据进行分类。
本发明的另一目的还在于提供一种用于图像分类的多任务机器学习分类器,其特征在于,包括以下三个模块:
1)图像数据预处理模块,其输入为图像数据及其对应的标签数据,输出分别为图像数据的观测矩阵和标签矩阵,用于对图像数据使用图像处理的方法提取特征得到图像数据的观测矩阵和标签矩阵;
2)概率建模参数学习模块,其输入为图像数据的观测矩阵及其对应的标签矩阵,其输出为回归矩阵;用于:
通过计算标签矩阵和回归矩阵乘以观测矩阵之间的差得到残差矩阵,对残差矩阵进行概率建模,并设定残差矩阵服从某一概率分布;
对回归矩阵进行低秩矩阵二分解,其中每个分解矩阵分别作为回归矩阵的行协方差矩阵和列协方差矩阵的逼近矩阵;对回归矩阵及其两个分解矩阵进行概率建模;
通过变分推断或采样的方法对上述概率模型中的参数进行学习;
3)图像数据分类模块,其输入为回归矩阵和测试图像数据观测矩阵,其输出为测试图像标签矩阵的估计值,用于利用多任务机器学习方法学习得到的回归矩阵W,乘以输入的测试图像的观测矩阵得到测试图像的标签矩阵估计值,以此估计标签矩阵对测试图像数据进行分类。
本发明的优点是:同时利用残差结构和回归矩阵协方差矩阵的低秩逼近进行多任务机器学习能有效的挖掘图像数据分类任务之间的相关性并降低协方差矩阵学习的算法复杂度;通过概率模型的参数更新,能有效的提高回归矩阵的学习精度,从而能提高图像数据分类的精度。
附图说明
图1为高斯矩阵广义逆高斯模型的概率图模型;
图2为本发的用于图像分类的多任务机器学习方法实施例的流程图;
图3本发明一种用于图像分类的多任务机器学习分类器实施例的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
本发明实施例一提供一种用于图像分类的多任务机器学习方法,其包括以下步骤:
S10,输入图像特征数据和每个数据所对应的标签数据,对图像数据进行滤波、提取颜色、纹理、尺度不变特征等;
S20,通过计算标签矩阵Y和回归矩阵W乘以观测矩阵X之间的差得到残差矩阵,对残差结构进行概率建模,其中设定残差矩阵服从矩阵高斯分布由此标签矩阵服从均值为的矩阵高斯分布
其中σ2为大于零的实数,IN表示N×N的单位矩阵。
S30,对回归矩阵的协方差矩阵低秩逼近进行概率建模,得到高斯矩阵广义逆高斯模型(Gaussian Matrix Generalized Inverse GaussianModel)。其定义如下:
为D×D正定矩阵的集合,VZ,Ω,Ψ1∑,Ψ2
Ω~MGIGD1v,v1)
Σ~MGIGd2,Φ2,v2)
则称这一系列相关变量构成了高斯矩阵广义逆高斯模型。其中表示高斯分布,MGIG表示矩阵广义逆高斯分布。κ1,κ2为正数,维数d,D,K都是自然数。V和Z构成回归矩阵W的低秩分解,从而其行协方差矩阵∑和列协方差矩阵Ω分别存在低秩逼近VVT和ZTZ。则将此分布关系同高斯矩阵广义逆高斯分布结合在一起就可以得到高斯矩阵广义逆高斯回归模型(Gaussian Matrix Generalized Inverse GaussianRegression Model),其概率图模型如附图1所示。
S40,通过变分推断的方法对概率模型中的参数进行学习。S401,在期望步(E-phase)更新下得到
W = ( < V > < Z > < &Omega; - 1 > + &sigma; - 2 ( Y - &mu; 1 N T ) X T ) &Omega; W
V = < W > < &Omega; - 1 > < Z > T ( &kappa; 1 - 1 I K + < Z&Omega; - 1 Z T > ) - 1
Z = ( &kappa; 2 - 1 I K + < V T &Sigma; - 1 V > ) - 1 < V > T < &Sigma; - 1 > < W >
&Omega; ~ MGIG D ( &Psi; ^ 1 , &Phi; 1 , v ^ 1 )
&Sigma; ~ MGIG d ( &Psi; ^ 2 , &Phi; 2 , v ^ 2 )
其中〈·〉表示在其他参数给定的情况下参数的期望,ΩW=(<Ω-1〉+σ-2XXT)-1;Ω和∑的更新通过采样的方式进行估计;
S402,在最大化步(M-phase)更新下得到
&Psi; ^ 1 = &Psi; 1 + &kappa; 2 - 1 < Z T Z > + < ( W - V Z ) T ( W - V Z ) >
&Psi; ^ 2 = &Psi; 2 + &kappa; 1 - 1 < VV T > + < ( W - V Z ) &Omega; - 1 ( W - V Z ) T > + &sigma; - 2 < ( Y - W X - &mu; 1 N T ) ( Y - W X - &mu; 1 N T ) T >
v ^ 1 = v 1 - ( d + K ) / 2
v ^ 2 = v 2 - ( d + N + D + K ) / 2
S403,重复更新算法S401,S402直至诸参数收敛。
S50,利用学习到的回归矩阵W,乘以测试图像数据的观测矩阵得到测试图像标签矩阵的估计值以此估计矩阵对图像数据进行分类。
S40的参数学习也可通过采样的方法实现。采用采样方法,即是使用大量训练图像数据统计样本频数的方法对参数进行更新,属于常规方法,在此不做例举。
图3所示为一种用于图像分类的多任务机器学习分类器。该装置包括三个模块:图像数据预处理模块;概率建模参数学习模块;图像数据分类模块。
图像数据预处理模块的输入为图像数据及其对应的标签数据,输出分别为图像数据的观测矩阵及其对应的标签矩阵,其完成的功能和实施方式与上述用于图像分类的多任务机器学习方法中对图像数据进行滤波、提取颜色、纹理、尺度不变特征的方法所述的功能和实施方式相同。
概率建模参数学习模块的输入包括图像数据的观测矩阵及其对应的标签矩阵,其输出为回归矩阵。其完成的功能和实施方式与上述用于图像分类的多任务机器学习方法中对残差结构、回归矩阵协方差矩阵低秩逼近的概率建模及对参数使用变分推断进行学习的方法所述的功能和实施方式相同。
图像数据分类模块,其输入为回归矩阵和图像数据观测矩阵,其输出为标签矩阵的估计值,其完成的功能和实施方式与上述用于图像分类的多任务机器学习方法中对测试图像观测矩阵进行测试图像标签矩阵估计的方法所述的功能和实施方式相同。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种用于图像分类的多任务机器学习方法,其特征在于包括如下步骤:
S10,输入分类任务的图像数据及其对应的标签数据,对图像数据使用图像处理的方法提取特征,得到图像数据的观测矩阵和标签矩阵;
S20,通过计算标签矩阵和回归矩阵乘以观测矩阵之间的差得到残差矩阵,对残差矩阵进行概率建模,并设定残差矩阵服从矩阵高斯分布;
S30,对回归矩阵进行低秩矩阵二分解,其中每个分解矩阵分别作为回归矩阵的行协方差矩阵和列协方差矩阵的逼近矩阵;对回归矩阵及其两个分解矩阵进行概率建模;
S40,通过变分推断或采样的方法对S20及S30中所述的概率模型中的参数进行学习;
S50,重复步骤S40,直至诸参数收敛;
S60,利用多任务机器学习方法学习得到的回归矩阵W,乘以输入的测试图像的观测矩阵得到测试图像的标签矩阵估计值,以此估计标签矩阵对测试图像数据进行分类。
2.一种用于图像分类的多任务机器学习分类器,其特征在于,包括:
图像数据预处理模块,其输入为图像数据及其对应的标签数据,输出分别为图像数据的观测矩阵和标签矩阵,用于对图像数据使用图像处理的方法提取特征得到图像数据的观测矩阵和标签矩阵;
概率建模参数学习模块,其输入为图像数据的观测矩阵及其对应的标签矩阵,其输出为回归矩阵;用于:
通过计算标签矩阵和回归矩阵乘以观测矩阵之间的差得到残差矩阵,对残差矩阵进行概率建模,并设定残差矩阵服从矩阵高斯分布;
对回归矩阵进行低秩矩阵二分解,其中每个分解矩阵分别作为回归矩阵的行协方差矩阵和列协方差矩阵的逼近矩阵;对回归矩阵及其两个分解矩阵进行概率建模;
通过变分推断或采样的方法对上述概率模型中的参数进行学习;
图像数据分类模块,其输入为回归矩阵和测试图像数据观测矩阵,其输出为测试图像标签矩阵的估计值,用于利用多任务机器学习方法学习得到的回归矩阵W,乘以输入的测试图像的观测矩阵得到测试图像的标签矩阵估计值,以此估计标签矩阵对测试图像数据进行分类。
CN201310240633.5A 2013-06-15 2013-06-15 一种用于图像分类的多任务机器学习方法及其装置 Expired - Fee Related CN103310229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310240633.5A CN103310229B (zh) 2013-06-15 2013-06-15 一种用于图像分类的多任务机器学习方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310240633.5A CN103310229B (zh) 2013-06-15 2013-06-15 一种用于图像分类的多任务机器学习方法及其装置

Publications (2)

Publication Number Publication Date
CN103310229A CN103310229A (zh) 2013-09-18
CN103310229B true CN103310229B (zh) 2016-09-07

Family

ID=49135423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310240633.5A Expired - Fee Related CN103310229B (zh) 2013-06-15 2013-06-15 一种用于图像分类的多任务机器学习方法及其装置

Country Status (1)

Country Link
CN (1) CN103310229B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678580B (zh) * 2013-12-07 2017-08-08 浙江大学 一种用于文本分类的多任务机器学习方法及其装置
US9582753B2 (en) * 2014-07-30 2017-02-28 Mitsubishi Electric Research Laboratories, Inc. Neural networks for transforming signals
CN108133224B (zh) * 2016-12-01 2021-11-16 富士通株式会社 用于评估分类任务复杂度的方法
US10496902B2 (en) * 2017-09-21 2019-12-03 International Business Machines Corporation Data augmentation for image classification tasks
CN111506832B (zh) * 2020-04-20 2023-07-28 郑州信息科技职业学院 一种基于块矩阵补全的异构对象补全方法
CN112329604B (zh) * 2020-11-03 2022-09-20 浙江大学 一种基于多维度低秩分解的多模态情感分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819748A (zh) * 2012-07-19 2012-12-12 河南工业大学 害虫稀疏表征分类识别方法与分类识别装置
CN103150713A (zh) * 2013-01-29 2013-06-12 南京理工大学 利用图像块分类稀疏表示与自适应聚合的图像超分辨方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8406483B2 (en) * 2009-06-26 2013-03-26 Microsoft Corporation Boosted face verification
US8924315B2 (en) * 2011-12-13 2014-12-30 Xerox Corporation Multi-task learning using bayesian model with enforced sparsity and leveraging of task correlations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819748A (zh) * 2012-07-19 2012-12-12 河南工业大学 害虫稀疏表征分类识别方法与分类识别装置
CN103150713A (zh) * 2013-01-29 2013-06-12 南京理工大学 利用图像块分类稀疏表示与自适应聚合的图像超分辨方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Simultaneous Multiple Response Regression and Inverse Covariance Matrix Estimation via Penalized Gaussian Maximum Likelihood;Wonyul Lee等;《Journal of Multivariate Analysis》;20121231;第111卷;第241-255页 *
Sparse Bayesian Multi-Task Learning;Cedric Archambeau等;《Advances in Neural Information Processing Systems》;20111231;第24卷(第2期);第1755-1763页 *
基于多任务学习的自然图像分类研究;刘成等;《计算机应用研究》;20121231;第29卷(第7期);第2773-2775页 *

Also Published As

Publication number Publication date
CN103310229A (zh) 2013-09-18

Similar Documents

Publication Publication Date Title
CN103310229B (zh) 一种用于图像分类的多任务机器学习方法及其装置
CN109523018B (zh) 一种基于深度迁移学习的图片分类方法
Stach et al. Expert-based and computational methods for developing fuzzy cognitive maps
Griffith et al. Non-standard spatial statistics and spatial econometrics
US7512273B2 (en) Digital ink labeling
CN105512680A (zh) 一种基于深度神经网络的多视sar图像目标识别方法
CN104063876A (zh) 一种交互式图像分割方法
CN113762595B (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN103440512A (zh) 一种基于张量局部保持投影的大脑认知状态的识别方法
CN108647691A (zh) 一种基于点击特征预测的图像分类方法
Li et al. Bayesian Markov chain random field cosimulation for improving land cover classification accuracy
Feldman et al. Multi-objective simulation optimization on finite sets: Optimal allocation via scalarization
CN112132014A (zh) 基于非督导金字塔相似性学习的目标重识别方法及***
CN105335619A (zh) 适用于高计算代价数值计算模型参数反分析的协同优化法
Guegan et al. An econometric study of vine copulas
Mishra et al. Assessment of spatio-temporal changes in land use/land cover over a decade (2000–2014) using earth observation datasets: a case study of Varanasi district, India
CN113569852A (zh) 语义分割模型的训练方法、装置、电子设备及存储介质
CN102024153B (zh) 高光谱图像监督分类方法
CN105938524A (zh) 一种微生物关联网络预测方法及装置
CN114004998B (zh) 基于多视张量积扩散的非监督极化sar图像地物分类方法
CN103473366A (zh) 一种多视角跨数据域图像内容识别的分类方法及装置
CN105787045A (zh) 一种用于可视媒体语义索引的精度增强方法
CN110717512B (zh) 一种基于结构保持零样本学习的鸟类濒危物种识别方法
CN112529057A (zh) 一种基于图卷积网络的图相似性计算方法及装置
CN111966836A (zh) 知识图谱向量表示方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160907

Termination date: 20210615

CF01 Termination of patent right due to non-payment of annual fee