CN117951632B - 基于多模态原型网络的pu对比学习异常检测方法及*** - Google Patents
基于多模态原型网络的pu对比学习异常检测方法及*** Download PDFInfo
- Publication number
- CN117951632B CN117951632B CN202410354820.4A CN202410354820A CN117951632B CN 117951632 B CN117951632 B CN 117951632B CN 202410354820 A CN202410354820 A CN 202410354820A CN 117951632 B CN117951632 B CN 117951632B
- Authority
- CN
- China
- Prior art keywords
- prototype
- network
- fusion
- modal
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 24
- 230000004927 fusion Effects 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 27
- 238000013145 classification model Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 9
- 210000004556 brain Anatomy 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 claims 4
- 238000002372 labelling Methods 0.000 abstract description 8
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/369—Electroencephalography [EEG]
- A61B5/372—Analysis of electroencephalograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Surgery (AREA)
- Psychology (AREA)
- Psychiatry (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于多模态原型网络的PU对比学***衡和缺少标注负样本造成的分类偏差,可应用于医疗诊断,辅助医生高效、准确地筛查病症,具有广泛的应用前景。
Description
技术领域
本发明涉及医疗人工智能技术领域,更具体的说是涉及一种基于多模态原型网络的PU对比学习异常检测方法及***。
背景技术
在当今的医疗诊断领域中,准确迅速地诊断出病人的疾病变得越来越重要。传统的医学诊断方法主要依赖于医生的经验和知识,具有耗时效率低、无法处理大量患者数据、缺乏自动化和智能化的问题。医疗人工智能技术以其在图像识别、自然语言处理和深度学***衡性使得训练一个有效的分类器变得尤为困难,并且偏差较大。
为解决上述问题,现有的多模态异常检测方法大多通过数据增强技术来平衡正负样本,例如通过翻转、切分或添加噪声来人工地增加正样本数量,但这种方式无法充分捕捉数据的内在关联,而且可能引入额外的噪声。除此之外,目前一些先进的方法使用半监督学习对未标注数据进行学习,试图从大量未标注样本中提取有用信息,但通常需要精心设计损失函数和训练策略,面临模型难收敛,易坍塌的问题。
因此,提出一种基于多模态原型网络的PU对比学***衡和资源有限的情境下,实现准确和有效的二分类,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于多模态原型网络的PU对比学***衡性,聚类结果存在偏差,为解决这一问题,通过融合正无标签(PU)学习的自监督对比学习策略对上述聚类结果进行无偏风险估计,判断样本所属类别,旨在从无标签样本中准确地识别出正类、负类样本。
为了实现上述目的,本发明采用如下技术方案:
一方面,本发明公开一种基于多模态原型网络的PU对比学习异常检测方法,包括以下步骤:
采集多模态数据,所述多模态数据包括脑电模态数据和文本模态数据;
构建无偏分类模型,并对所述无偏分类模型进行训练;所述无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学***衡性所造成的偏差,实现多模态数据的分类;
将所述多模态数据输入到训练后的无偏分类模型中,输出所述多模态数据所属的类别。
优选的,采集多模态数据包括对所述多模态数据进行预处理;
将所述多模态数据划分为部分标记正样本XP,和未标记样本XU,所述部分标记正样本XP的标签为Y=+1,所述未标记样本XU无标签。
优选的,所述特征提取与融合网络包括扩张卷积网络、BERT模型和多头自注意力机制;
所述扩张卷积网络和所述BERT模型分别用于所述脑电模态数据和所述文本模态数据的特征提取;所述多头自注意力机制用于将所述多模态数据的特征进行融合,生成所述融合特征。
优选的,所述多模态特征增强的原型网络通过融合特征计算k类的原型ck,ck={cP,cU},其中,cP为所述部分标记正样本XP的原型即正类原型,cP∈Rd;cU为所述未标记样本XU的原型即未标签原型cU∈Rd,但因未标签数据中包含正类样本和负类样本,所以未标签原型CU具有一定的偏差;
计算每个样本xi与各个原型ck在嵌入空间中的欧几里德距离,得到二分类的概率分布pφ(y=k|xi)。
优选的,所述多模态特征增强的原型网络的损失函数为:
其中,X为数据样本,O(xi)为样本xi的融合特征。
优选的,所述PU对比学习网络将所述融合特征与所述原型Ck进行合并操作得到样本对Zi;基于所述样本对Zi构建无偏的风险估计函数,即PU对比学习损失函数。
优选的,将所述融合特征与所述原型Ck进行合并操作得到样本对Zi,包括:
通过所述部分标记正样本XP的融合特征OP与所述正类原型计算得到正样本对 所述未标记样本XU的融合特征OU与所述未标签原型cU计算得到样本对
优选的,所述无偏风险估计函数,即PU对比学习损失函数为:
其中,πP表示正样本的先验概率。
优选的,将所述多模态数据输入到训练后的所述无偏分类模型中,输出所述多模态数据所属的类别,包括:
将所述多模态数据输入到所述特征提取与融合网络中,生成一个融合特征Oi;
计算所述融合特征Oi与所述多模态特征增强的原型网络中各个原型ck在嵌入空间中的欧几里德距离,得到样本分类的概率分布pφ;
根据所述概率分布pφ判定所述多模态数据所属的类别。
另一方面,本发明还公开一种基于多模态原型网络的PU对比学习异常检测***,用于实现上述基于多模态原型网络的PU对比学习异常检测方法,包括:
数据采集模块,用于采集多模态数据,所述多模态数据包括脑电模态数据和文本模态数据;
模型构建模块,用于构建无偏分类模型,并对所述无偏分类模型进行训练;所述无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学***衡性所造成的偏差,实现多模态数据的精准分类;
检测及输出模块,用于将所述多模态数据输入到训练后的无偏分类模型中,输出所述多模态数据所属的类别。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于多模态原型网络的PU对比学***衡数据的分类任务,尤其适用于医学领域中正样本稀缺且标注成本高昂的场景,通过分析有限的多模态正样本和大量的无标签数据,能够准确地区分出正样本和负样本,无需耗费昂贵的人工标注成本。另一方面,为了解决无标签样本分类中的偏差问题,本发明将对比学习融合到PU学习中,通过对比学习算法,能够自主挖掘多模态数据内部的特征表示,学习得到面向异常检测的多模态数据的低维特征表示,为下游的多模态分类任务提供高质量的特征。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的基于多模态原型网络的PU对比学习异常检测方法的流程图。
图2为本发明实施例提供的基于多模态原型网络的PU对比学习异常检测***的***架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一方面,本发明实施例公开了一种基于多模态原型网络的PU对比学习异常检测方法,如图1所示,包括如下步骤:
S1.采集多模态数据,多模态数据包括脑电模态数据和文本模态数据。
其中,采集多模态数据包括对多模态数据进行预处理;
假设X和Y是数据样本和标签,πp=p(Y=+1)和πn=p(Y=-1)是正样本和负样本的先验概率,且正样本的πp已知。将多模态数据划分为标记正样本XP,和未标记样本XU,标记正样本XP的标签为Y=+1,未标记样本XU缺少标签。
S2.构建无偏分类模型,并对无偏分类模型进行训练;无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学习网络。
特征提取与融合网络根据多模态数据生成融合特征,通过多模态特征增强的原型网络对融合特征进行聚类,最后利用PU对比学***衡的多模态数据特征进行分类。
将上述的特征提取与融合网络、多模态特征增强的原型网络以及PU对比学习网络经过部分标注的多模态正样本数据和大量无标签多模态样本进行训练后,可获得一个用于实际推理测试的无偏分类模型,训练过程如图1中白色箭头所示。
具体地,为了构建更全面和具有代表性的多模态融合特征向量,本发明实施例构造了一个包括扩张卷积网络、BERT模型和多头自注意力机制的多模态特征提取与融合网络。
具体而言,扩张卷积网络负责脑电模态数据的特征提取,得到代表样本脑电特征的表示E={e1,e2,...,eN},BERT模型负责文本模态数据的特征提取,得到代表样本文本特征的表示S={s1,s2,...,sN},多头自注意力机制负责将这两个模态的特征进行高效融合,得到脑电和文本信息融合的特征O={o1,o2,...,oN}。
扩张卷积网络的架构由一层线性投影层、多个扩张卷积网络和一个输出层组成。线性投影层为全连接层,将脑电数据从其原始特征维度(如3,64或128)映射到64个隐藏通道。扩张卷积网络由4个隐藏块组成,每个隐藏块由RELU层+扩张卷积层+RELU层+扩张卷积层构成。其中,每个隐藏块的扩张卷积通道数为64,卷积核大小为3,第i层扩张卷积的扩张率设为2i。这4个隐藏块之间通过残差连接进行串联,最终通过一个通道大小为256的输出层进行输出。对于文本模态的预训练BERT模型,设定其输出特征向量的维度为256。
在特征融合阶段,脑电特征表示E与文本特征表示S首先通过拼接操作合并,生成一个维度为512的联合特征向量M=[m1,m2,...,mN]∈RN×d,然后由于采用了多头(共8个)的自注意力机制,对于每一个头h,计算三组可训练的参数矩阵
其中dh是每个头h对应的特征维度,接着计算每个头的注意力分值Ai:
将得到的8个Ai通过拼接操作合并,并与矩阵进行线性变换,以获取最终的融合特征O:
O=[A1||A2||...||Ak]W4|
其中||为拼接操作。
本实施例中根据获取融合特征O的方法分别计算标记正样本XP的融合特征OP,未标记样本XU的融合特征OU以及训练获得的融合特征Oi。
通过多头自注意力机制的加权和优化,最终生成的融合特征O不仅整合了来自脑电和文本数据的丰富信息,还具有更高的代表性和全面性。这一机制强化了模型的能力,使其能更准确地捕捉到不同模态之间的复杂关联,从而得到一个更全面、更具代表性的特征表示。
进一步,为了在特征嵌入空间中实现精准的聚类,本发明使用多模态融合特征增强的原型网络,旨在利用融合了脑电和文本数据的多模态特征获得更有鉴别力的原型。
因本发明任务为仅有部分正样本标签和大量未标记样本条件下的二分类任务,针对这种数据不平衡且缺少标记负样本的问题,为了获取高准确率的分类结果,关键在于学习到具有辨别力的原型,这样不仅可以更好地保留与类别相关的信息,同时还能减轻无标签样本中与正样本较为相似的负样本所带来的偏差性。为了实现这一目标,本发明采用上述提取的多模态融合特征来计算样本与所属类别之间的关系,使用这种多模态融合特征增强的原型网络生成更具鉴别力的原型。
首先通过融合特征O分别计算k类的原型ck,ck={cP,cU},标记正样本的原型cP∈Rd,未标记样本的原型cU∈Rd,计算方式如下:
其中为标记的正样本,为未标记的样本,分别为标记正样本和未标记的融合特征。
因为未标记样本中大部分属于负类,只有πp为正类,所以未标记样本的原型cU可当成有偏的负类样本的原型cN,从而样本标签可当成Y=-1的伪标签。
然后计算每个样本xi与各个原型ck在嵌入空间中的欧几里德距离,从而得到二分类的概率分布pφ(y=k|xi):
O(xi)为样本xi的融合特征,其中k表示类别,本发明中k为2,Rd表示特征空间,其中d为具体的特征维度,y表示等于某个特定类别k的概率。
最后计算数据集中所有样本的损失函数训练多模态特征增强的原型网络,通过最小化负对数概率来进行,并且因目前的原型网络中cN是有偏的,即多模态特征增强的原型网络的损失函数为:
进一步,为了解决未标记样本所造成的多模态特征增强的原型网络存在偏差性这一问题,本发明引入基于PU学习的对比学习网络,即PU对比学习网络,不仅可以提升原型网络中同类样本间的相似性,降低差异类样本间的相似性,获取类别更为鲜明的特征表示,同时采用无偏的PU学习的策略可以解决未标记样本原型中的正样本数据造成的偏向性,最终获取更具区分度和代表性的特征及原型网络,提升分类任务的准确性。
因本发明的任务只有部分正样本标签和大量无标签样本,为了解决偏差性,采用无偏的PU学习策略,其依靠的是无偏的风险评估器,假设gφ是任意的决策函数,lpu是损失函数,那么正样本的经验风险负样本的经验风险那么函数gφ在传统的具有正样本和负样本的二分类任务上的整体经验风险是:
其中πP是正样本的类先验概率,πn是负样本的类先验概率。
而在PU学习进行训练的时候,因数据的分布是通过采样获取的,并且只有正样本,缺少负样本,所以需要通过近似获得,且因所以PU学习的风险评估函数可近似为:
其中和计算如下:
根据定义,应该非负,可在PU学习训练的时候,该近似值在学习后期可能会出现为负数的情况,从而出现过拟合的现象。为了解决这一问题,本发明采用在风险损失函数中引入max操作,具体公式为:
上述公式可得,在πP已知的条件下,为了进一步降低风险损失函数,需降低即从未标记样本中准确识别出正样本。为了达到这一目的,本发明引入对比学习的方法,借助对比学习自监督地挖掘无标签多模态数据内部的特征表示。
因对比学习方法的关键在于正负样本对的选择。为了构建具有差异化的正负样本对,本实施例将训练获得的融合特征Oi与原型ck使用函数φ(x)进行合并操作:
其中φ(x)可采用加权平均,拼接,取最大值等多种形式,所得zi∈Rd。
具体地,通过正样本标签的融合特征OP与正类原型cP计算得到 作为正样本对,而未标记样本的融合特征OU与未标签原型cU计算得到 因中部分样本为负类,只有πP概率为正样本,所以可近似为有偏的负样本原型。为了解决有偏性这一问题,结合上述的无偏风险估计方法,构建对比学习损失函数Lcpu,并基于该函数对PU对比学习网络进行优化,对比学习损失函数Lcpu公式如下:
因上述中故公式中需计算
S3.将多模态数据输入到训练后的无偏分类模型中,输出多模态数据所属的类别,具体操作步骤叙述如下:
(1)将采集的脑电、文本多模态数据输入到特征提取与融合网络中,从而生成一个全面且具有代表性的融合特征Oi;
(2)计算该融合特征Oi与多模态原型网络中各个原型ck在嵌入空间中的欧几里德距离,从而得到样本分类的概率分布pφ;
(3)根据该概率分布pφ判定样本所属的类别。
可见,模型训练完成后,在推理阶段仅需要将获取的多模态(脑电、文本)数据作为输入,模型便能准确地判定其所属类别,从而完成在数据不平衡和标签有限环境下的分类任务。
另一方面,本发明还提出一种基于多模态原型网络的PU对比学习异常检测***,参考图2,该***用于实现上述基于多模态原型网络的PU对比学习异常检测方法,包括:
数据采集模块,用于采集多模态数据,多模态数据包括脑电模态数据和文本模态数据;
模型构建模块,用于构建无偏分类模型,并对所述无偏分类模型进行训练;无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学***衡性,聚类结果存在一定的偏差,为解决这一问题,最后利用PU对比学习网络对上述有偏聚类结果进行无偏风险估计,纠正产生的偏差,对多模态数据进行分类;
检测及输出模块,用于将多模态数据输入到训练后的无偏分类模型中,输出所述多模态数据所属的类别。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,包括以下步骤:
采集多模态数据,所述多模态数据包括脑电模态数据和文本模态数据;
构建无偏分类模型,并对所述无偏分类模型进行训练;所述无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学习网络;所述特征提取与融合网络根据多模态数据生成融合特征,通过所述多模态特征增强的原型网络对所述融合特征进行聚类得到有偏聚类结果,最后利用所述PU对比学习网络对所述有偏聚类结果进行无偏风险估计并纠正偏差,实现所述多模态数据的分类;
其中,所述PU对比学习网络将所述融合特征与原型ck进行合并操作得到样本对Zi;基于所述样本对Zi构建无偏风险估计函数,即PU对比学习损失函数;根据所述PU对比学习损失函数优化所述PU对比学习网络;
将所述融合特征与原型ck进行合并操作得到样本对Zi,包括:
通过部分标记正样本XP的融合特征OP与正类原型cP计算得到正样本对 未标记样本XU的融合特征OU与未标签原型cU计算得到样本对 其中ck={cP,cU};
将所述多模态数据输入到训练后的无偏分类模型中,输出所述多模态数据所属的类别,包括:
将所述多模态数据输入到所述特征提取与融合网络中,生成一个融合特征Oi;
计算所述融合特征Oi与所述多模态特征增强的原型网络中各个原型ck在嵌入空间中的欧几里德距离,得到样本分类的概率分布pφ;
根据所述概率分布pφ判定所述多模态数据所属的类别。
2.根据权利要求1所述的一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,采集多模态数据包括对所述多模态数据进行预处理;
将所述多模态数据划分为部分标记正样本XP,和未标记样本XU,所述部分标记正样本XP的标签为Y=+1,所述未标记样本XU无标签。
3.根据权利要求1所述的一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,所述特征提取与融合网络包括扩张卷积网络、BERT模型和多头自注意力机制;
所述扩张卷积网络和所述BERT模型分别用于所述脑电模态数据和所述文本模态数据的特征提取;所述多头自注意力机制用于将所述多模态数据的特征进行融合,生成所述融合特征。
4.根据权利要求3所述的一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,所述多模态原型网络通过融合特征计算k类的原型ck,ck={cP,cU},其中,cP为所述部分标记正样本XP的原型即正类原型,cP∈Rd;cU为所述未标记样本XU的原型即未标签原型cU∈Rd;
计算每个样本xi与各个原型ck在嵌入空间中的欧几里德距离,得到二分类的概率分布pφ(y=k|xi);
其中,k表示类别,y表示等于某个特定类别k的概率,Rd表示特征空间,d为特征维度。
5.根据权利要求4所述的一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,所述多模态特征增强的原型网络的损失函数为:
其中,X为数据样本,O(xi)为样本xi的融合特征。
6.根据权利要求1所述的一种基于多模态原型网络的PU对比学习异常检测方法,其特征在于,所述PU对比学习损失函数为:
其中,πP表示正样本的先验概率。
7.一种基于多模态原型网络的PU对比学习异常检测***,其特征在于,包括:
数据采集模块,用于采集多模态数据,所述多模态数据包括脑电模态数据和文本模态数据;
模型构建模块,用于构建无偏分类模型,并对所述无偏分类模型进行训练;所述无偏分类模型包括特征提取与融合网络、多模态特征增强的原型网络以及PU对比学习网络;所述特征提取与融合网络根据多模态数据生成融合特征,通过所述多模态特征增强的原型网络对所述融合特征进行聚类得到有偏聚类结果,最后利用所述PU对比学习网络对所述有偏聚类结果进行无偏风险估计并纠正偏差,实现所述多模态数据的分类;
其中,所述PU对比学习网络将所述融合特征与原型ck进行合并操作得到样本对Zi;基于所述样本对Zi构建无偏风险估计函数,即PU对比学习损失函数;根据所述PU对比学习损失函数优化所述PU对比学习网络;
将所述融合特征与原型ck进行合并操作得到样本对Zi,包括:
通过部分标记正样本XP的融合特征OP与正类原型cP计算得到正样本对 未标记样本XU的融合特征OU与未标签原型cU计算得到样本对 其中ck={cP,cU};
检测及输出模块,用于将所述多模态数据输入到训练后的无偏分类模型中,输出所述多模态数据所属的类别,包括:
将所述多模态数据输入到所述特征提取与融合网络中,生成一个融合特征Oi;
计算所述融合特征Oi与所述多模态特征增强的原型网络中各个原型ck在嵌入空间中的欧几里德距离,得到样本分类的概率分布pφ;
根据所述概率分布pφ判定所述多模态数据所属的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410354820.4A CN117951632B (zh) | 2024-03-27 | 2024-03-27 | 基于多模态原型网络的pu对比学习异常检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410354820.4A CN117951632B (zh) | 2024-03-27 | 2024-03-27 | 基于多模态原型网络的pu对比学习异常检测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117951632A CN117951632A (zh) | 2024-04-30 |
CN117951632B true CN117951632B (zh) | 2024-07-02 |
Family
ID=90798336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410354820.4A Active CN117951632B (zh) | 2024-03-27 | 2024-03-27 | 基于多模态原型网络的pu对比学习异常检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117951632B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738314A (zh) * | 2020-06-09 | 2020-10-02 | 南通大学 | 基于浅层融合的多模态图像能见度检测模型的深度学习方法 |
CN114913379A (zh) * | 2022-06-08 | 2022-08-16 | 西安电子科技大学 | 基于多任务动态对比学习的遥感图像小样本场景分类方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11907337B2 (en) * | 2018-11-16 | 2024-02-20 | Google Llc | Multimodal image classifier using textual and visual embeddings |
US20230117980A1 (en) * | 2021-10-14 | 2023-04-20 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for graph prototypical networks for few-shot learning on attributed networks |
CN115153572A (zh) * | 2022-06-30 | 2022-10-11 | 华中科技大学 | 一种小样本场景下的心电异常检测与识别方法及*** |
CN115452957B (zh) * | 2022-09-01 | 2024-04-12 | 北京航空航天大学 | 基于注意力原型网络的小样本金属损伤识别方法 |
CN116028884A (zh) * | 2022-11-28 | 2023-04-28 | 天津科技大学 | 一种小样本下基于原型网络的车辆换道风险评估方法 |
CN116047418A (zh) * | 2023-01-03 | 2023-05-02 | 电子科技大学 | 基于小样本的多模态雷达有源欺骗干扰识别方法 |
CN116704330A (zh) * | 2023-04-26 | 2023-09-05 | 中国人民解放军战略支援部队信息工程大学 | 一种基于元学习的多模态遥感数据地物分类方法 |
CN117150340A (zh) * | 2023-08-28 | 2023-12-01 | 广西大学 | 一种道岔转辙机小样本故障诊断方法及装置 |
CN117153393B (zh) * | 2023-08-30 | 2024-07-12 | 哈尔滨工业大学 | 一种基于多模态融合的心血管疾病风险预测方法 |
CN117392473A (zh) * | 2023-10-30 | 2024-01-12 | 齐鲁工业大学(山东省科学院) | 基于多模态原型网络的可解释医学图像分类*** |
-
2024
- 2024-03-27 CN CN202410354820.4A patent/CN117951632B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738314A (zh) * | 2020-06-09 | 2020-10-02 | 南通大学 | 基于浅层融合的多模态图像能见度检测模型的深度学习方法 |
CN114913379A (zh) * | 2022-06-08 | 2022-08-16 | 西安电子科技大学 | 基于多任务动态对比学习的遥感图像小样本场景分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117951632A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109949317B (zh) | 基于逐步对抗学习的半监督图像实例分割方法 | |
CN112529042B (zh) | 一种基于双重注意力多示例深度学习的医学图像分类方法 | |
CN109063565B (zh) | 一种低分辨率人脸识别方法及装置 | |
CN114048568A (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN107220663B (zh) | 一种基于语义场景分类的图像自动标注方法 | |
CN112036276A (zh) | 一种人工智能视频问答方法 | |
CN110675421A (zh) | 基于少量标注框的深度图像协同分割方法 | |
CN114255371A (zh) | 一种基于组件监督网络的小样本图像分类方法 | |
CN117290730A (zh) | 一种个体情绪识别模型的优化方法 | |
Shuai et al. | Multi-source feature fusion and entropy feature lightweight neural network for constrained multi-state heterogeneous iris recognition | |
CN117690178B (zh) | 一种基于计算机视觉的人脸图像识别方法与*** | |
CN115169386A (zh) | 一种基于元注意力机制的弱监督增类活动识别方法 | |
CN117593666A (zh) | 一种极光图像的地磁台站数据预测方法及*** | |
CN117951632B (zh) | 基于多模态原型网络的pu对比学习异常检测方法及*** | |
CN116503753A (zh) | 一种基于多模态空域变换网络的遥感图像场景分类方法 | |
CN114862868B (zh) | 基于ct灌注源数据的脑卒中最终梗死区分割方法 | |
CN115810127A (zh) | 基于监督和自监督联合对比学习的小样本图像分类方法 | |
CN115661539A (zh) | 一种嵌入不确定性信息的少样本图像识别方法 | |
CN115240271A (zh) | 基于时空建模的视频行为识别方法与*** | |
CN115392474A (zh) | 一种基于迭代优化的局部感知图表示学习方法 | |
CN114997331A (zh) | 基于度量学习的小样本关系分类方法及*** | |
CN117496126B (zh) | 基于关键词的影像自动定位***及方法 | |
CN113408463B (zh) | 一种基于距离度量的细胞图像小样本分类*** | |
CN113326739B (zh) | 基于时空注意力网络的在线学习参与度评估方法及评估***、设备、存储介质 | |
Lin et al. | Regulating Balance Degree for More Reasonable Visual Question Answering Benchmark |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |