CN114548281A - 一种基于无监督自适应权重的心脏数据异常检测方法 - Google Patents

一种基于无监督自适应权重的心脏数据异常检测方法 Download PDF

Info

Publication number
CN114548281A
CN114548281A CN202210168082.5A CN202210168082A CN114548281A CN 114548281 A CN114548281 A CN 114548281A CN 202210168082 A CN202210168082 A CN 202210168082A CN 114548281 A CN114548281 A CN 114548281A
Authority
CN
China
Prior art keywords
data
encoder
loss
low
reconstruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210168082.5A
Other languages
English (en)
Inventor
曾宪华
陈素心
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210168082.5A priority Critical patent/CN114548281A/zh
Publication of CN114548281A publication Critical patent/CN114548281A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明请求保护一种基于无监督自适应权重的心脏数据异常检测方法,包括:构造基于自适应权重优化的变分自编码器,提取并平衡不同层次数据之间的特征;构造高斯核密度估计模型,处理复杂任务输入数据的密度估计任务,进行异常检测;在自编码器的输入和输出之间构造自适应重构损失,约束自编码器能够正确学习心脏测值数据的特征;在潜空间的低维表示和相应层对应的重构数据之间构造自适应重构损失,保留特征从高维到低维的数据一致性;在输入数据和输出数据之间构造自适应重构损失;在损失函数中构造数据低维特征的数据分布的KL散度以优化采样样本和生成样本之间的差异。本发明在训练比例更少的情况下,得到更优的检测结果。

Description

一种基于无监督自适应权重的心脏数据异常检测方法
技术领域
本发明属于医学数据异常检测方法,结合深度自编码器及高斯核密度估计模型对心脏异常数据进行检测。
背景技术
心脏异常检测能够帮助医生快速有效识别异常的病例,降低漏检误检的机率。传统的异常检测方法在原始数据空间中计算数据距离和密度来评估离群点数据,这具有一定的局限性,尤其是在处理复杂的高维数据时。而基于深度学习的方法可以通过多层网络将高维数据映射到潜在空间中,并提取数据的低维表示特征预测异常。此外,深度学习方法相对于浅层方法往往具有更强大的泛化能力,更能模拟真实数据分布,并且不用显式地构造特征。但是目前基于深度学习的异常检测忽视了潜在空间中各层低维表示具有不一样的价值,效果和准确率仍有提升的空间。
由于当前基于变分自编码器的异常检测算法没有关注到不同层低维表示的优化权重,利用基于无监督自适应权重变分自编码器的心脏疾病异常检测方法自适应平衡编码器和解码器中不同层对应的重构损失,避免模型的无差异性学习和倾向性学习。另外,将编码器中的低维表示、输入与输出层对应的相对欧式距离输入到高斯核密度模型中进行正常数据的建模,再根据阈值预测异常,从而提高心脏疾病异常检测的准确率。
经过检索,申请公开号CN110279411A,一种心脏数据异常检测方法,包括:实时采集多模态心脏数据,并对心脏数据进行预处理;将预处理后的心脏数据进行截止频率小于等于5HZ的低通滤波处理;对去除高频噪声的心脏数据进行离散小波滤波处理,修正基线漂移;根据修正基线漂移的心脏数据,获取数据波形中波峰以及波谷的位置,并根据波峰以及波谷的位置以及心脏数据的采样率,获取波峰之间的时间间隔数值;根据波峰之间的时间间隔,计算心脏体征数据;对心脏体征数据进行模数转换,得到心脏数字数据;通过人工智能再学习和贝叶斯模型对心脏数字数据进行判断,确定异常情况;本发明解决现有技术对心肺数据的采集检测出现异常误差的问题,从而实现提高心脏数据的检测准确率。该专利通过贝叶斯模型对心脏数据进行判断,本发明采用深度学习模型中的变分自编码器学习正常心脏数据的分布,其拥有更强大的无监督建模能力,能够充分学习到心脏数据中不同层级的语义特征,并且基于概率的高斯混合模型能够更加精准地检出心脏异常数据,从而提高异常检测的性能。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种基于无监督自适应权重的心脏数据异常检测方法。本发明的技术方案如下:
一种基于无监督自适应权重的心脏数据异常检测方法,其包括以下步骤:
1)、将心脏测值数据x输入变分自编码器,通过变分自编码器提取输入数据x 的潜空间分布,并通过解码器将变分自编码器得到的数据分布生成重构的心脏测值数据x′,以此来进行无监督的数据特征提取;
2)、在变分自编码器的输入数据x和输出数据x′之间构造重构损失,即x和 x′的均方误差损失,约束自编码器以无监督方式学习心脏测值的数据特征;
3)、在潜空间的低维表示和相应层对应的重构数据之间构造重构损失,即隐含层输入输出之间的均方误差损失,保留图像特征从高维到低维的数据一致性;
4)、构造重构损失的自适应正则项Δ,即增强损失较小的重构损失,减弱损失较大的重构损失,通过梯度优化自动学习不同重构损失的权重参数;
5)、在损失函数中构造数据低维特征的数据分布的Kullback-Leibler散度以优化采样样本z和生成样本x′之间的差异;
6)、对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。
进一步的,所述步骤1)中将心脏测值数据x输入变分自编码器,通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,具体包括:
编码器将输入数据x映射为潜在空间的多层低维表示hlatent,并将得到的最后一层低维表示记为h,最后一层低维表示h的数据分布映射用均值μ和方差σ表示,然后将从该分布中随机采样数据得到z送入解码器,得到与编码器对应的多层低维表示的重构数据h′latent,最终得到与输入数据x对应的重构数据x′。
进一步的,所述步骤1)的过程定义如下:
h=fe(x,θ)
μ,σ=fh(h,θ)
z=fs(μ,σ,θ)
x′=gd(z,φ)
其中,θ是自编码器通过心脏测值数据训练后得到的模型参数,fe表示编码器的正向计算,fh表示获取编码器的隐层数据分布,fs表示编码器的采样过程。
进一步的,所述步骤2)中通过构造输入数据x和重构数据x′之间的重构损失来约束自编码器的优化,以对模型的重构数据进行全局优化,该重构损失的定义为:
Lio=||x-x′||2
进一步的,所述步骤3)中通过构造潜空间的低维表示和相应层对应的重构数据之间的自适应重构损失Llatent,保留图像特征从高维到低维的数据一致性,自适应重构损失Llatent定义如下:
Figure BDA0003517391520000031
Llatent包括了自编码器中每一层输出的重构损失。len(hlatent)表示潜在空间中编码器和解码器对应的低维表示的组数,
Figure BDA0003517391520000041
表示编码器中的每一层低维表示,
Figure BDA0003517391520000042
表示解码器中的每一层低维表示。
进一步的,所述步骤4)中构造自适应重构损失正则项,即增强损失较小的重构损失,减弱损失较大的重构损失,自适应重构损失正则项定义如下:
Figure BDA0003517391520000043
其中,l和l′表示编码器和解码器中不同层对应的低维表示,merge_loss定义如下:
Figure BDA0003517391520000044
进一步的,所述步骤5)中在损失函数中构造数据低维特征的数据分布的KL 散度(相对熵)以优化采样样本z和生成样本x′之间的差异,损失函数定义如下:
Figure BDA0003517391520000045
其中σi表示方差,μi表示均值,n表示数据的个数。
进一步的,所述步骤6)中对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测,具体包括:高斯核密度估计模型根据编码器获取心脏测值数据的低维表示h,并将其和输入数据x、自编码器的输出数据x′一同输入高斯核密度估计模型,该过程定义如下:
Figure BDA0003517391520000046
est_input=h+re_euclidean(x,x′)
Figure BDA0003517391520000047
其中est_input表示输入数据x、自编码器的输出数据x′以及x的低维表示h 构造而成的高斯核密度估计模型的入参,re_euclidean表示相对欧式距离,fb(y) 表示高斯核密度估计模型、Kb分别表示核密度函数,b是核函数的bandwidth, K是非负的高斯核函数。
本发明的优点及有益效果如下:
本发明创新点:1)自适应权重的提出。自适应权重平衡了潜在空间中不同层对应低维表示的重构误差的重要性,从而避免了无差异学习。此外,自适应权重防止模型在训练的过程中忽略损失较小的特征,从而避免了倾向性学习。2) 采用将基于自适应权重的变分自编码器和高斯核密度函数相结合的方式,将变分自编码器中得到的低维表示和输入与输出的相对欧氏距离送入核函数中进行建模,从而进行有效的异常检测。
该方法通过自适应策略平衡不同层次神经网络对应的重构损失,避免了基于变分自编码器的异常检测的无差异性学习和倾向性学习,从而使心脏异常检测结果具备更高的F1分数。
附图说明
图1是本发明提供优选实施例网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
将心脏测值数据x输入变分自编码器,通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,以此来进行无监督的数据特征提取;在自编码器的输入数据x和输出数据x′之间构造重构损失,即x和x′的均方误差损失,约束自编码器能够以无监督方式正确学习心脏测值的数据特征;在潜空间的低维表示和相应层对应的重构数据之间构造重构损失,即隐含层输入输出之间的均方误差损失,以增强模型对不同层次特征的充分利用,保留图像特征从高维到低维的数据一致性;构造重构损失的自适应正则项,即增强损失较小的重构损失,减弱损失较大的重构损失,通过梯度优化自动学习不同重构损失的权重参数,以避免模型的无差异性学习和倾向性学习;在损失函数中构造数据低维特征的数据分布的 Kullback-Leibler(KL)散度以优化采样样本z和生成样本x′之间的差异,提高自编码器输出结果的准确性和多样性;对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。
下面将详细说明本发明的技术方案:
一种基于无监督自适应权重变分自编码器的心脏疾病异常检测方法,包括:
将心脏测值数据x输入变分自编码器,通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,以此来进行无监督的数据特征提取。
在自编码器的输入数据x和输出数据x′之间构造重构损失,即x和x′的均方误差损失,约束自编码器能够以无监督方式正确学习心脏测值的数据特征。
在潜空间的低维表示和相应层对应的重构数据之间构造重构损失,即隐含层输入输出之间的均方误差损失,以增强模型对不同层次特征的充分利用,保留图像特征从高维到低维的数据一致性。
构造重构损失的自适应正则项,即增强损失较小的重构损失,减弱损失较大的重构损失,通过梯度优化自动学习不同重构损失的权重参数,以避免模型的无差异性学习和倾向性学习。
在损失函数中构造数据低维特征的数据分布的Kullback-Leibler(KL)散度以优化采样样本z和生成样本x′之间的差异,提高自编码器输出结果的准确性和多样性。
对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。
进一步的,其所述自适应权重变分自编码器,通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据 x′,以此来进行无监督的数据特征提取。具体的,编码器将输入数据x映射为潜在空间的多层低维表示hlatent,并将得到的最后一层低维表示记为h。最后一层低维表示h的数据分布映射为均值μ和方差σ表示,然后将从该分布中随机采样数据得到z送入解码器,得到与编码器对应的多层低维表示的重构数据h′latent,最终得到与输入数据x对应的重构数据x′。该过程定义如下:
h=fe(x,θ)
μ,σ=fh(h,θ)
z=fs(μ,σ,θ)
x′=gd(z,φ)
其中,θ是自编码器通过心脏测值数据训练后得到的模型参数,fe表示编码器的正向计算,fh表示获取编码器的隐层数据分布,fs表示编码器的采样过程。
进一步的,其所述输入数据x和重构数据x′之间的重构损失被用来约束自适应权重变分自编码器,该优化是一种全局优化,只关心优化的最终结果。该重构损失的定义为:
Lio=||x-x′||2
进一步的,其所述通过构造潜空间的低维表示和相应层对应的重构数据之间的自适应重构损失Llatent,增强模型对不同层次特征的充分利用,保留特征从高维到低维的数据一致性。该重构损失定义如下:
Figure BDA0003517391520000071
Llatent包括了自编码器中每一层输出的重构损失。
进一步的,其所述在不同层重构损失之间构造自适应重构损失正则项Δ,即增强损失较小的重构损失,减弱损失较大的重构损失,以避免模型的无差异性学习和倾向性学习。自适应重构损失正则项定义如下:
Figure BDA0003517391520000081
其中,l和l′表示编码器和解码器中不同层对应的低维表示,merge_loss定义如下:
Figure BDA0003517391520000082
进一步的,其所述在损失函数中构造数据低维特征的数据分布的 Kullback-Leibler(KL)散度以优化采样样本z和生成样本x′之间的差异,提高自编码器输出结果的准确性和多样性。该损失函数定义如下:
Figure BDA0003517391520000083
其中σi表示方差,μi表示均值,n表示数据的个数
进一步的,其所述对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。具体的,高斯核密度估计模型根据编码器获取心脏测值数据的低维表示h,并将其和输入数据 x、自编码器的输出数据x′一同输入高斯核密度估计模型。该过程定义如下:
Figure BDA0003517391520000084
est_input=h+re_euclidean(x,x′)
Figure BDA0003517391520000085
其中est_input表示输入数据x、自编码器的输出数据x′以及x的低维表示h 构造而成的高斯核密度估计模型的入参,re_euclidean表示相对欧式距离,fb(y) 表示高斯核密度估计模型、Kb分别表示核密度函数,b是核函数的bandwidth, K是非负的高斯核函数。
步骤一:构造自适应权重变分自编码器
通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,以此来进行无监督的数据特征提取。具体的,编码器将输入数据x映射为潜在空间的多层低维表示hlatent,并将得到的最后一层低维表示记为h。最后一层低维表示h的数据分布映射为均值μ和方差σ表示,然后将从该分布中随机采样数据得到z送入解码器,得到与编码器对应的多层低维表示的重构数据h′latent,最终得到与输入数据x对应的重构数据x′。该过程定义如下:
h=fe(x,θ)
μ,σ=fh(h,θ)
z=fs(μ,σ,θ)
x′=gd(z,φ)
其中,θ是自编码器通过心脏测值数据训练后得到的模型参数,fe表示编码器的正向计算,fh表示获取编码器的隐层数据分布,fs表示编码器的采样过程。
步骤二:构造输入数据x和重构数据x′之间的重构损失
输入数据x和重构数据x′之间的重构损失被用来约束自适应权重变分自编码器,该优化是一种全局优化,只关心优化的最终结果。该重构损失的定义为:
Lio=||x-x′||2
步骤三:构造自编码器不同层次输入输出之间的重构损失
通过构造潜空间的低维表示和相应层对应的重构数据之间的自适应重构损失Llatent,增强模型对不同层次特征的充分利用,保留特征从高维到低维的数据一致性。该重构损失定义如下:
Figure BDA0003517391520000101
Llatent包括了自编码器中每一层输出的重构损失。
步骤四:构造自适应重构损失正则项
在不同层重构损失之间构造自适应重构损失正则项Δ,即增强损失较小的重构损失,减弱损失较大的重构损失,以避免模型的无差异性学习和倾向性学习。自适应重构损失正则项定义如下:
Figure BDA0003517391520000102
其中,l和l′表示编码器和解码器中不同层对应的低维表示,merge_loss定义如下:
Figure BDA0003517391520000103
其中,len(hlatent)表示潜在空间中编码器和解码器对应的低维表示的组数,
Figure BDA0003517391520000104
表示编码器中的每一层低维表示,
Figure BDA0003517391520000105
表示解码器中的每一层低维表示。
步骤五:构造KL散度
在损失函数中构造数据低维特征的数据分布的Kullback-Leibler(KL)散度以优化采样样本z和生成样本x′之间的差异,提高自编码器输出结果的准确性和多样性。该损失函数定义如下:
Figure BDA0003517391520000106
其中σi表示方差,μi表示均值,n表示数据的个数
步骤六:对高斯核密度估计模型进行建模并进行异常检测
对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。具体的,高斯核密度估计模型根据编码器获取心脏测值数据的低维表示h,并将其和输入数据x、自编码器的输出数据x′一同输入高斯核密度估计模型。该过程定义如下:
Figure BDA0003517391520000111
est_input=h+re_euclidean(x,x′)
Figure BDA0003517391520000112
其中est_input表示输入数据x、自编码器的输出数据x′以及x的低维表示h 构造而成的高斯核密度估计模型的入参,re_euclidean表示相对欧式距离,fb(y) 表示高斯核密度估计模型、Kb分别表示核密度函数,b是核函数的bandwidth, K是非负的高斯核函数。
综上所述,本发明的创新和优势:
本发明提出的一种基于无监督自适应权重的心脏数据异常检测方法,可以实现心脏疾病中异常的检测,本方法相较于其它方法,在训练比例较低的情况下效果更优:
本发明提出的一种基于无监督自适应权重的心脏数据异常检测方法,使用自适应的方式平衡不同层对应的重构损失,避免了基于变分自编码器的异常检测的无差异性学习和倾向性学习:
本发明提出的一种基于无监督自适应权重的心脏数据异常检测方法,结合了基于自适应权重的变分自编码器和高斯核密度函数,使模型进行有效的异常检测:
本发明提出的一种基于无监督自适应权重的心脏数据异常检测方法,能提升异常检测的精度和召回率,具有重要的实际意义:
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (8)

1.一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,包括以下步骤:
1)、将心脏测值数据x输入变分自编码器,通过变分自编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,以此来进行无监督的数据特征提取;
2)、在变分自编码器的输入数据x和输出数据x′之间构造重构损失,即x和x′的均方误差损失,约束自编码器以无监督方式学习心脏测值的数据特征;
3)、在潜空间的低维表示和相应层对应的重构数据之间构造重构损失,即隐含层输入输出之间的均方误差损失,保留图像特征从高维到低维的数据一致性;
4)、构造重构损失的自适应正则项,即增强损失较小的重构损失,减弱损失较大的重构损失,通过梯度优化自动学习不同重构损失的权重参数;
5)、在损失函数中构造数据低维特征的数据分布的Kullback-Leibler散度以优化采样样本z和生成样本x′之间的差异;
6)、对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测。
2.根据权利要求1所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤1)中将心脏测值数据x输入变分自编码器,通过编码器提取输入数据x的潜空间分布,并通过解码器将编码器得到的数据分布生成重构的心脏测值数据x′,具体包括:
编码器将输入数据x映射为潜在空间的多层低维表示hlatent,并将得到的最后一层低维表示记为h,最后一层低维表示h的数据分布映射用均值μ和方差σ表示,然后将从该分布中随机采样数据得到z送入解码器,得到与编码器对应的多层低维表示的重构数据h′latent,最终得到与输入数据x对应的重构数据x′。
3.根据权利要求2所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤1)的过程定义如下:
h=fe(x,θ)
μ,σ=fh(h,θ)
z=fs(μ,σ,θ)
x′=gd(z,φ)
其中,θ是自编码器通过心脏测值数据训练后得到的模型参数,fe表示编码器的正向计算,fh表示获取编码器的隐层数据分布,fs表示编码器的采样过程。
4.根据权利要求2所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤2)中通过构造输入数据x和重构数据x′之间的重构损失来约束自编码器的优化,以对模型的重构数据进行全局优化,该重构损失的定义为:
Lio=||x-x′||2
5.根据权利要求4所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤3)中通过构造潜空间的低维表示和相应层对应的重构数据之间的自适应重构损失Llatent,保留特征从高维到低维的数据一致性,重构损失Llatent定义如下:
Figure FDA0003517391510000021
Llatent包括了自编码器中每一层输出的重构损失。len(hlatent)表示潜在空间中编码器和解码器对应的低维表示的组数,
Figure FDA0003517391510000022
表示编码器中的每一层低维表示,
Figure FDA0003517391510000023
表示解码器中的每一层低维表示。
6.根据权利要求5所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤4)中构造自适应重构损失正则项
Figure FDA0003517391510000024
即增强损失较小的重构损失,减弱损失较大的重构损失,自适应重构损失正则项定义如下:
Figure FDA0003517391510000031
其中,l和l′表示编码器和解码器中不同层对应的低维表示,merger_loss定义如下:
Figure FDA0003517391510000032
7.根据权利要求6所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤5)中在损失函数中构造数据低维特征的数据分布的KL散度相对熵以优化采样样本z和生成样本x′之间的差异,损失函数定义如下:
Figure FDA0003517391510000033
其中σi表示方差,μi表示均值,n表示数据的个数。
8.根据权利要求6所述的一种基于无监督自适应权重的心脏数据异常检测方法,其特征在于,所述步骤6)中对高斯和密度估计模型建模,通过高斯核密度估计模型来拟合数据中的正常样本,并通过该模型进行异常样本的检测,具体包括:高斯核密度估计模型根据编码器获取心脏测值数据的低维表示h,并将其和输入数据x、自编码器的输出数据x′一同输入高斯核密度估计模型,该过程定义如下:
Figure FDA0003517391510000034
est_input=h+re_euclidean(x,x′)
Figure FDA0003517391510000035
其中est_input表示输入数据x、自编码器的输出数据x′以及x的低维表示h构造而成的高斯核密度估计模型的入参,re_euclidean表示相对欧式距离,fb(y)表示高斯核密度估计模型、Kb分别表示核密度函数,b是核函数的bandwidth,K是非负的高斯核函数。
CN202210168082.5A 2022-02-23 2022-02-23 一种基于无监督自适应权重的心脏数据异常检测方法 Pending CN114548281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210168082.5A CN114548281A (zh) 2022-02-23 2022-02-23 一种基于无监督自适应权重的心脏数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210168082.5A CN114548281A (zh) 2022-02-23 2022-02-23 一种基于无监督自适应权重的心脏数据异常检测方法

Publications (1)

Publication Number Publication Date
CN114548281A true CN114548281A (zh) 2022-05-27

Family

ID=81676721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210168082.5A Pending CN114548281A (zh) 2022-02-23 2022-02-23 一种基于无监督自适应权重的心脏数据异常检测方法

Country Status (1)

Country Link
CN (1) CN114548281A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152752A (zh) * 2023-10-30 2023-12-01 之江实验室 一种自适应权重的视觉深度特征重建方法和装置
CN117173543A (zh) * 2023-11-02 2023-12-05 天津大学 一种肺腺癌和肺结核的混合图像重构方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152752A (zh) * 2023-10-30 2023-12-01 之江实验室 一种自适应权重的视觉深度特征重建方法和装置
CN117152752B (zh) * 2023-10-30 2024-02-20 之江实验室 一种自适应权重的视觉深度特征重建方法和装置
CN117173543A (zh) * 2023-11-02 2023-12-05 天津大学 一种肺腺癌和肺结核的混合图像重构方法及***
CN117173543B (zh) * 2023-11-02 2024-02-02 天津大学 一种肺腺癌和肺结核的混合图像重构方法及***

Similar Documents

Publication Publication Date Title
CN109086824B (zh) 一种基于卷积神经网络的海底底质声呐图像分类方法
CN111307453B (zh) 一种基于多信息融合的传动***故障诊断方法
CN109522857B (zh) 一种基于生成式对抗网络模型的人数估计方法
CN114548281A (zh) 一种基于无监督自适应权重的心脏数据异常检测方法
CN110657984B (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN109389171B (zh) 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法
CN112001270A (zh) 基于一维卷积神经网络的地面雷达自动目标分类识别方法
CN114842267A (zh) 基于标签噪声域自适应的图像分类方法及***
CN107729926A (zh) 一种基于高维空间变换的数据扩增方法、机器识别***
CN114120041A (zh) 一种基于双对抗变分自编码器的小样本分类方法
CN114004333A (zh) 一种基于多假类生成对抗网络的过采样方法
CN114548199A (zh) 一种基于深度迁移网络的多传感器数据融合方法
CN115496720A (zh) 基于ViT机制模型的胃肠癌病理图像分割方法及相关设备
CN113344099B (zh) 一种基于变分自编码器的机械设备退化点识别方法和***
CN113208641A (zh) 基于三维多分辨注意力胶囊网络的肺结节辅助诊断方法
CN117788810A (zh) 一种无监督语义分割的学习***
CN116862885A (zh) 超声图像病变检测的分割引导去噪知识蒸馏方法及装置
CN117150402A (zh) 基于生成式对抗网络的电力数据异常检测方法及模型
CN116703850A (zh) 基于领域自适应的医学图像分割方法
CN116758212A (zh) 基于自适应去噪算法的3d重建方法、装置、设备及介质
CN114462617A (zh) 一种基于蒸馏机制的数据异常检测方法
CN114267063A (zh) 一种无监督的人脸伪造评估方法
CN113592028A (zh) 多专家分类委员会机器测井流体识别的方法及***
CN111008584B (zh) 一种模糊自组织神经网络的电能质量量测缺失修复方法
CN114495265A (zh) 多跨域场景下基于活动图加权的人体行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination