CN113876331B - 一种面向心电信号的半监督房颤自动检测*** - Google Patents

一种面向心电信号的半监督房颤自动检测*** Download PDF

Info

Publication number
CN113876331B
CN113876331B CN202111250533.1A CN202111250533A CN113876331B CN 113876331 B CN113876331 B CN 113876331B CN 202111250533 A CN202111250533 A CN 202111250533A CN 113876331 B CN113876331 B CN 113876331B
Authority
CN
China
Prior art keywords
atrial fibrillation
model
sample
training
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111250533.1A
Other languages
English (en)
Other versions
CN113876331A (zh
Inventor
***
张鹏
陈昱廷
刘宇航
林凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Wuhan Zhongke Medical Technology Industrial Technology Research Institute Co Ltd
Original Assignee
Huazhong University of Science and Technology
Wuhan Zhongke Medical Technology Industrial Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology, Wuhan Zhongke Medical Technology Industrial Technology Research Institute Co Ltd filed Critical Huazhong University of Science and Technology
Priority to CN202111250533.1A priority Critical patent/CN113876331B/zh
Publication of CN113876331A publication Critical patent/CN113876331A/zh
Application granted granted Critical
Publication of CN113876331B publication Critical patent/CN113876331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/352Detecting R peaks, e.g. for synchronising diagnostic apparatus; Estimating R-R interval
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/361Detecting fibrillation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Cardiology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Surgery (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Veterinary Medicine (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明公开了一种面向心电信号的半监督房颤自动检测***,属于心电信号分析技术领域,包括:心电信号处理模块、训练模块和房颤检测模块;其中,训练模块用于对采集到的若干心电信号,分别输入到心电信号处理模块中,得到对应的RR间期样本;采集到的若干心电信号包括有房颤的心电信号和无房颤的心电信号;仅部分心电信号携带房颤标签;将各RR间期样本以及部分房颤标签输入到房颤信号检测模型中进行半监督训练,能够在保证检测准确率的前提下,以较小的工作量对模型进行训练,大大提高开发效率。

Description

一种面向心电信号的半监督房颤自动检测***
技术领域
本发明属于心电信号分析技术领域,更具体地,涉及一种面向心电信号的半监督房颤自动检测***。
背景技术
房颤是最常见的快速性心律失常疾病,可能会导致危险的并发症并增加心力衰竭和中风的风险。临床上,通常由临床医生使用心电图(ECG)监测识别房颤信号来诊断房颤。房颤按发作时长可分为三种类型:阵发性、持续性和永久性房颤。其中阵发性房颤是间歇性的心律不齐,诊断困难,特别是当心电图监测时间较短时更容易漏检。因此,临床上需要对受检者进行长期动态心电图监测以提高阵发性房颤的诊断率。然而长期动态心电监测会产生大量的心电数据,在这些心电记录中识别房颤发作是一项非常费力且主观性很强的任务,大量的数据诊断会加重临床医生的工作负担,同时可能导致房颤的误诊率增加。因此,从心电信号记录中自动可靠地检测房颤在临床实践中具有重要意义。
近年来,国内外已经开发了许多用于自动房颤检测的机器学习方法。在这些方法中,传统的机器学习算法如支持向量机和随机森林等,通过使用适当的特征提取方法,例如近似熵和心电形态特征等,能够达到临床可接受的房颤检测性能。与传统的机器学习算法相比,深度学习方法可以自动提取特征而不需要人工进行设计,可以有效提高房颤检测的精度。但是,尽管基于深度学习的方法可以在房颤检测中获得良好且稳定的性能,但它们需要大量的标记数据进行训练,准确标记大量的长期心电数据非常困难且耗时,开发效率及实用性较低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供一种面向心电信号的半监督房颤自动检测***,其目的在于在保证检测准确率的前提下,以较小的工作量对模型进行训练,提高开发效率。
为了实现上述目的,本发明提出了一种面向心电信号的半监督房颤自动检测***,包括:
心电信号处理模块,用于对采集到的心电信号进行R峰检测,得到RR间期序列;对RR间期序列进行预处理,并基于滑动窗口对预处理后的RR间期序列从其对应心电信号的初始时刻开始进行采样,得到RR间期样本;
训练模块,用于对采集到的若干心电信号,分别输入到心电信号处理模块中,得到对应的RR间期样本;其中,采集到的若干心电信号包括有房颤的心电信号和无房颤的心电信号;仅部分心电信号携带房颤标签;将各RR间期样本以及部分房颤标签输入到房颤信号检测模型中进行半监督训练;上述房颤信号检测模型为机器学习模型;
房颤检测模块,用于将待检测的心电信号输入到心电信号处理模块中,得到待检测的心电信号的RR间期样本,并将所得RR间期样本分别输入到房颤信号检测模型中,以检测其是否为房颤信号,从而确定待检测的心电信号是否为包含房颤信号,以及房颤发生的时刻。
进一步优选地,携带房颤标签的心电信号所对应的RR间期样本记为标记样本;未携带房颤标签的部分心电信号所对应的RR间期样本记为未标记样本;
上述训练模块通过以下方式对房颤信号检测模型中进行半监督训练:
将标记样本输入到房颤信号检测模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异,对房颤信号检测模型进行训练;
将未标记样本输入到房颤信号检测模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到房颤信号检测模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异,对房颤信号检测模型进行训练;
重复上述过程进行迭代,直至迭代次数达到预设迭代次数。
进一步优选地,房颤信号检测模型为CNN-LSTM模型。
进一步优选地,房颤信号检测模型包括第一子模型和第二子模型;第一子模型和第二子模型均为机器学习模型;
携带房颤标签的心电信号所对应的RR间期样本记为标记样本;未携带房颤标签的部分心电信号所对应的RR间期样本记为未标记样本;
上述训练模块通过以下方式对房颤信号检测模型中进行半监督训练:
将标记样本输入到第一子模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异,对第一子模型进行训练;
将未标记样本输入到第一子模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到第二子模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异,对第一子模型进行训练;
计算当前第二子模型的参数和第一子模型的参数的指数移动平均值,以对第二子模型的参数进行更新;
重复上述过程,直至迭代次数达到预设迭代次数;
房颤信号检测模型训练完成后,第一子模型用于检测输入的RR间期样本是否为房颤信号。
进一步优选地,上述第一子模型和第二子模型均为CNN-LSTM模型。
进一步优选地,上述训练模块通过以下方式对伪预测概率进行更新:
对上一迭代过程中所有未标记样本的伪预测概率,分别计算其中未标记样本为各心电信号类别的概率值的平均值,并得到最大平均值pm;其中,心电信号类别包括非房颤信号和房颤信号;
计算各心电信号类别所对应的偏差;其中,第l种心电信号类别所对应的偏差
Figure BDA0003322448730000041
Figure BDA0003322448730000042
为未标记样本为第l种心电信号类别的概率值的平均值;
将当前迭代过程中所得的伪预测概率中未标记样本为各信号类别的概率值与其对应的偏差相加,以对伪预测概率进行更新。
进一步优选地,上述第一子模型和第二子模型均包括dropout层,用于对模型中输入样本的隐藏特征再次进行扰动,以实现一致性正则化。
进一步优选地,通过高斯噪声增强法对未标记样本进行扰动。
进一步优选地,在每一轮迭代之前,将标记样本中的若干间期值替换为未标记样本中对应位置上的间期值,以增强标记数据的多样性,提高房颤信号检测模型的泛化能力并防止过度拟合。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
1、本发明提供了一种面向心电信号的半监督房颤自动检测***,在模型的训练过程中仅部分心电信号携带房颤标签,通过对房颤信号检测模型中进行半监督训练,能够在保证检测准确率的前提下,以较小的工作量对模型进行训练,大大提高开发效率。
2、本发明所提供的面向心电信号的半监督房颤自动检测***,对房颤信号检测模型中进行半监督训练分为交替进行的两个阶段,首先基于标记样本对房颤信号检测模型进行有监督训练;然后基于未标记样本结合无监督学***衡房颤信号检测模型对于房颤与非房颤的预测结果,使得模型能够迅速收敛,并大大提高了模型的准确度。
3、本发明所提供的面向心电信号的半监督房颤自动检测***中,房颤信号检测模型包括第一子模型和第二子模型;具有标记的样本通过有监督学***衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异进一步对第一子模型进行训练,并对无监督学***衡房颤信号检测模型对于房颤与非房颤的预测结果,大大提高了模型的准确度。
4、本发明所提供的面向心电信号的半监督房颤自动检测***,通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新,保证了模型对各个类别的判定是均衡的,消除了模型对特定类别的偏向性,同时也能保证模型迅速收敛,大大提高了模型的准确度。
附图说明
图1为本发明所提供的一种面向心电信号的半监督房颤自动检测***的结构示意图;
图2为本发明所提供的CNN-LSTM模型的架构图;
图3为本发明本发明所提供的训练方式与及其他两种训练方式在病例水平上的房颤检测效果对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
为了实现上述目的,本发明提出了一种面向心电信号的半监督房颤自动检测***,如图1所示,包括:
心电信号处理模块,用于对采集到的心电信号进行R峰检测,得到RR间期序列;对RR间期序列进行预处理,并基于滑动窗口对预处理后的RR间期序列从其对应心电信号的初始时刻开始进行采样,得到RR间期样本;
具体地,不规则的RR间期是临床上诊断房颤存在的关键指标之一,本发明首先从原始心电图记录中提取RR间期序列,用于模型训练和房颤检测。心电信号处理模块对RR间期序列进行预处理时,当RR间期数值有异常值时,若异常值连续出现的次数小于等于预设次数,则对RR间期序列中的各异常的RR间期数值进行插值修正;若异常值连续出现的次数大于预设次数,则舍弃RR间期序列中出现异常时刻以及该异常时刻之前预设时间段内的RR间期数值。本实施例中,上述预设次数取值为5次,上述预设时间段取值为1分钟。对RR间期序列中异常的RR间期数值全部置0,当RR间期序列中异常的RR间期数值连续出现的次数大于5次时,这一段连续异常数值中首次出现异常以及该异常之前一分钟内所有的RR间期数值全部不再使用,舍弃掉。当RR间期序列中异常的RR间期数值连续出现的次数小于等于5次时,采用异常的RR间期数值前后两个非异常的RR间期数值的平均值修正当前异常的RR间期数值。心电信号处理模块基于滑动窗口对预处理后的RR间期序列从对应心电信号的初始时刻开始进行采样时,每完成一次提取后,将滑动窗口向后移动一个窗口尺寸进行下一次提取,实现不重叠采样,当RR间期序列的剩余数据长度小于滑动窗口的尺寸时,将其舍弃。本实施例中,RR间期提取和噪声检测由DMSCardioSca12SatelliteSystem(DMSHolterCompany,Stateline,NV,USA)中制造商的特定商业软件完成,一个RR间期代表一次心跳。然后使用长度为90个RR间期的非重叠滑动窗口将提取的RR间期序列分割为样本。只要样本的RR间期序列中包含有房颤发作的RR间期,该样本就被归类为房颤信号,否则被归类为非房颤信号。此外,去除含有噪声的样本。
训练模块,用于对采集到的若干心电信号,分别输入到心电信号处理模块中,得到对应的RR间期样本;其中,采集到的若干心电信号包括有房颤的心电信号和无房颤的心电信号;仅部分心电信号携带房颤标签;将各RR间期样本以及部分房颤标签输入到房颤信号检测模型中进行半监督训练;上述房颤信号检测模型为机器学习模型;
房颤检测模块,用于将待检测的心电信号输入到心电信号处理模块中,得到待检测的心电信号的RR间期样本,并将所得RR间期样本分别输入到房颤信号检测模型中,以检测其是否为房颤信号,从而确定待检测的心电信号是否为包含房颤信号,以及房颤发生的时刻。需要说明的是,在待检测的心电信号检测完成后,还可以进行校正以提高检测精度,具体过程如下:对于时间上连续的四个样本,当其中的三个样本的预测标签相同而另外的一个与众不同时,对这一个与众不同的样本的预测标签进行修改。校正后即完成了房颤自动检测,确定了待检测的心电信号是否包含房颤信号,以及房颤发生的时间。
具体地,携带房颤标签的心电信号所对应的RR间期样本记为标记样本;未携带房颤标签的部分心电信号所对应的RR间期样本记为未标记样本。
优选地,本实施例中,房颤信号检测模型为CNN-LSTM模型。CNN-LSTM模型的架构如图2所示,由卷积层、LSTM层和全连接(FC)层组成。卷积层用于提取数据中的空间和时间特征,LSTM层用于序列分析,全连接层可以将特征映射到抽象空间并进行有效分离。长度为90个RR间期的序列样本作为输入首先进入卷积层,两个卷积层从输入样本中提取特征,然后使用双向LSTM(Bi-LSTM)来学习特征的前向和后向信息。每层网络的输出应用ReLU函数进行激活,输出层使用softmax函数,并在网络中使用比率为0.2的dropout层用于防止过拟合并提高模型的泛化能力。
在一种可选实施方式1下,上述训练模块通过以下方式对房颤信号检测模型中进行半监督训练:
将标记样本输入到房颤信号检测模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异,对房颤信号检测模型进行训练;本实施例中,预测概率包括样本为房颤信号的概率值和样本为非房颤信号的概率值;将概率值较大的房颤信号类别作为样本的预测标签。优选地,在标记样本输入到房颤信号检测模型之前可以先通过高斯噪声进行扰动,以确保正负样本之间的数量平衡。
将未标记样本输入到房颤信号检测模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到房颤信号检测模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异,对房颤信号检测模型进行训练;具体地,本实施例中通过高斯噪声增强法对未标记样本进行扰动。未标记样本在进入房颤信号检测模型之前先通过高斯噪声进行扰动,同时利用dropout层对房颤信号检测模型中样本的隐藏特征再次进行扰动,以实现一致性正则化。
重复上述过程进行迭代,直至迭代次数达到预设迭代次数;本实施例中预设迭代次数取值为40。
其中,为了保证模型对各个类别的判定是均衡的,消除模型对特定类别的偏向性;同时也能保证模型迅速收敛,提高模型的准确度,上述训练模块通过以下方式对伪预测概率进行更新:
对上一迭代过程中所有未标记样本的伪预测概率,分别计算其中未标记样本为各心电信号类别的概率值的平均值,并得到最大平均值pm;具体地,
Figure BDA0003322448730000091
其中,
Figure BDA0003322448730000092
为未标记样本为第l种心电信号类别的概率值的平均值;L为心电信号的类别数;心电信号类别包括非房颤信号和房颤信号;
计算各心电信号类别所对应的偏差;其中,第l种心电信号类别所对应的偏差
Figure BDA0003322448730000093
将当前迭代过程中所得的伪预测概率中未标记样本为各信号类别的概率值与其对应的偏差相加,以对伪预测概率进行更新。
具体地,更新后的第i个未标记样本为第l种心电信号类别的概率值
Figure BDA0003322448730000094
Pi,l为更新前的第i个未标记样本为第l种心电信号类别的概率值。
具体地,以二分类为例,此时,心电信号类别仅包括非房颤信号和房颤信号,此时,上述训练模块通过以下方式对伪预测概率进行更新:
对上一迭代过程中所有未标记样本的伪预测概率,分别计算其中未标记样本为房颤信号的概率值的平均值
Figure BDA0003322448730000095
以及未标记样本为非房颤信号的概率值的平均值
Figure BDA0003322448730000096
Figure BDA0003322448730000097
大于
Figure BDA0003322448730000098
则将当前迭代过程中所得的伪预测概率中未标记样本为非房颤信号的概率值与
Figure BDA0003322448730000099
相加,以对伪预测概率进行更新;
否则,将当前迭代过程中所得的伪预测概率中未标记样本为房颤信号的概率值与
Figure BDA00033224487300000910
相加,以对伪预测概率进行更新。
需要说明的是,记偏差
Figure BDA0003322448730000101
根据每个训练轮次结束后未标记数据的预测结果计算,依据预测结果中正负样本平均概率的差异,更新下一个轮迭代中每个未标记样本的伪预测;而在第一轮迭代过程中,δ=0;同样的,对于多分类场景,令δl=0。
具体地,分别对更新后的伪预测概率中未标记样本为房颤信号的概率值和未标记样本为非房颤信号的概率值进行锐化,具体公式如下:
Figure BDA0003322448730000102
其中,
Figure BDA0003322448730000103
为锐化后的第i个未标记样本为第l种心电信号类别的概率值;
Figure BDA0003322448730000104
为更新后的第i个未标记样本为第l种心电信号类别的概率值;γ为超参数;L为心电信号的类别数,本实施例中取值为2。在模型训练开始时设置γ=2,在一定训练轮次之后设置γ=5以使预测的伪标签接近Dirac分布。
需要说明的是,半监督学习方法中,一个常见的基本假设是分类器的决策边界不应该通过边缘数据分布的高密度区域,实现这一点的一种方法是要求分类器对未标记的数据输出低熵预测,锐化就是为了减少预测分布的熵。
在可选实施方式2下,房颤信号检测模型可以包括第一子模型和第二子模型;其中,第一子模型和第二子模型均为机器学习模型;在房颤信号检测模型训练完成后,第一子模型用于检测输入的RR间期样本是否为房颤信号。具体地,上述训练模块通过以下方式对房颤信号检测模型中进行半监督训练:
将标记样本输入到第一子模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异(分类损失),对第一子模型进行训练;优选地,在标记样本输入到第一子模型之前可以先通过高斯噪声进行扰动,以确保正负样本之间的数量平衡;
将未标记样本输入到第一子模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到第二子模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异(一致性损失),对第一子模型进行训练;
计算当前第二子模型的参数和第一子模型的参数的指数移动平均值,以对第二子模型的参数进行更新;
重复上述过程,直至迭代次数达到预设迭代次数;本实施例中预设迭代次数取值为40。
分类损失和一致性损失的权重分别反映了有监督学***滑系数,在前30个训练轮次左右设置为0.97,随后第一子模型收敛趋于稳定后设置为0.99,有助于模型可靠地收敛;θ2为第二子模型模型的参数;θ1为第一子模型模型的参数。
其中,扰动、更新和锐化的方式同上述可选实施方式1,这里不做赘述。
需要说明的是,训练轮次或者说迭代轮次,指的是所有无标签样本训练完一遍。因为无标签样本远远多于有标签的样本,每个轮次是将有标签的样本与一部分无标签的样本进行半监督训练,直到无标签的样本都训练完。在上述过程中,未标记样本在一个训练轮次(epoch)中只使用一次,而具有标记的样本在同一训练轮次中多次加入模型训练。
优选地,上述第一子模型和第二子模型均为CNN-LSTM模型。进一步地,上述第一子模型和第二子模型均包括dropout层,用于对模型中输入样本的隐藏特征再次进行扰动,以实现一致性正则化。
对于上述两种实施方式,优选地,在每一轮迭代之前,将标记样本中的若干间期值替换为未标记样本中对应位置上的间期值,以增强标记数据的多样性,提高房颤信号检测模型的泛化能力并防止过度拟合。
需要说明的是,上述训练过程可以在每一个迭代过程中直接采用所有的标记样本和未标记样本进行训练,直至达到预设迭代次数;也可以将标记样本和未标记样本同时分为多个批次,本实施例中有监督部分的批次大小为64个样本,无监督部分的批次大小为128个样本,在不同迭代过程中,分别采用不同批次下的样本进行训练,重复上述过程进行训练直到遍历所有样本,以提高训练效率。
为了进一步说明本发明所提供的面向心电信号的半监督房颤自动检测***的性能,本发明在真实的临床数据集上进行了实验评估。具体的,实验中使用的数据集包括在心功能检查中心采集的1000例阵发性房颤患者的长期动态12导联心电图记录,所有数据都由心脏病专家进行了标注,并由三名资深心脏病专家进一步审核。对1000例阵发性房颤病例,随机抽取600例数据用于模型训练,其余400例数据用于测试。
在训练集中,本发明随机选取了10名患者构建标记数据集,本发明所提供的半监督房颤自动检测***中的训练方式使用少量标记数据(10例)和大量未标记数据(590例)来训练房颤信号检测模型(深度学习模型)。与此同时,训练方式1中使用相同的少量标记数据(10例)来训练房颤信号检测模型,即部分训练;训练方式2中使用与半监督方法相同的所有数据(600例)进行训练,且所有数据均进行了标记,即全部训练。
上述三种训练方式在病例水平上的测试ROC曲线如图3所示;从图中可以看出,本发明所提供的半监督房颤自动检测***的房颤检测准确率为97.3%。相比训练方式1的准确率93.5%,提高了3.8%。相比训练方式2的准确率98.1%,仅降低了0.8%。与训练方式1相比,本发明所需要的数据标注工作量相同,但房颤检测性能确显著提升。而与训练方式2相比,本发明提出的方法数据标记工作量减少了98.33%,但仍能保证相当的房颤检测性能,仅需对10例病人的长期动态心电图进行标注就能达到临床上可以接受的房颤检测性能。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种面向心电信号的半监督房颤自动检测***,其特征在于,包括:
心电信号处理模块,用于对心电信号进行R峰检测,得到RR间期序列;对所述RR间期序列进行预处理,并基于滑动窗口对预处理后的RR间期序列从其对应心电信号的初始时刻开始进行采样,得到RR间期样本;
训练模块,用于对采集到的若干心电信号,分别输入到心电信号处理模块中,得到对应的RR间期样本;所述采集到的若干心电信号包括有房颤的心电信号和无房颤的心电信号;仅部分心电信号携带房颤标签;将各RR间期样本以及部分房颤标签输入到房颤信号检测模型中进行半监督训练;所述房颤信号检测模型为机器学习模型;
房颤检测模块,用于将待检测的心电信号输入到所述心电信号处理模块中,得到待检测的心电信号的RR间期样本,并将所得RR间期样本输入到所述房颤信号检测模型中,以检测其是否为房颤信号,从而确定待检测的心电信号是否为包含房颤信号,以及房颤发生的时刻;
其中,携带房颤标签的心电信号所对应的RR间期样本记为标记样本;未携带房颤标签的部分心电信号所对应的RR间期样本记为未标记样本;
所述训练模块通过以下方式对所述房颤信号检测模型进行半监督训练:
将标记样本输入到所述房颤信号检测模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异,对所述房颤信号检测模型进行训练;
将未标记样本输入到所述房颤信号检测模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到所述房颤信号检测模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异,对所述房颤信号检测模型进行训练;
重复上述过程进行迭代,直至迭代次数达到预设迭代次数。
2.根据权利要求1所述的半监督房颤自动检测***,其特征在于,所述房颤信号检测模型为CNN-LSTM模型。
3.根据权利要求1所述的半监督房颤自动检测***,其特征在于,所述房颤信号检测模型包括第一子模型和第二子模型;所述第一子模型和所述第二子模型均为机器学习模型;
所述训练模块通过以下方式对所述房颤信号检测模型进行半监督训练:
将标记样本输入到所述第一子模型中,得到标记样本的预测概率,进而得到标记样本的预测标签;通过最小化标记样本的预测标签与房颤标签的差异,对所述第一子模型进行训练;
将未标记样本输入到所述第一子模型中,得到未标记样本的预测概率;对未标记样本进行扰动后输入到所述第二子模型中,得到未标记样本的伪预测概率;通过平衡伪预测概率中未标记样本为房颤信号和非房颤信号的概率值来对伪预测概率进行更新;对更新后的伪预测概率进行锐化后,通过最小化未标记样本的预测概率和锐化后的伪预测概率之间的差异,对所述第一子模型进行训练;
计算当前所述第二子模型的参数和所述第一子模型的参数的指数移动平均值,以对所述第二子模型的参数进行更新;
重复上述过程,直至迭代次数达到预设迭代次数;
房颤信号检测模型训练完成后,所述第一子模型用于检测输入的RR间期样本是否为房颤信号。
4.根据权利要求3所述的半监督房颤自动检测***,其特征在于,所述第一子模型和所述第二子模型均为CNN-LSTM模型。
5.根据权利要求3或4所述的半监督房颤自动检测***,其特征在于,所述第一子模型和所述第二子模型均包括dropout层。
6.根据权利要求1或3所述的半监督房颤自动检测***,其特征在于,所述训练模块通过以下方式对伪预测概率进行更新:
对上一迭代过程中所有未标记样本的伪预测概率,分别计算其中未标记样本为各心电信号类别的概率值的平均值,并得到最大平均值pm;所述心电信号类别包括非房颤信号和房颤信号;
计算各心电信号类别所对应的偏差;其中,第l种心电信号类别所对应的偏差
Figure FDA0003685220530000031
Figure FDA0003685220530000032
为未标记样本为第l种心电信号类别的概率值的平均值;
将当前迭代过程中所得的伪预测概率中未标记样本为各信号类别的概率值与其对应的偏差相加,以对伪预测概率进行更新。
7.根据权利要求1或3所述的半监督房颤自动检测***,其特征在于,通过高斯噪声增强法对未标记样本进行扰动。
8.根据权利要求1或3所述的半监督房颤自动检测***,其特征在于,在每一轮迭代之前,将标记样本中的若干间期值替换为未标记样本中对应位置上的间期值。
CN202111250533.1A 2021-10-26 2021-10-26 一种面向心电信号的半监督房颤自动检测*** Active CN113876331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111250533.1A CN113876331B (zh) 2021-10-26 2021-10-26 一种面向心电信号的半监督房颤自动检测***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111250533.1A CN113876331B (zh) 2021-10-26 2021-10-26 一种面向心电信号的半监督房颤自动检测***

Publications (2)

Publication Number Publication Date
CN113876331A CN113876331A (zh) 2022-01-04
CN113876331B true CN113876331B (zh) 2022-08-02

Family

ID=79013616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111250533.1A Active CN113876331B (zh) 2021-10-26 2021-10-26 一种面向心电信号的半监督房颤自动检测***

Country Status (1)

Country Link
CN (1) CN113876331B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114305442B (zh) * 2022-01-20 2024-03-29 复旦大学 基于滑动窗编码的房颤发生起止点的检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111772628A (zh) * 2020-07-16 2020-10-16 华中科技大学 一种基于深度学习的心电信号房颤自动检测***
CN111920405A (zh) * 2020-09-15 2020-11-13 齐鲁工业大学 一种房颤信号识别***及方法
WO2021062025A2 (en) * 2019-09-24 2021-04-01 Baylor College Of Medicine Learning from biological systems how to regularize machine-learning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021062025A2 (en) * 2019-09-24 2021-04-01 Baylor College Of Medicine Learning from biological systems how to regularize machine-learning
CN111772628A (zh) * 2020-07-16 2020-10-16 华中科技大学 一种基于深度学习的心电信号房颤自动检测***
CN111920405A (zh) * 2020-09-15 2020-11-13 齐鲁工业大学 一种房颤信号识别***及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A deep learning approach for real-time detection of atrial fibrillation;Rasmus S. Andersen等;《Expert Systems With Applications》;20180814;第115卷;第465–473页 *
基于机器学习的心律失常识别问题关键技术的研究;杨萍;《中国优秀博硕士学位论文全文数据库(博士)医药卫生科技辑》;20210615(第6期);第13-88页 *

Also Published As

Publication number Publication date
CN113876331A (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
US10758139B2 (en) Automatic method to delineate or categorize an electrocardiogram
CN107822622B (zh) 基于深度卷积神经网络的心电图诊断方法和***
CN110890155B (zh) 一种基于导联注意力机制的多类心律失常检测方法
CN107837082B (zh) 基于人工智能自学习的心电图自动分析方法和装置
CN110840402B (zh) 一种基于机器学习的房颤信号识别方法及***
WO2019100565A1 (zh) 基于人工智能自学习的动态心电图分析方法和装置
CN110638430B (zh) 级联神经网络ecg信号心律失常分类模型的搭建方法
CN110522444B (zh) 一种基于Kernel-CNN的心电信号识别分类方法
CN110974214A (zh) 一种基于深度学习的自动心电图分类方法、***及设备
CN110558975B (zh) 一种心电信号分类方法及***
CN106108880B (zh) 一种心拍自动识别方法及***
CN113995419B (zh) 一种基于心跳节律信号的房颤发生风险预测***及其应用
CN113057648A (zh) 一种基于复合lstm结构的ecg信号分类方法
CN112617849A (zh) 一种基于cnn+lstm的心房颤动检测与分类方法
CN112932498A (zh) 一种基于深度学习的强泛化能力的t波形态分类***
CN113876331B (zh) 一种面向心电信号的半监督房颤自动检测***
CN114970637A (zh) 一种轻量级基于深度学习的心律失常分类方法
CN115470832A (zh) 一种基于区块链的心电信号数据处理方法
CN113509186A (zh) 基于深度卷积神经网络的ecg分类***与方法
CN115736944A (zh) 一种基于短时单导联心电信号的房颤检测模型mcnn-blstm
CN114366116B (zh) 一种基于Mask R-CNN网络及心电图的参数获取方法
CN114224351B (zh) 一种基于融合多个深度学习模型的房颤识别方法
CN113171102B (zh) 基于持续深度学习的ecg数据分类方法
CN112022149B (zh) 一种基于心电信号的房颤检测方法
CN115105084A (zh) 基于深度学习的心搏定位分类方法、***、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant