CN111528832A - 一种心律失常分类方法及其有效性验证方法 - Google Patents

一种心律失常分类方法及其有效性验证方法 Download PDF

Info

Publication number
CN111528832A
CN111528832A CN202010469921.8A CN202010469921A CN111528832A CN 111528832 A CN111528832 A CN 111528832A CN 202010469921 A CN202010469921 A CN 202010469921A CN 111528832 A CN111528832 A CN 111528832A
Authority
CN
China
Prior art keywords
weight
capsule
network
capsules
arrhythmia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010469921.8A
Other languages
English (en)
Other versions
CN111528832B (zh
Inventor
李向奎
李栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202010469921.8A priority Critical patent/CN111528832B/zh
Publication of CN111528832A publication Critical patent/CN111528832A/zh
Application granted granted Critical
Publication of CN111528832B publication Critical patent/CN111528832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Psychiatry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Signal Processing (AREA)
  • Physiology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Cardiology (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明公开一种心律失常分类方法,包括以下步骤:步骤s1:对心电图序列数据进行预处理,得到大小为MAXTIME的序列节拍;步骤s2:建立权重胶囊网络;步骤s3:训练权重胶囊网络,并将序列节拍馈送到权重胶囊网络进行特征提取,输出得到数量为MAXTIME、维度可设定的节拍;步骤s4:将步骤s3中得到的节拍输入Seq2Seq模型,并将Seq2Seq模型的输出结果施加Softmax函数,最后得到心律失常不同类别的概率。本发明还公开一种心律失常分类方法的有效性验证方法。本发明利用权重胶囊网络和Seq2Seq模型结合的方法,从而自动进行心律失常分类并对其有效性进行验证,本发明节约人力资源、智能化程度高且解决了现有技术处理不平衡数据集时性能较差的问题。

Description

一种心律失常分类方法及其有效性验证方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种心律失常分类方法及其有效性验证方法。
背景技术
心电图作为临床上诊断心血管疾病的重要技术,其心电信号的准确分析和诊断对于心血管疾病的治疗起着关键作用,但常规的心电图分析方法不仅耗时,而且医生的数量无法满足海量的心电分析,因此计算机辅助诊断对于提高心电分析的效率起到了关键作用。
随着神经网络分析算法的出现和发展,国内外出现了多种用神经网络技术将心电图分类,进行心电图分析的研究其中深度卷积神经网络的典型应用包括吴恩达等学者在2017年构建的一个34层深度卷积神经网络,实现了14种心律不齐的识别,其模型分类效果超过了专家;2018年,Sajad等在提出卷积网络和Seq2Seq模型结合来解决心律失常分类中样本间的不平衡;2019年,Ribeiro等学者基于12导联心电图,训练了一个更加贴近临床的深度卷积神经网络对心律失常进行检测;随后,Zachi Attia Martin Zihlmann 等分别使用深度卷积神经网络和24层卷积神经网络与3层LSTM网络结合的方法对房颤进行分类;此外,还有研究基于区域聚集网络,改进卷积神经网络用于心电图特征检测;也有研究利用深层网络对心律失常进行注释。
与传统的机器学***衡以及大样本量,而在心律失常分类中普遍存在样本类间不平衡的问题,很难构建类间平衡的样本,这就导致了基于深度卷积网络对心律失常分类的性能不佳。
导致心律失常分类性能不佳的另一方面原因是由于深度卷积神经网络存在信息丢失的问题。Sabour等提出胶囊网络试图来解决这个卷积网络信息丢失的问题,胶囊是多个标量的集合,是一个多维向量,某个实体的位置、方向、尺寸、速度、颜色等可以使用激活胶囊的维度来表征这些关系、姿态、状态特征。使用胶囊网络替卷积神经网络,可以缓解卷积神经网络存在的信息丢失的问题,同时胶囊网络也存在压缩函数饱和、胶囊模长影响路由的一致性的问题。Dilin Wang等人在2018年和Jaewoong Choi等人在2019年提出的胶囊变种模型并取得了不错的效果,但他们的胶囊变种模型并没有缓解压缩函数的饱的问题。Dilin Wang等人对产生预测向量的权重矩阵进行了标准化,并使用输入单位向量来解决胶囊模长影响路由的一致性的问题,这个方法让输入决定输出,并没有考虑到输出向量存在的概率。
发明内容
本发明旨在提供一种使用权重胶囊网络和Seq2Seq模型的自动心跳分类方法来解决数据不平衡的局限性问题。
为达到上述目的,本发明是采用以下技术方案实现的:
一种心律失常分类方法,包括以下步骤:
步骤s1:对心电图序列数据进行预处理,得到大小为MAXTIME的序列节拍;
步骤s2:建立权重胶囊网络,所述权重胶囊网络由一个一维卷积层和一个权重胶囊层组成,第一层的一维卷积层卷积核大小为f*1,过滤器的个数为n,滑动步长为d,激活函数为Relu函数,第二层权重胶囊层,通过权重胶囊间的动态路由实现权重胶囊输入权重胶囊维度的变换,输入是k个p维的权重胶囊,输出的是h个g维的权重胶囊,所述权重胶囊网络使用S-S压缩函数,所述S-S压缩函数如以下表达式所示:
Figure BDA0002513959450000031
Figure BDA0002513959450000032
Figure BDA0002513959450000033
其中,μαβ为超参,
Figure BDA0002513959450000034
为权重胶囊j的输出向量,
Figure BDA0002513959450000035
为胶囊j的输入向量。当α=β=μ=0时,S-S压缩函数变为Squash函数;当α=0.1时,设置μ=15、β=15;
步骤s3:训练权重胶囊网络,并将序列节拍馈送到权重胶囊网络进行特征提取,输出得到数量为MAXTIME、维度可设定的节拍;
步骤s4:将步骤s3中得到的节拍输入Seq2Seq模型,并将Seq2Seq模型的输出结果施加Softmax函数,最后得到心律失常不同类别的概率。
优选的,在步骤s2中,权重胶囊网络是由预测向量
Figure BDA0002513959450000036
与权重系数
Figure BDA0002513959450000037
加权求和后,乘以权重kj,最后经过S-S压缩函数产生输出。
进一步的,在步骤s2中,对两个权重胶囊的一致性
Figure BDA0002513959450000038
乘以一个权重fij,通过权重fij,把预测权重胶囊
Figure BDA0002513959450000039
压缩到一个范围,权重系数
Figure BDA00025139594500000310
会从初始值开始迭代,通过测量每个高一层权重胶囊j的当前输出vj和低一层权重胶囊i 的预测值
Figure BDA00025139594500000311
直接的一致性,所述的一致性是简单的
Figure BDA00025139594500000312
在计算出所有权重胶囊i连接到更高层权重胶囊得到的新的耦合值前,加到初始逻辑值
Figure BDA0002513959450000041
上,所述权重fij是由预测值
Figure BDA0002513959450000042
产生的权重。
进一步的,权重胶囊间的动态路由计算的伪代码如下所示:
Figure BDA0002513959450000043
优选的,所述Seq2Seq模型包括解码器和编码器,所述Seq2Seq模型的架构采用双向递归神经网络BiRNN。
进一步的,所述双向递归神经网络BiRNN由前向网络和后向网络组成,在步骤s4中,前向网络及后向网络的输出的加权和作为双向递归神经网络BiRNN的输出结果,也即是Seq2Seq模型的输出结果。
进一步的,在步骤s4中,一个Softmax函数被施加到Seq2Seq模型的输出结果上,由此将其转换为心律失常不同类别的概率的向量p∈Rc,其中
Figure 100002_1
表示类别的数量,p表示每个类别的概率。
优选的,在步骤s2中,所述权重胶囊网络中的f为整数,取值范围2-9; n为整数,取值范围是10-256;d为整数,取值范围为1-2,k是整数,取值范围2-256;p是整数,取值范围是5-128;h是整数,取值范围为2-256;g 为整数,取值范围为2-512。
一种心律失常分类方法的有效性验证方法,包括以下步骤:
步骤a1:从MIT-BIH数据库下载数据,根据AAMI推荐分组把所下载的数据拆分为训练集和测试集,然后对数据进行预处理;
步骤a2:在SMOTE方法下对权重胶囊网络与Seq2Seq模型结合的网络进行评估,从而确定网络结构,获得心律失常分类模型;
步骤a3:在不使用SMOTE方法的情形下评估所述权重胶囊网络与Seq2Seq 模型处理样本类间不平衡的能力;
步骤a4:在减少所述训练集样本的情形下重复步骤a3。
本发明具有以下优点:
1、本发明中所提出的权重胶囊网络,不仅继承了胶囊模型少样本学习多样本、可解释性的优点,而且缓解了胶囊模型存在的梯度饱和、预测胶囊影响耦合系数的问题,这为破解深度学习在医疗领域的应用提供了一个很好的方案;
2、本发明中所采用的权重胶囊网络结合Seq2Seq模型的方法,在提升性能的同时,解决了现有心律失常分类技术心电图研究中样本类间不均衡的问题。
附图说明
图1为Squash函数导数图以及Squash函数图;
图2为在使用S-S压缩函数和权重后的权重胶囊网络模型示意图;
图3为权重胶囊网络结构示意图;
图4为权重胶囊网络与Seq2Seq模型结合的结构示意图;
图5为心电图预处理流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
步骤s1:对心电图序列数据进行预处理,得到大小为MAXTIME的序列节拍。
对心电图序列数据进行预处理包括为了从给定的ECG信号中提取ECG搏动,便于模型训练,所以如图5所示,对数据进行预处理,一些简单的步骤如下:
(1)将给定的ECG信号归一化为介于零和一之间的范围。
(2)找到心电图相应注释文件的ECG R峰的t波集合。
(3)根据提取的t波将连续的ECG信号分成一系列心跳,并为每个心跳匹配心跳的注释。
(4)将每个心跳调整为预定的固定长度,得到大小为MAXTIME ECG的序列节拍。需要注意的是,这些用于节拍提取的预处理步骤非常简单,并没有对改变任何形式的过滤或除噪方法。
步骤s2:建立权重胶囊网络,如图3所示,所述权重胶囊网络由一个一维卷积层和一个权重胶囊层组成,第一层的一维卷积层卷积核大小为f*1,过滤器的个数为n,滑动步长为d,激活函数为Relu函数,第二层权重胶囊层,通过权重胶囊间的动态路由实现权重胶囊输入权重胶囊维度的变换,输入是k个p维的权重胶囊,输出的是h个g维的权重胶囊,并且使用S-S (Sigmoid-Squash)压缩函数。
具体地,f为整数,取值范围2-9;n为整数,取值范围是10-256;d为整数,取值范围为1-2,k是整数,取值范围2-256;p是整数,取值范围是 5-128;h是整数,取值范围为2-256;g为整数,取值范围为2-512。
通过多次试验我们认为,在具体实施中,第一层的一维卷积层卷积核大小为3*1,过滤器的个数为28,滑动步长为1,激活函数为Relu函数,第二层权重胶囊层,通过权重胶囊间的动态路由实现权重胶囊输入权重胶囊维度的变换,输入是10个28维的权重胶囊,输出的是3个128维的权重胶囊,在以上设置的情形下能够达到所要的技术效果。
下面为权重胶囊网络的建立思路及流程:
已知现有Squash函数如下:
Figure BDA0002513959450000071
Squash函数保证了胶囊的模长不大于1,并把模长较小的胶囊压缩为0,这个特性使得胶囊具有一定的抗噪能力。与传统激活函数sigmoid相似的是 Squash函数也存在饱和,如图1所示,左边的是Squash函数的导数图,右边的是Squash函数图。
当胶囊模长较大时,压缩函数将产生较小梯度值,使得整个网络学习过程变慢,所导致的结果就是:学习过程基本在深层中完成,无法在浅层进行,同时,权值变化极其微弱。为了减缓因压缩函数所带来的梯度消失程度,结合(prajit et al.2017)swish函数的理念,本发明所提出了一种变种的S-S (Sigmoid-Squash)压缩函数如下所示:
Figure BDA00025139594500000810
Figure BDA0002513959450000081
Figure BDA0002513959450000082
其中,μαβ为超参,
Figure BDA0002513959450000083
为权重胶囊j的输出向量,
Figure BDA0002513959450000084
为胶囊j的输入向量。当α=β=μ=0时,S-S压缩函数变为Squash函数;当α=0.1时,设置μ=15、β=15。
从图1可知,当胶囊的模长太长时,会导致梯度饱和,为解决该问题,本发明参考了(Dilin Wang at al.2018)对权重矩阵Wij标准化从而控制胶囊模长的方法。
如图2所示,与其他胶囊模型不同,本发明所涉及权重胶囊模型是由预测向量
Figure BDA0002513959450000085
与权重系数
Figure BDA0002513959450000086
加权求和后,乘以权重kj,从而把权重胶囊模长控制在某个范围之内,以此减缓输出权重胶囊饱和的程度,最后经过S-S压缩函数产生输出。
这些预测向量都是由低一层胶囊产生,通过胶囊的输出
Figure BDA0002513959450000087
和一个权重矩阵
Figure BDA0002513959450000088
相乘然后再乘预测因子,如下所示:
Figure BDA0002513959450000089
其中cij是由迭代的动态路径过程决定的耦合系数:
Figure BDA0002513959450000091
输出sj产生的权重kj为输出权重:
Figure BDA0002513959450000092
Pj表示第j个胶囊在输出k个胶囊所占的权重∑jPj=1
ej=-τPjlnPj
gj=1-ej
当τ=1时,上述表达式把输出胶囊模长的权重非线性化,并把新的权重固定在[0.5,1]的范围内,当输入接近0或者1时,为1,当输入接近0.4 时,输入为0.5。
重新分配每个输出胶囊的权重,把权重压缩到一个范围内,所以kj趋近与被j等分:
Figure BDA0002513959450000093
为了能够两个权重胶囊的位置和类型决定权重系数,减少预测胶囊模长对两个胶囊一致性的影响,在步骤s2中,对两个权重胶囊的一致性
Figure BDA0002513959450000094
乘以一个权重fij,通过权重fij,把预测权重胶囊
Figure BDA0002513959450000095
压缩到一个范围,权重系数
Figure BDA0002513959450000096
会从初始值开始迭代,通过测量每个高一层权重胶囊j的当前输出vj和低一层权重胶囊i的预测值
Figure BDA0002513959450000097
直接的一致性,所述的一致性是简单的
Figure BDA0002513959450000098
在计算出所有权重胶囊i连接到更高层权重胶囊得到的新的耦合值前,加到初始逻辑值
Figure BDA0002513959450000101
上,所述权重fij是由预测值
Figure BDA0002513959450000102
产生的权重。
与kj的产生的方法相似,由预测值
Figure BDA0002513959450000103
产生的权重fij
Figure BDA0002513959450000104
Figure BDA0002513959450000105
Gij=1-Eij
Figure BDA0002513959450000106
最后输出的fij趋近与被i*j等分。
权重胶囊间的动态路由计算的伪代码如下所示:
Figure BDA0002513959450000107
Figure BDA0002513959450000111
步骤s3:训练权重胶囊网络,并将序列节拍馈送到权重胶囊网络进行特征提取,输出得到数量为MAXTIME、维度可设定的节拍。
在每步的训练/测试模型时,序列(大小为MAXTIME ECG的)节拍被馈送到权重胶囊网络,使用权重胶囊网络特征提取。最后权重胶囊层输出MAXTIME 个维度为
Figure BDA0002513959450000112
(例如,这里我们设置输出的维度为128)。
步骤s4:将步骤s3中得到的节拍输入Seq2Seq模型,并将Seq2Seq模型的输出结果施加Softmax函数,最后得到心律失常不同类别的概率。
Seq2Seq模型(序列到序列模型)是基于编码器-解码器抽象思想设计的, 编码器对输入进行编码序列,而解码器则计算输入序列的每个拍子的类别。编码器实际上是由长短期记忆(LSTM)单位,也称为多对一LSTM。LSTM可以捕获复杂的输入和目标之间的长期短期上下文相关性,这是由于他们捕获了预测目标时对整个观测值的非线性依赖性。本文输入权重胶囊的(时间)序列被馈送到LSTM,然后将LSTM计算出的最后一个隐藏状态视为编码器表示,并且用于初始化解码器的第一个隐藏状态,如图4所示。我们在网络体系结构中使用双向递归神经网络(BiRNN)单元代替了标准LSTM(即RNN),标准 RNN是单向的,因此它们仅限于使用先前的输入状态,为了打破这种局限性,有人提出了BiRNN,它可以处理正向和反向数据。从而,当前状态可以同时访问以前和将来的输入信息。BiRNN由前向网络组成和落后的网络。输入序列以正常时间顺序馈送,t=1,...,T用于正向网络,反之亦然,时间顺序,对于后向网络,t=T,...,1。最后,计算两个网络的输出的加权和作为BiRNN的输出。
上述机制内容可用下列表达式表述:
Figure BDA0002513959450000121
Figure BDA0002513959450000122
Figure BDA0002513959450000123
Figure BDA0002513959450000124
是前向传播网络的隐藏状态和偏置,
Figure BDA0002513959450000125
是反向传播网络的隐藏状态和偏置,
by是双向循环神经网络输出的偏置,xt和yt是双向循环神经网络的输入和输出。
Figure BDA0002513959450000126
Figure BDA0002513959450000127
为前向网络和反向网络的可训练参数
解码器用于生成目标序列逐节拍。类似于编码器,解码器的构建块是多对多的LSTM。解码器获得由编码器生成的输入序列的新表示,以初始化其隐藏状态。它也将相同的给定目标移动了一个并以特殊特征v开头扇区<GO>作为输入。我们应该注意输入(偏移的目标)仅在训练阶段使用,而不适用于测试阶段。然后,一个softmax函数被施加到LSTM的输出以将其转换为概率的向量p∈Rc,其中表示类别的数量(即心跳类型),p表示每个元素属于每个类别的概率。
本发明还包括一种心律失常分类方法的有效性验证方法,包括以下步骤:
步骤a1:从MIT-BIH数据库下载数据,根据AAMI推荐分组把所下载的数据拆分为训练集和测试集,然后对数据进行预处理;
步骤a2:在SMOTE方法下对权重胶囊网络与Seq2Seq模型结合的网络进行评估,从而确定网络结构,获得心律失常分类模型;
步骤a3:在不使用SMOTE方法的情形下评估所述权重胶囊网络与Seq2Seq 模型处理样本类间不平衡的能力;
步骤a4:在减少所述训练集样本的情形下重复步骤a3。
现有的MIT-BIH心律失常数据库是一种广泛带注释的数字ECG数据库,这是一个公开的心律失常数据库,MIT-BIH数据库来自1975年到1979年间 Beth Istae医院心律失常实验室获取的4000多个长期动态心电图数据中的一部分,Beth Istae医院心律失常实验室获取的数据中有60%来自住院患者, MIT-BIH数据库是包含了从4000多条记录中随机选择的23条(MIT-BIH数据库中编号100-124)记录,这23条记录的是心律失常在常规临床使用中可能遇到的各种波形和伪图像的代表样本;另一组具有很好临床意义的25条记录(MIT-BIH数据库中编号从200-234),包括复杂的室性、室上心律失常、传导异常,这些记录中的QSR形态变化或信号质量的特征可能给心律失常分类带来困难;此外MIT-BIH数据库中记录者的分布:男性25位年龄在32-89 岁,女性22位年龄在23-89岁(201和202的记录是来自同一个男性)。
MIT-BIH数据库中每一条记录时长都超过30分钟,并且都是两路信道的 ECG信号,在大多数记录中,上部信号是经过修饰的肢体导联II(MLII),通过将电极放在胸部上获得;下部信号通常是经过修改的导线V1(有时是V2 或V5,有时是V4);至于上信号,电极也放在胸部。MIT-BIH心律失常实验室通常使用此配置。正常QRS复合体通常在上部信号中突出,下信号的引导轴可能与平均心脏电轴几乎正交,但是正常搏动通常是相同的,并且可能几乎是等电的。因此,尽管异位搏动通常会更加突出,但通常很难在较低信号中辨别出正常搏动。
在步骤a2中,使用PhysioNet MIT-BIH心律失常数据库来评估权重胶囊胶囊与Seq2Seq模型结合的性能。根据美国协会AAMI的推荐,本文把MIT-BIH 数据库对心跳节拍分类为五个基本心律失常组。为了避免训练和测试样本可能来自同一患者。我们采用患者间的方法去评估我们的模型。而在患者间分组中,训练和测试集是根据de Chazal等人提出的方案,训练集和测试集由不同患者构建而成。用这种方法,可以把MIT-BIH数据库分为两组记录:DS1 =[101、106、108,109、112、114、115、116、118、119、122、124、201、 203、205、207、208、209、215、220、223,230]和DS2=[100,103,105, 111、113、117、121、123、200、202、210、212、213、214、219、221、222、 228、231、232、233、234]。DS1用于构建分类模型和DS2用于测试模型。
MIT-BIH数据库为了节省文件长度和存储空间,使用了自定义的格式包括(1)头文件[.hea],存储方式ASCII码字符,其由一行或多行ASCII码字符组成。以100.hea为例:
100 2 360 650000
100.dat 212 200 11 1024 995-22131 0 MLII
100.dat 212 200 11 1024 1011 20052 0 V5
#69M 1085 1629 x1
第一行从左到右分别表示:记录编号、心电图导联数,数字化采样频率,心电图点数;第二行从左到右分别表示:记录名编号,数据的存储格式,信息增益,模数转换的分辨率,ADC零值,修正肢体II导联第一个值,校验位,导联编号;第三行代表V5导联的信息,包括记录名编号,数据的存储格式,信息增益,模数转换的分辨率,ADC零值,修正肢体II导联第一个值,校验位,(2)MIT-BIH数据库的数据文件格式为.dat,这样的文件是按二进制存储(3)MIT-BIH数据库的注释文件格式为.art,按二进制存储,注释文件的格式定义较复杂。注释信息包括了R波位置和每个心拍的类型,为了避免分歧,心电图的节拍由两位心脏病学专家对每条记录逐个心拍进行独立标注,这为心跳节拍分类算法的评估提供了很好的保障。注释代码和心拍类型对应关系见下表:
注释代码和心拍类型对应关系
Figure BDA0002513959450000151
Figure BDA0002513959450000161
Figure BDA0002513959450000171
我们使用四种主要措施来评估心律失常分类模型的性能,包括敏感性(SEN),阳性预测值(PPV),特异性(SPEC)(1-False Positive率(FPR))和准确性(ACC)定义如下:
Figure BDA0002513959450000172
Figure BDA0002513959450000173
Figure BDA0002513959450000174
Figure BDA0002513959450000175
其中还有如下表示:TP(真阳性),TN(真阴性),FP(假阳性)和FN(假阴性)
在本发明中对网络进行了最多300个时期的训练,并且初始LSTM隐藏并且单元状态设置为零。所有网络权重通过RMSProp算法更新,批量为20 个,学习率为α=0.001。
实验设计所提出的心律失常检测方法的性能使用MIT-BIH心律失常数据库进行评估,使用患者间和患者内评估方法,MIT-BIH数据库的心跳类别分布不均匀,正常搏动次数远多于其他类别。在机器学***衡和不平衡下进行评估,为了减少类间不平衡问题的影响,SMOTE技术被用于对样本数量较少的类别进行上采样,我们使用SMOTE方法进行过采样后,每个类别(组)中的节拍数几乎达到平衡。
类似于文献中的几篇研究,我们在包括N(正常)的四个心脏周期上导致心律失常分类和束支传导阻滞搏动),S(室上性异位搏动),V(室性异位搏动)和F(N和V节拍)对于患者内的组合,我们总共提取了101,290个心跳,包括N类为90,494拍,S类为2,777拍,V类为7,217拍,F类为802 拍。在训练集DS1中,我们获得了N类45,798次,S类941次和3,782次的 V,测试集DS2,N类为44196拍,S类为1836拍,V类为3216拍。我们在测试阶段没有使用SMOTE方法来进行数据平衡,因为测试集的信息可能存在于训练集中。尽管有的研究中使用这种方法,我们认为结果不是很准确。我们将心跳分为训练和测试数据集后,使用SMOTE算法对训练集数据样本进行处理,处理后的类间数据样本量如下表。
DS1中类间样本量分布:SMOTE方法对样本较少的类进行数据上采样,从而实现DS1中类间样本平衡
Sample size distribution among classes in DS1:SMOTE method is used toconduct data sampling on classes with few samples,so as to realize samplebalance among classes in DS1
Figure BDA0002513959450000181
过采样仅针对患者内范例的训练数据集(针对患者间范例的数据集DS1)和测试数据集中的信息未用于创建合成数据点。因此,对模型的评估过程是可靠的,并且可概括的。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (9)

1.一种心律失常分类方法,其特征在于,包括以下步骤:
步骤s1:对心电图序列数据进行预处理,得到大小为MAXTIME的序列节拍;
步骤s2:建立权重胶囊网络,所述权重胶囊网络由一个一维卷积层和一个权重胶囊层组成,第一层的一维卷积层卷积核大小为f*1,过滤器的个数为n,滑动步长为d,激活函数为Relu函数,第二层权重胶囊层,通过权重胶囊间的动态路由实现权重胶囊输入权重胶囊维度的变换,输入是k个p维的权重胶囊,输出的是h个g维的权重胶囊,所述权重胶囊网络使用S-S压缩函数,所述S-S压缩函数如以下表达式所示:
Figure FDA0002513959440000011
Figure FDA0002513959440000012
Figure FDA0002513959440000013
其中,μαβ为超参,
Figure FDA0002513959440000014
为权重胶囊j的输出向量,
Figure FDA0002513959440000015
为胶囊j的输入向量。当α=β=μ=0时,S-S压缩函数变为Squash函数;当α=0.1时,设置μ=15、β=15;
步骤s3:训练权重胶囊网络,并将序列节拍馈送到权重胶囊网络进行特征提取,输出得到数量为MAXTIME、维度可设定的节拍;
步骤s4:将步骤s3中得到的节拍输入Seq2Seq模型,并将Seq2Seq模型的输出结果施加Softmax函数,最后得到心律失常不同类别的概率。
2.根据权利要求1所述的一种心律失常分类方法,其特征在于:在步骤s2中,权重胶囊网络是由预测向量
Figure FDA0002513959440000016
与权重系数
Figure FDA0002513959440000017
加权求和后,乘以权重kj,最后经过S-S压缩函数产生输出。
3.根据权利要求2所述的一种心律失常分类方法,其特征在于:在步骤s2中,对两个权重胶囊的一致性
Figure FDA0002513959440000022
乘以一个权重fij,通过权重fij,把预测权重胶囊
Figure FDA0002513959440000023
压缩到一个范围,权重系数
Figure FDA0002513959440000024
会从初始值开始迭代,通过测量每个高一层权重胶囊j的当前输出vj和低一层权重胶囊i的预测值
Figure FDA0002513959440000025
直接的一致性,所述的一致性是简单的
Figure FDA0002513959440000026
在计算出所有权重胶囊i连接到更高层权重胶囊得到的新的耦合值前,加到初始逻辑值
Figure FDA0002513959440000027
上,所述权重fij是由预测值
Figure FDA0002513959440000028
产生的熵权重。
4.根据权利要求3所述的一种心律失常分类方法,其特征在于:权重胶囊间的动态路由计算的伪代码如下所示:
Figure FDA0002513959440000021
Figure FDA0002513959440000031
5.根据权利要求1所述的一种心律失常分类方法,其特征在于:所述Seq2Seq模型包括解码器和编码器,所述Seq2Seq模型的架构采用双向递归神经网络BiRNN。
6.根据权利要求5所述的一种心律失常分类方法,其特征在于:所述双向递归神经网络BiRNN由前向网络和后向网络组成,在步骤s4中,前向网络及后向网络的输出的加权和作为双向递归神经网络BiRNN的输出结果,也即是Seq2Seq模型的输出结果。
7.根据权利要求6所述的一种心律失常分类方法,其特征在于:在步骤s4中,一个Softmax函数被施加到Seq2Seq模型的输出结果上,由此将其转换为心律失常不同类别的概率的向量p∈Rc,其中
Figure 1
表示类别的数量,p表示每个类别的概率。
8.根据权利要求1所述的一种心律失常分类方法,其特征在于:在步骤s2中,所述权重胶囊网络中的f为整数,取值范围2-9;n为整数,取值范围是10-256;d为整数,取值范围为1-2,k是整数,取值范围2-256;p是整数,取值范围是5-128;h是整数,取值范围为2-256;g为整数,取值范围为2-512。
9.一种心律失常分类方法的有效性验证方法,其特征在于,包括以下步骤:
步骤a1:从MIT-BIH数据库下载数据,根据AAMI推荐分组把所下载的数据拆分为训练集和测试集,然后对数据进行预处理;
步骤a2:在SMOTE方法下对权重胶囊网络与Seq2Seq模型结合的网络进行评估,从而确定网络结构,获得心律失常分类模型;
步骤a3:在不使用SMOTE方法的情形下评估所述权重胶囊网络与Seq2Seq模型处理样本类间不平衡的能力;
步骤a4:在减少所述训练集样本的情形下重复步骤a3。
CN202010469921.8A 2020-05-28 2020-05-28 一种心律失常分类方法及其有效性验证方法 Active CN111528832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010469921.8A CN111528832B (zh) 2020-05-28 2020-05-28 一种心律失常分类方法及其有效性验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010469921.8A CN111528832B (zh) 2020-05-28 2020-05-28 一种心律失常分类方法及其有效性验证方法

Publications (2)

Publication Number Publication Date
CN111528832A true CN111528832A (zh) 2020-08-14
CN111528832B CN111528832B (zh) 2023-04-18

Family

ID=71969799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010469921.8A Active CN111528832B (zh) 2020-05-28 2020-05-28 一种心律失常分类方法及其有效性验证方法

Country Status (1)

Country Link
CN (1) CN111528832B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113017613A (zh) * 2021-03-03 2021-06-25 四川大学华西医院 基于人工智能的心冲击波信号处理方法及计算机设备
CN113180684A (zh) * 2021-06-03 2021-07-30 哈尔滨理工大学 一种ⅱ导联心电信号分类方法
CN113349791A (zh) * 2021-05-31 2021-09-07 平安科技(深圳)有限公司 异常心电信号的检测方法、装置、设备及介质
CN114886404A (zh) * 2022-07-13 2022-08-12 西南民族大学 一种心律数据分类方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120294935A1 (en) * 2006-04-28 2012-11-22 Dimitrios Zarkadas Process for the precipitation and isolation of 6,6-dimethyl-3-aza-bicyclo [3.1.0] hexane-amide compounds by controlled precipitation and pharmaceutical formulations containing same
CN105748063A (zh) * 2016-04-25 2016-07-13 山东大学齐鲁医院 基于多导联和卷积神经网络的心律失常智能诊断方法
CN108932484A (zh) * 2018-06-20 2018-12-04 华南理工大学 一种基于Capsule Net的人脸表情识别方法
CN109410917A (zh) * 2018-09-26 2019-03-01 河海大学常州校区 基于改进型胶囊网络的语音数据分类方法
CN109567793A (zh) * 2018-11-16 2019-04-05 西北工业大学 一种面向心律不齐分类的ecg信号处理方法
CN109691994A (zh) * 2019-01-31 2019-04-30 英菲泰克(天津)科技有限公司 一种基于心电图的心率监测分析方法
CN110110668A (zh) * 2019-05-08 2019-08-09 湘潭大学 一种基于反馈权重卷积神经网络和胶囊神经网络的步态识别方法
CN110309811A (zh) * 2019-07-10 2019-10-08 哈尔滨理工大学 一种基于胶囊网络的高光谱图像分类方法
CN110598221A (zh) * 2019-08-29 2019-12-20 内蒙古工业大学 利用生成对抗网络构造蒙汉平行语料提高蒙汉翻译质量的方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120294935A1 (en) * 2006-04-28 2012-11-22 Dimitrios Zarkadas Process for the precipitation and isolation of 6,6-dimethyl-3-aza-bicyclo [3.1.0] hexane-amide compounds by controlled precipitation and pharmaceutical formulations containing same
CN105748063A (zh) * 2016-04-25 2016-07-13 山东大学齐鲁医院 基于多导联和卷积神经网络的心律失常智能诊断方法
CN108932484A (zh) * 2018-06-20 2018-12-04 华南理工大学 一种基于Capsule Net的人脸表情识别方法
CN109410917A (zh) * 2018-09-26 2019-03-01 河海大学常州校区 基于改进型胶囊网络的语音数据分类方法
CN109567793A (zh) * 2018-11-16 2019-04-05 西北工业大学 一种面向心律不齐分类的ecg信号处理方法
CN109691994A (zh) * 2019-01-31 2019-04-30 英菲泰克(天津)科技有限公司 一种基于心电图的心率监测分析方法
CN110110668A (zh) * 2019-05-08 2019-08-09 湘潭大学 一种基于反馈权重卷积神经网络和胶囊神经网络的步态识别方法
CN110309811A (zh) * 2019-07-10 2019-10-08 哈尔滨理工大学 一种基于胶囊网络的高光谱图像分类方法
CN110598221A (zh) * 2019-08-29 2019-12-20 内蒙古工业大学 利用生成对抗网络构造蒙汉平行语料提高蒙汉翻译质量的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAITAO ZHANG: "《1D-Convolutional Capsule Network for Hyperspectral Image Classification》", 《IEEE》 *
陈 健: "《基于胶囊网络的汉字笔迹鉴定算法》", 《包装学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113017613A (zh) * 2021-03-03 2021-06-25 四川大学华西医院 基于人工智能的心冲击波信号处理方法及计算机设备
CN113017613B (zh) * 2021-03-03 2022-05-06 四川大学华西医院 基于人工智能的心冲击波信号处理方法及计算机设备
CN113349791A (zh) * 2021-05-31 2021-09-07 平安科技(深圳)有限公司 异常心电信号的检测方法、装置、设备及介质
CN113180684A (zh) * 2021-06-03 2021-07-30 哈尔滨理工大学 一种ⅱ导联心电信号分类方法
CN113180684B (zh) * 2021-06-03 2023-10-24 哈尔滨理工大学 一种ⅱ导联心电信号分类方法
CN114886404A (zh) * 2022-07-13 2022-08-12 西南民族大学 一种心律数据分类方法、装置、电子设备及存储介质
CN114886404B (zh) * 2022-07-13 2022-10-28 西南民族大学 一种电子设备、装置及存储介质

Also Published As

Publication number Publication date
CN111528832B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111528832B (zh) 一种心律失常分类方法及其有效性验证方法
Murugesan et al. Ecgnet: Deep network for arrhythmia classification
CN106725428B (zh) 一种心电信号分类方法及装置
CN109394205B (zh) 一种基于深度神经网络的心电信号分析方法
CN111631705B (zh) 心电异常检测方法、模型训练方法、装置、设备及介质
CN110522444B (zh) 一种基于Kernel-CNN的心电信号识别分类方法
CN106725426A (zh) 一种心电信号分类的方法及***
CN109259756B (zh) 基于非平衡训练的二级神经网络的ecg信号处理方法
CN110638430B (zh) 级联神经网络ecg信号心律失常分类模型的搭建方法
CN111626114A (zh) 基于卷积神经网络的心电信号心律失常分类***
Hussain et al. Efficient ECG signal classification using sparsely connected radial basis function neural network
Zhou et al. Arrhythmia recognition and classification through deep learning-based approach
Allam et al. A deformable CNN architecture for predicting clinical acceptability of ECG signal
Peng et al. ECG signals segmentation using deep spatiotemporal feature fusion U-Net for QRS complexes and R-peak detection
CN110786847B (zh) 心电信号的建库方法和分析方法
CN114224351B (zh) 一种基于融合多个深度学习模型的房颤识别方法
Gaudilliere et al. Generative pre-trained transformer for cardiac abnormality detection
CN115414049A (zh) 一种基于深度神经网络的可穿戴心电图实时诊断***
CN112022140B (zh) 一种心电图的诊断结论自动诊断方法及***
KR20230099195A (ko) 심전도 데이터 및 신체 정보를 이용하는 딥러닝 모델 기반 심장 질환 발병 예측 장치 및 방법
Kumar et al. A cloud application for ecg arrhythmia classification using deep learning and n-square approaches
Vimala et al. Classification of cardiac vascular disease from ECG signals for enhancing modern health care scenario
Rajesh et al. A Silent Cardiac Atrial Fibrillation Detection and Classification using Deep Learning Approach
Salah et al. Cardiac arrhythmia classification by wavelet transform
Sharma et al. Optimized convolutional neural network-based classification of arrhythmia disease using ecg signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant