CN109033990B - 基于类内类间距离的cnn模型心拍分类方法 - Google Patents
基于类内类间距离的cnn模型心拍分类方法 Download PDFInfo
- Publication number
- CN109033990B CN109033990B CN201810708608.8A CN201810708608A CN109033990B CN 109033990 B CN109033990 B CN 109033990B CN 201810708608 A CN201810708608 A CN 201810708608A CN 109033990 B CN109033990 B CN 109033990B
- Authority
- CN
- China
- Prior art keywords
- class
- heart beat
- cnn model
- model
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013178 mathematical model Methods 0.000 claims abstract description 22
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000000747 cardiac effect Effects 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 abstract description 107
- 238000003062 neural network model Methods 0.000 abstract description 2
- 238000009826 distribution Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 11
- 238000000605 extraction Methods 0.000 description 10
- 238000003745 diagnosis Methods 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 206010042600 Supraventricular arrhythmias Diseases 0.000 description 1
- 206010047281 Ventricular arrhythmia Diseases 0.000 description 1
- 206010000891 acute myocardial infarction Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010247 heart contraction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 208000031225 myocardial ischemia Diseases 0.000 description 1
- 230000003183 myoelectrical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及ECG心拍分类技术领域,尤其涉及基于类内类间距离的CNN模型心拍分类方法。基于类内类间距离的CNN模型心拍分类方法,包括:构建心拍特征数学模型;基于心拍特征数学模型,构建共性CNN模型;基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;综合个性CNN模型的输出信息对心拍进行分类。本发明建立了共性CNN模型提取心拍的类间共性特征、类内距最小化类间距最大化的个性CNN模型提取心拍的类别个性特征,解决了由心拍类数据量不平衡导致的不能有效提取心拍特征的问题;将完整的心拍作为CNN的输入特征,实现了模型完全自动充分的提取心拍特征,进而准确的对心拍分类。
Description
技术领域
本发明涉及ECG心拍分类技术领域,尤其涉及基于类内类间距离的CNN模型心拍分类方法。
背景技术
心脏疾病严重威胁人类的身体健康,世界卫生组织2015年公布的全球十大死亡病因中,因缺血性心脏病(又称冠心病)死亡的人数占876万人,位于第一位;ECG诊断是检测心脏疾病最基础、最常用的方法,而人工诊断不能有效的提取ECG中的特征,导致误诊率比较高,2004-2013年发表在中文医学期刊并经遴选纳入误诊疾病数据库的急性心肌梗死文献共485篇,累及误诊病例7840例,误诊率19.62%;因此,使用计算机挖掘ECG中的深层特征,实现计算机自动ECG诊断成为ECG研究的重要方向,其中ECG心拍分类对ECG自动诊断和临床有重要价值。
研究人员在ECG心拍特征提取方面做了大量的研究工作,研究分为单个心拍特征提取和海量心拍特征提取两个阶段。在单个心拍特征提取中,王超文等(王超文.小波变换应用于QRS波检测的研究[D];天津大学,2000.)使用小波变换检测QRS波准确率达99.71%;陈日清等(陈日清,吴剑,韩永贵,et al.基于双侧累计面积的心电信号P波检测[J].中国医药导刊,2015,(s1):36-9.)使用累计面积法检测P波准确率达99%;宋晋忠等(宋晋忠,严洪,李力,et al.一种基于R波和T波的心电图ST段夹逼检测方法[J].生物医学工程学杂志,2011,28(5):855-9.)根据R波和T波的位置检测ST段准确率达到92%以上;综上所述R波、P波、T波等特征检测准确率很高,这为海量心拍特征的自动提取做了铺垫。在海量心拍特征提取中,颜昊霖等(颜昊霖,安勇,王宏飞,et al.基于卷积神经网络的心电特征提取[J].计算机工程与设计,2017,(04):1024-8.)先人工提取RR间期特征和QRS波群作为CNN的输入特征,经过神经网络的卷积和池化操作提取心拍特征,把平均灵敏度提高到88.51%、平均阳性检测率提高到63.27%;Zhang等(ZHANG Z,DONG J,LUO X,et al.Heartbeatclassification using disease-specific feature selection[J].Computers inBiology&Medicine,2014,46(1):79-89.)先人工提取RR、QT、PR间期等特征作为支持向量机(Support Vector Machine,SVM)的输入,然后训练SVM提取心拍深层特征,把F类心拍灵敏度提高到93.81%;Mar等(MAR T,ZAUNSEDER S,MART NEZ J P,et al.Optimi-zation ofECG classification by means of feature selection[J].IEEE Transactions onBiomedical Engineering,2011,58(8):2168-77.)先人工提取RR间期、QRS时限等特征作为多层感知机(Multi-layer Perceptron,MLP)的输入,然后训练MLP挖掘心拍深层特征,把N类心拍的阳性检测率提高到99.12%;S Kiranyaz等(KIRANYAZ S,INCE T,PULKKINEN J,etal.Personalized long-term ECG classification:A systematic approach[J].ExpertSystems with Applications,2011,38(4):3220-6.)先人工提取了RR间期等特征作为K-means聚类的输入,然后提取ECG中的高维特征,把V类心拍的灵敏度提高到96.89%,阳性检测率提高到99.46%;鄢羽等(鄢羽,孙成.基于聚类分析的心电节拍分类算法[J].计算机应用,2014,34(7):2132-5.)将心拍作为聚类的输入特征,利用心拍的差异性,使用两级聚类分析提取ECG心拍特征,把S类心拍灵敏度提高到89.82%、阳性检测率提高到92.17%。
上述研究提出的方法有四点不足:(1)大部分研究中提供了人工特征(例如:RR间期等),不是完全自动挖掘心拍中的全部特征;(2)只很好的提高了某一心拍类的分类指标,其它指标相对较低;(3)都没有很好的解决由心拍类数据严重不平衡导致的难以有效提取高辨别性心拍特征的问题;(4)没有充分利用各类心拍间的共性信息和个性信息。
发明内容
针对上述问题,本发明提出了基于类内类间距离的CNN模型心拍分类方法,进一步提升ECG自动诊断的性能。
为了实现上述目的,本发明采用以下技术方案:
基于类内类间距离的CNN模型心拍分类方法,包括:
步骤1:构建心拍特征数学模型;
步骤2:基于心拍特征数学模型,构建共性CNN模型;
步骤3:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;
步骤4:综合个性CNN模型的输出信息对心拍进行分类。
进一步地,所述步骤1包括:
ECG的心拍特征数学模型表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中,Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征。
进一步地,所述步骤2包括:
步骤2.1:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
进一步地,所述步骤3包括:
步骤3.1:采用如下公式作为个性CNN模型的损失函数:
公式(3)进一步表示为:
步骤3.2:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4×T、共性CNN模型的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量j=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
进一步地,所述步骤4包括:
步骤4.1:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征;
步骤4.2:使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量;
步骤4.3:在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
与现有技术相比,本发明具有的有益效果:
本发明通过构建共性CNN模型用以表达各类心拍的共性信息,解决由数据不均衡导致的共性信息偏差较大的问题;然后在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对传统CNN模型进行改进,用以构建能有效表达相应类个性信息分布的个性CNN模型,解决共性CNN模型因单类数据量不足及缺乏类间距约束带来的类别个性信息表达不充分和辨别性较低的问题;最后综合个性CNN模型的输出信息对心拍进行分类。
本发明建立了共性CNN模型提取心拍的类间共性特征、类内距最小化类间距最大化的个性CNN模型提取心拍的类别个性特征,解决了由心拍类数据量不平衡导致的不能有效提取心拍特征的问题;将完整的心拍作为CNN的输入特征,实现了模型完全自动充分的提取心拍特征,进而准确的对心拍分类。由实验可知,本发明在MIT-BIH数据库上识别4类心拍的各项评价指标全部达到100%。
附图说明
图1为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的基本流程图之一。
图2为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的标准ECG图。
图3为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的四类心拍波形图。
图4为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的识别心拍的CNN结构示意图。
图5为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的基本流程图之二。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
实施例一:
如图1所示,本发明的一种基于类内类间距离的CNN模型心拍分类方法,包括以下步骤:
步骤S101:构建心拍特征数学模型。
ECG心拍的特征数学模型可以表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征。鉴于各类间数据的不均衡性,如果直接训练一个统一的特征生成模型,则必然会导致数据量较小类对应的特征存在辨别性不高的问题;而为每类单独训练特征生成模型又会导致数据量较小类对应的模型训练不充分的问题。
步骤S102:基于心拍特征数学模型,构建共性CNN模型。
这里使用各类等量的组合数据集训练CNN模型,获得能有效表达各类心拍间共性信息的高维投影变换函数,这里命名此CNN模型为共性CNN模型。共性CNN模型算法描述见表1。
表1共性CNN模型训练算法
步骤S102包括:
步骤S1021:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
步骤S1022:输出第i层第n个由Ti个矩阵组成的卷积函数i=1,...,3;n=1,...,N的权重和的偏移量第j层第m个池化函数j=1,...,2;m=1,...,M的权重和的偏移量输出层的损失函数的权重和fh的偏移量bh∈R;作为一种可实施方式,采用交叉熵作为输出层的损失函数;
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
步骤S103:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型。
目前常规的多分类CNN均使用交叉熵作为损失函数,该损失函数的优点是借助降低整体信息损失以提升CNN模型对训练数据真实分布的表达能力。该损失函数的表达式如下:
从公式(2)可知,交叉熵损失函数仅关注整体信息而忽略了不同类间的距离信息,这导致其虽然可以使CNN模型学习到训练数据的近似分布,但难以增大该近似分布中不同类别对应的子分布间距离,致使不同子分布间存在交集,进而影响CNN模型的分类性能。为了解决这一问题,本发明提出了一个基于类内距最小化类间距最大化方法的CNN损失函数,该损失函数的具体公式如下:
鉴于任一训练数据标注向量的元素中,实际类对应元素的概率值为1,其他均为0,所以公式(3)可进一步表示为:
依据公式(4)可知,该损失函数不仅关注整体的信息损失,而且也关注类间的距离信息。所以在表1的算法学习得到的共性CNN模型系数基础上以最小化的方式训练CNN时,可以合理地推测该损失函数在确保最小化类内距和最大化类间距条件下可尽可能地近似各类数据的真实分布,理论上可以有效地避免类间子分布存在交集的问题。为了便于表述,这里称基于的CNN模型为个性CNN模型。个性CNN模型算法描述见表2。
表2个性CNN模型训练算法
步骤S103包括:
步骤S1031:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4 ×T、共性CNN模型的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量j=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
步骤S104:综合个性CNN模型的输出信息对心拍进行分类。
心拍类判定方法如下:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征,包括:通过构建的共性CNN模型提取心拍测试集中心拍的类间共性特征,通过构建的个性CNN模型提取心拍测试集中心拍的类别个性特征;然后使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量,最后在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
选择交叉熵度量心拍预测值与真实值的相似度。交叉熵可以计算2个分布的距离,交叉熵越小两个概率分布距离越小、相似度越大。交叉熵定义如下:设两个离散随机变量的概率分布P和Q,交叉熵H(P,Q)为:
H(P,Q)=-∑xP(x)log Q(x) (5)
将测试集分别给训练好的四类个性CNN模型,得到H(PN,QN)、H(PS,QS)、H(PV,QV)、H(PF,QF)四个ECG心拍测试集的交叉熵向量(每一个心拍对应一个交叉熵),求出同一个心拍在各类个性CNN模型中交叉熵最小的值,数学模型如下:
H=min[H(PN,QN),H(PS,QS),H(PV,QV),H(PF,QF)] (6)
其中P代表心拍预测概率分布,Q代表心拍真实概率分布,H代表的类即为CNN模型预测的类。
作为一种可实施方式,使用MIT-BIH数据库提供的数据进行了实验。在训练CNN模型之前,先利用DB4小波对MIT-BIH数据库中所用到的数据进行预处理;然后在MIT-BIH数据库提供的心拍数据基础上训练共性CNN模型和个性CNN模型,提取心拍特征判定心拍类型,求出各类实验指标;最后对实验结果进行分析与讨论。
心电图记录的是心脏连续周期搏动产生的微弱生物电信号。一个标准完整的ECG心拍如图2所示,由P波、QRS波、T波和U波组成,心拍时间约0.72s(18*0.04s=0.72s)。
本发明使用国际公认标准的MIT-BIH心电图数据库。它的ECG采样频率为360HZ,一个心拍大约由260个数据点(0.72*360=259.2)组成,因此提取256个点(一个心拍)作为CNN模型的输入特征。它有48条记录,每条记录由头文件[.hea]、数据文件[.dat]、注释文件[.atr]组成,记录时间为30分钟左右,大概有65万个数据点。依据美国医疗仪器促进协会(AAMI)对ECG心拍的分类标准,将ECG心拍分为正常类(N)、室上性心律异常(S)、室性心律异常(V)、融合心跳(F)、未确定(Q)五类。此外,将MIT-BIH数据库中48条记录分为训练集和测试集,提取了5类心拍的数据,并计算了心拍的数量,如表3所示。
表3 MIT-BIH数据库中不同类别心拍数量
表3显示Q类仅有15个心拍,因此舍弃Q类,只研究N、S、V、F四类心拍,同时为了更直观的分辨4类波形的形状,从MIT-BIH数据库4类心拍中随机提取了具有代表性的4个心拍,并绘制成心电波形如图3。从表3还可以看到S类和F类心拍样本较少,为了降低ECG心拍类别不平衡性,通过2点、3点、4点平滑滤波(求平均值)将S类扩大2倍,F类扩大4倍。
心电信号通过导联线采集时,容易受到环境的影响,例如肌电干扰、工频干扰、基线漂移等。因此,对心拍分类之前需要对ECG进行预处理去除噪声干扰。小波不仅可以解决信号的频域问题,也可以解决信号在时域上局部信息很难表达的问题。其中,Daubechies小波具有指数多项式消失距、紧支集和正交等特性,因此使用Daubeachies小波去除噪声干扰。
Daubeachies小波没有明确的数学表达式由两尺度方程计算构造得到,Daubechies小波的两尺度函数为:
随着消失距N增大,虽然波形的光滑性越好,但是hk的数量会增加,计算量增大。4阶消失距对应的小波函数和尺度函数都有连续的导函数。因此本发明使用四阶消失距(N=4)的Daubeachies小波对心电信号进行两次分解和重构去除噪声干扰,其中k=[0,7],k∈Z。
卷积神经网络(CNN)是由卷积层、池化层和全连接层组成的前馈神经网络,它可以稀疏网络连接、减少计算量、挖掘更深的数据特征。
卷积是对特征和权值乘积后的求和,提取更深的特征,它可以将上一层的感受野(局部数据块)映射为下一层的一个神经元,感受野的大小由卷积核决定,每一个神经元的权重个数是卷积核的大小。它有稀疏连接、参数共享、不变性等性质。
池化层可以通过求特征的平均值、最大值等,对特征进行降采样,裁剪原始数据的尺寸,进一步减少全连接中的参数个数,加快神经网络的计算速度、防止过拟合等。
本发明参考LeNet5模型设计了识别心拍的CNN结构,如图4所示。根据MIT-BIH数据库提供的“.atr”文件中标注的心电图R尖峰的位置,提取R尖峰的前128个数据点、R尖峰后129个数据点、R尖峰,组成输入层的256个输入特征(一个心拍)。心拍在CNN模型中,先经过卷积、池化操作进行降维和特征生成,然后在输出层(OUTPUT)上,softmax模型将生成的4维特征向量转化成4维概率分布输出。因为计算心拍交叉熵的预测值概率分布与真实值概率分布的维度需要相同,所以本发明设置4类真实值概率分布为[1,0,0,0]代表N类、[0,1,0,0]代表S类、[0,0,1,0]代表V类、[0,0,0,1]代表F类。
识别ECG心拍的CNN结构参数详细描述如表4。
表4识别心拍的CNN结构参数
本发明另一种基于类内类间距离的CNN模型心拍分类方法如图5所示,具体包括:
从MIT-BIH数据库中提取ECG训练数据集,经过去除噪声、滤波、增加样本后,从每类样本集中随机抽取1500个样本,并将4类数据随机组合,50个ECG样本为一组。使用组合的6000个ECG样本训练共性CNN模型,共迭代120次,计算共性CNN的权值和偏置,传递给识别心拍的个性CNN模型。然后使用类别样本集(每类1500个样本)训练个性CNN模型(例如:N类样本集训练N类CNN模型),得到4类个性CNN模型。
从MIT-BIH数据库中提取测试集,对测试集只进行了去除噪声、滤波,得到4类数据测试心拍样本个数为N类44238个、S类1836个、V类3221个、F类388个,随机组合后共49690个测试样本。将测试集分别传递个4类训练好的模型,得到4个含有49690个交叉熵的向量,求出4个交叉熵向量中同一心拍交叉熵最小的类别。
评估ECG分类的指标是灵敏度Se、阳性检测率P+、平均灵敏度Seave、平均阳性检测率P+ ave和综合指标F1,公式如下:
TP代表该类别被正确分类个数,FN表示该类被错分为其他类的个数,FP表示不属于该类却被分类器分为该类的心拍个数。
使用训练集对模型进行了5次训练得到了5组模型系数,并使用这5组模型系数对测试集进行了预测,其中心拍的预测的各项指标都达到100%。预测结果与其他4个方法做了对比,参见表5,表格中带有“*”的斜体数字是根据相应文献提供的数据和本发明提供的公式计算得到。
表5不同方法对心拍识别分类的性能对比
由表5中数据可知,方法1至方法4所对应的方法表现出明显的一致性和差异性。一致性表现为它们在不同类别上的识别性能均是N类最高、V类次之、S类第三、F类最低;从表3可知各类数据量严重不平衡,其中N类数据量最多、V类次之、S类第三、F类最少;通过上述对比可以看出上述方法在各类上识别性能的高低与各类的数据量具有较强的对应关系;原因在于这些方法在模型学习过程中均未能有效地处理数据严重不均衡这一问题,所以才表现上述一致性。
差异性表现在方法2(颜昊霖,安勇,王宏飞,et al.基于卷积神经网络的心电特征提取[J].计算机工程与设计,2017,(04):1024-8.)的性能高于方法1(ZHANG Z,DONG J,LUOX,et al.Heartbeat classification using disease-specific feature selection[J].Computers in Biology&Medicine,2014,46(1):79-89.),而方法3(KIRANYAZ S,INCE T,PULKKINEN J,et al.Personalized long-term ECG classification:A systematicapproach[J].Expert Systems with Applications,2011,38(4):3220-6.)、方法4(鄢羽,孙成.基于聚类分析的心电节拍分类算法[J].计算机应用,2014,34(7):2132-5.)的整体性能又显著高于方法1、方法2;方法2基于传统CNN模型自动特征生成方法的性能优于方法1基于传统SVM模型特征选取方法,据此可合理推测基于自动特征生成方法的潜力可能高于基于经验的传统特征选取方法。由于方法1、方法2基于传统方法,模型不仅未能充分提取心拍的共性特征,也没有充分的表达个性特征,因此模型识别心拍效果不理想;而方法3、方法4提出的基于聚类思想的关键特征生成方法与方法1、方法2中方法相比,这类方法较为充分的获取了各类心拍的共性信息和个性信息,因此这类方法的分类性能较高,但是仍不甚理想。
本发明正是针对上述问题而提出的。该方法首先以共性CNN模型表述各类心拍间的共性信息,接着以类内距最小化和类间距最大化思路改进传统CNN的目标函数,构建各类心拍的个性CNN模型。在MIT-BIH数据库上的实验结果显示,本发明方法在不同类别均取得了相同性能的识别与分类结果,没有出现上述方法1至方法4的4个方法表现出的一致性问题。此外,与上述4个方法中最高识别性能对应的评价指标相比,本发明方法不仅大幅提升在多类上的识别性能,如使S类的Se提升了10.18%,P+提升了7.83%;将V类的Se提升了3.11%;使F类的Se提升了6.19%,P+提升了10.85%,致使平均Seave提升了6.00%,P+ ave提升了5.37%,综合指标F1提升了5.69%。而且还使N类的各项指标提升至最佳。实验结果表明本发明方法明显优于所有现有方法。
上述分析表明,本发明提出的基于类内类间距离的CNN模型心拍分类方法有效地解决了由数据不均衡导致的在特征生成模型设计中遇到的一系列问题,进而完全解决了在MIT-BIH数据库中ECG四类心拍自动分类中存在的分类错误问题。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.基于类内类间距离的CNN模型心拍分类方法,其特征在于,包括:
步骤1:构建心拍特征数学模型;所述步骤1包括:
ECG的心拍特征数学模型表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中,Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征;
步骤2:基于心拍特征数学模型,构建共性CNN模型;所述步骤2包括:
步骤2.1:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
步骤3:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;
步骤4:综合个性CNN模型的输出信息对心拍进行分类。
2.根据权利要求1所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤3包括:
步骤3.1:采用如下公式作为个性CNN模型的损失函数:
公式(3)进一步表示为:
步骤3.2:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4×T、共性CNN模型的及其对应的输出权重和偏移量及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
3.根据权利要求2所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤4包括:
步骤4.1:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征;
步骤4.2:使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量;
步骤4.3:在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
4.根据权利要求3所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述相似度通过交叉熵进行计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810708608.8A CN109033990B (zh) | 2018-07-02 | 2018-07-02 | 基于类内类间距离的cnn模型心拍分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810708608.8A CN109033990B (zh) | 2018-07-02 | 2018-07-02 | 基于类内类间距离的cnn模型心拍分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109033990A CN109033990A (zh) | 2018-12-18 |
CN109033990B true CN109033990B (zh) | 2021-08-17 |
Family
ID=65521243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810708608.8A Expired - Fee Related CN109033990B (zh) | 2018-07-02 | 2018-07-02 | 基于类内类间距离的cnn模型心拍分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109033990B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090723B (zh) * | 2019-11-18 | 2023-05-05 | 清远电力规划设计院有限公司 | 一种基于知识图谱的电网安全生产内容推荐方法 |
CN110840402B (zh) * | 2019-11-19 | 2021-02-26 | 山东大学 | 一种基于机器学习的房颤信号识别方法及*** |
CN111449645B (zh) * | 2020-03-07 | 2021-07-06 | 河南大学 | 心电图心拍智能分类识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243398A (zh) * | 2015-09-08 | 2016-01-13 | 西安交通大学 | 基于线性判别分析准则的改进卷积神经网络性能的方法 |
CN105608425A (zh) * | 2015-12-17 | 2016-05-25 | 小米科技有限责任公司 | 对照片进行分类存储的方法及装置 |
CN106805965A (zh) * | 2016-12-19 | 2017-06-09 | 深圳先进技术研究院 | 一种心电信号分类方法及装置 |
WO2017144763A1 (es) * | 2016-02-24 | 2017-08-31 | Universidad De Sevilla | Procedimiento para la obtención de datos útiles asociados al patrón de variabilidad de la frecuencia cardiaca |
CN107622259A (zh) * | 2017-10-20 | 2018-01-23 | 山东大学 | 一种t波检测方法、心电数据分析方法及装置 |
CN107944493A (zh) * | 2017-11-30 | 2018-04-20 | 天津大学 | 一种基于卷积神经网络的第一导联心电图心拍分类方法 |
CN107981858A (zh) * | 2017-11-27 | 2018-05-04 | 乐普(北京)医疗器械股份有限公司 | 基于人工智能的心电图心搏自动识别分类方法 |
CN108186011A (zh) * | 2017-12-13 | 2018-06-22 | 深圳竹信科技有限公司 | 房颤检测方法、装置及可读存储介质 |
CN108229398A (zh) * | 2018-01-04 | 2018-06-29 | 中科汇通投资控股有限公司 | 一种自我学习的人脸验证方法 |
-
2018
- 2018-07-02 CN CN201810708608.8A patent/CN109033990B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243398A (zh) * | 2015-09-08 | 2016-01-13 | 西安交通大学 | 基于线性判别分析准则的改进卷积神经网络性能的方法 |
CN105608425A (zh) * | 2015-12-17 | 2016-05-25 | 小米科技有限责任公司 | 对照片进行分类存储的方法及装置 |
WO2017144763A1 (es) * | 2016-02-24 | 2017-08-31 | Universidad De Sevilla | Procedimiento para la obtención de datos útiles asociados al patrón de variabilidad de la frecuencia cardiaca |
CN106805965A (zh) * | 2016-12-19 | 2017-06-09 | 深圳先进技术研究院 | 一种心电信号分类方法及装置 |
CN107622259A (zh) * | 2017-10-20 | 2018-01-23 | 山东大学 | 一种t波检测方法、心电数据分析方法及装置 |
CN107981858A (zh) * | 2017-11-27 | 2018-05-04 | 乐普(北京)医疗器械股份有限公司 | 基于人工智能的心电图心搏自动识别分类方法 |
CN107944493A (zh) * | 2017-11-30 | 2018-04-20 | 天津大学 | 一种基于卷积神经网络的第一导联心电图心拍分类方法 |
CN108186011A (zh) * | 2017-12-13 | 2018-06-22 | 深圳竹信科技有限公司 | 房颤检测方法、装置及可读存储介质 |
CN108229398A (zh) * | 2018-01-04 | 2018-06-29 | 中科汇通投资控股有限公司 | 一种自我学习的人脸验证方法 |
Non-Patent Citations (2)
Title |
---|
"基于一维卷积神经网络的患者特异性心拍分类方法研究",黄佼等,中国医疗设备,第33卷第3期,第11-14页,2018年3月;黄佼等;《中国医疗设备》;20180331;第11-14页 * |
On the design of a class of CNN"s for ECG classification;Ion Vornicu;《 2011 20th European Conference on Circuit Theory and Design (ECCTD)》;20111231;第150-153页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109033990A (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sangaiah et al. | An intelligent learning approach for improving ECG signal classification and arrhythmia analysis | |
de Albuquerque et al. | Robust automated cardiac arrhythmia detection in ECG beat signals | |
Marinho et al. | A novel electrocardiogram feature extraction approach for cardiac arrhythmia classification | |
Sodmann et al. | A convolutional neural network for ECG annotation as the basis for classification of cardiac rhythms | |
Khafaga et al. | Optimization of Electrocardiogram Classification Using Dipper Throated Algorithm and Differential Evolution. | |
Mishra et al. | Local fractal dimension based ECG arrhythmia classification | |
Liu et al. | Classification of heart diseases based on ECG signals using long short-term memory | |
Shen et al. | Detection of cardiac arrhythmia in electrocardiograms using adaptive feature extraction and modified support vector machines | |
Haseena et al. | Fuzzy clustered probabilistic and multi layered feed forward neural networks for electrocardiogram arrhythmia classification | |
CN111990989A (zh) | 一种基于生成对抗及卷积循环网络的心电信号识别方法 | |
Luo et al. | Multi-classification of arrhythmias using a HCRNet on imbalanced ECG datasets | |
Emanet | ECG beat classification by using discrete wavelet transform and Random Forest algorithm | |
CN109033990B (zh) | 基于类内类间距离的cnn模型心拍分类方法 | |
Moses et al. | A survey of data mining algorithms used in cardiovascular disease diagnosis from multi-lead ECG data | |
Li et al. | Signal processing and feature selection preprocessing for classification in noisy healthcare data | |
Cai et al. | Real‐Time Arrhythmia Classification Algorithm Using Time‐Domain ECG Feature Based on FFNN and CNN | |
Tago et al. | Classification of TCM pulse diagnoses based on pulse and periodic features from personal health data | |
David et al. | Improvement of framework for the grouping of CA diseases by investigating bigdata | |
Xie et al. | Intelligent analysis of premature ventricular contraction based on features and random forest | |
Nahak et al. | Evaluation of handcrafted features and learned representations for the classification of arrhythmia and congestive heart failure in ECG | |
Li et al. | Research on massive ECG data in XGBoost | |
Aarthy et al. | RETRACTED ARTICLE: Time series real time naive bayes electrocardiogram signal classification for efficient disease prediction using fuzzy rules | |
CN109907751B (zh) | 一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法 | |
CN113707317B (zh) | 一种基于混合模型的疾病危险因素重要性分析方法 | |
Oleiwi et al. | Efficient ECG Beats Classification Techniques for The Cardiac Arrhythmia Detection Based on Wavelet Transformation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201021 Address after: 475001 new campus of Henan University, Jinming Avenue, Jinming District, Kaifeng City, Henan Province Applicant after: Henan University Applicant after: CERNET Co.,Ltd. Address before: 475004 Jinming Avenue Henan University new campus, Jinming District, Kaifeng, Henan Applicant before: Henan University |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210817 |