发明内容
发明目的:针对以上问题,本发明目的是提供一种基于心电心音联合分析的异常数据筛查方法。
技术方案:本发明的一种基于心电心音联合分析的异常数据筛查方法,该异常数据筛查方法包括:
分别构建心电分割模型和心音分割模型,利用分割模型判定心电数据和心音数据每一帧所属的状态;
将同步心电数据和心音数据分割结果分别输入至对应的置信度模块,将置信度最高的同步心电数据和心音数据作为有效信号片段;
将有效信号片段进行解码,利用解码后的有效信号片段计算心电心音联合离散特征;
将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合,将融合的数据输入至先验分布网络,将先验分布网络的输出数据再输入至筛查模块,筛选出异常的心电和心音数据。
进一步,分别构建心电分割模型和心音分割模型,利用分割模型判定心电数据和心音数据每一帧所属的状态之前包括:
持续采集第一时长内同步心电数据和心音数据,对采集到的同步心电数据和心音数据进行信号预处理。
进一步,分割模型采用多分支卷积神经网络,多分支卷积神经网络共有m个相同分支,每个分支中设置n层卷积层,m个分支输出的表征会按通道进行拼接并使用卷积层对表征进行跨通道信息融合。
进一步,将同步心电数据和心音数据分割结果分别输入至对应的置信度模块,将置信度最高的同步心电数据和心音数据作为有效信号片段包括:将同步心电数据分割结果输入至第一置信度模块,输出第一置信度分数;将同步心音数据分割结果输入至第二置信度模块,输出第二置信度分数;若第一置信度分数和第二置信度分数同时大于设定置信度阈值,则判定为有效数据;选取有效数据中置信度分数最高的同步心电数据和心音数据作为有效信号片段。
进一步,心电心音联合离散特征包括RR间期的均值、RR间期的标准差、S1起始点和R波峰值的平均间隔、S1起始点和R波峰值的间隔标准差、S2终点和T波截止点的平均间隔、S2终点和T波截止点的间隔标准差,心电中TQ间期、QRS波群宽度和ST-T宽度的均值和标准差,心音中S1、收缩期、S2和舒张期宽度的均值和标准差。
进一步,将有效信号片段进行解码,利用解码后的有效信号片段计算心电心音联合离散特征包括:将有效信号片段输入至解码器进行解码,在解码过程中引入维特比解码算法,输出心电最优状态序列和心音最优状态序列,根据心电最优状态序列和心音最优状态序列计算心电心音联合离散特征;
解码器包括两层全连接层并外接激活函数。
进一步,将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合,将融合的数据输入至先验分布网络,将先验分布网络的输出数据再输入至筛查模块,筛选出异常的心电和心音数据包括:将同步心电数据和心音数据进行融合编码生成第一同步数据,将心电心音联合离散特征输入至多层感知机生成第二同步数据,将第一同步数据和第二同步数据进行拼接后输入至先验分布网络,先验分布网络将表征映射为分布均值和方差,采用高斯分布重采样将均值和方差生成正负样本的变分表征,将变分表征进行正异常分类,输出样本为异常数据的概率值。
进一步,同步心电数据和心音数据进行融合编码生成第一同步数据包括:将同步心电数据输入至心电分割模型生成第一心电数据,将同步心音数据输入至心音分割模型生成第一心音数据,将第一心电数据进行升采样后与第一心音数据合并为第一融合数据,将第一心音数据进行降采样后与第一心电数据合并为第二融合数据,将第一融合数据和第二融合数据分别通过卷积统一成通道数相同的表征后相加作为心电和心音的融合表征。
进一步,第一同步数据的表征分布服从
的高斯分布,先验分布网络采用卷
积层和全连接层将表征映射为分布均值和方差,先验分布网络输出的
以变分
估计表征。
进一步,将变分表征进行正异常分类,输出样本为异常数据的概率值包括:将变分表征经过全连接层,然后再通过激活函数产生心电心音数据为异常数据的概率值。
有益效果:本发明与现有技术相比,其显著优点是:本发明提出的异常数据筛查方法主要针对同步心电心音中疑似异常数据的筛查,即做到将绝对正常样本排除。为了达到此目的,本发明提出在分割过程中引入分割置信度度量以尽可能排除无效数据,获取有效的同步心电心音信号片段和联合离散特征;随后在筛查模型中,提出先验分布网络以约束正常数据在编码后的表征分布,该方法不仅能够尽可能减少噪声对异常数据筛查带来的干扰,还能降低在异常筛查过程中普遍存在的假阴风险;同时,本发明充分利用同步心电和心音的信息,不仅分别针对同步心电和心音的连续信号片段建立编码和融合模型,还基于分割结果充分挖掘了心电心音的联合特征,能够更敏锐地捕捉在同步心电和心音信号中发生的异常状态;由于本发明方法针对正异常样本筛查,模型结构简单易部署,适用于边缘计算场景。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
如图1所示,本实施例所述的一种基于心电心音联合分析的异常数据筛查方法,该异常数据筛查方法包括:
步骤(1),持续采集第一时长内同步心电数据和心音数据,对采集到的同步心电数据和心音数据进行信号预处理。
本实施例中第一时长选取为20秒至60秒,即持续采集20秒至60秒时长内的同步心电数据和心音数据,对同步心电数据进行预处理:首先进行滤波,利用0.5-100Hz巴特沃斯带通滤波,之后采用重采样将心电信号统一到250Hz,最后使用Z-score对心电信号进行数据标准化;对同步心音数据进行预处理:首先进行滤波,利用15-800Hz巴特沃斯带通滤波,再采用自适应维纳滤波器以消除不同采集设备的底噪,之后将心音信号统一到1kHz,并采用四种独立的信号处理方法构成心音分割的四通道输入,最后使用Z-score对心音信号进行数据标准化。四种信号处理方法分别为同态包络提取、希尔伯特包络提取、基于墨西哥帽小波的信号分解与重构以及功率谱密度包络提取。进行预处理后的同步心电和心音数据时长都为10秒。
步骤(2),分别构建心电分割模型和心音分割模型,利用分割模型判定心电数据和心音数据每一帧所属的状态。
心电数据包括四种状态,分别是TQ间期、QRS波群、ST段和T波,心音数据包括四种状态,分别为第一心音S1、收缩期、第二心音S2和舒张期。利用心电分割模型判定经过预处理后的心电数据所属状态,利用心音分割模型判定经过预处理后的心音数据所属状态。
心电分割模型和心音分割模型均采用多分支卷积神经网络,通过调整不同分值的
卷积占空比在增广卷积视野,可以控制神经网络的深度,避免计算冗余以及防止在训练过
程中梯度消失,如图2所示,多分支卷积神经网络共有m个相同分支,每个分支中设置n层卷
积层,m个分支输出的表征会按通道进行拼接并使用1
1卷积层对表征进行跨通道信息融
合。
本实施例中心电分割模型与心音分割模型中m和n取值不同,心电分割模型中m和n取值分别为3和3,心音分割模型m和n取值分别中4和4。输入心电分割模型与心音分割模型中心电和心音的信号时长都为10秒,采取划窗分割,窗长10秒,步长5秒,最后按照2秒重叠拼接输出的结果。利用已经过分割状态起始点和终止点标注的同步心电数据训练心电分割模型,利用已知状态的同步心音数据训练心音分割模型,保存训练之后的心电分割模型和心音分割模型结构参数,对心电数据和心音数据进行状态的识别。
步骤(3),将同步心电数据和心音数据分割结果分别输入至对应的置信度模块,将置信度最高的同步心电数据和心音数据作为有效信号片段。
为了快速排除同步心电和心音数据中的无效数据,本实施例中引入针对分割结果的置信度模块,基于分割结果的置信度判断信号是否属于有效心电和心音。如果输入信号的噪声含量越大,则结果的置信度越低。设定置信度的阈值并排除低于阈值的信号和分割结果。
置信度模块由一层卷积层、一层全连接层和一层置信度解码层组成,针对心电分割结果采用尺寸为5的卷积核作为第一置信度模块的卷积层,针对心音分割结果采用尺寸为11的卷积核作为第二置信度模块的卷积层。置信度解码层为一层外接sigmoid激活函数的全连接层,具体结构见图3。
对置信度模块进行训练,本实施例中引入高斯白噪声与参与分割训练的心音和心
电进行对比学习,在训练过程中按帧输出置信度分数c,并与每一帧的分割输出相乘,如果
输入信号为有效心音/心电,则置信度分数接近为1,如果输入信号为噪声,则置信度分数接
近为0,噪声对比损失
采用余弦距离,公式如下:
式中,
为心音/心电在置信度模块的映射表征向量,
为高斯噪声在置信度
模块的映射表征向量,映射表征向量为置信度模块中全连接层的输出,示意图如图4所示。
假设编码器为
,置信度模块为
,输入信号为
,则编码后的表征以及置信度分数分别
表示为:
将同步心电数据和心音数据分割结果分别输入至训练之后对应的置信度模块,将置信度分数最高的同步心电数据和心音数据作为有效信号片段包括:将同步心电数据分割结果输入至第一置信度模块,输出第一置信度分数;将同步心音数据分割结果输入至第二置信度模块,输出第二置信度分数;若第一置信度分数和第二置信度分数同时大于设定置信度阈值,则判定为有效数据;选取有效数据中置信度分数最高的同步心电数据和心音数据作为有效信号片段。如果所有片段的分割输出结果置信度分数都低于阈值,则判定该采样数据为无效数据,需要重新采集。
根据置信度模块的输出,分别统计心电和噪声、心音和噪声的置信度分布,并分区选取分布交界值作为有效心电和有效心音信号的置信度阈值,分别定位为Ue和Uh,选取心电和心音的置信度同时大于Ue和Uh的信号区间,且区间长度需大于等于10秒,如果不存在,则该段同步心电心音信号无效,需要重新采集。对于大于等于10秒的片段,选取平均置信度分数最高的10秒同步心电心音信号作为有效信号片段。
步骤(4),将有效信号片段进行解码,利用解码后的有效信号片段计算心电心音联合离散特征。
将有效信号片段进行解码,利用解码后的有效信号片段计算心电心音联合离散特征包括:将有效信号片段输入至解码器进行解码,在解码过程中引入维特比解码算法,输出心电最优状态序列和心音最优状态序列。
解码器包括两层全连接层并外接激活函数,损失函数采用交叉熵,表达式为:
式中,
s表示状态索引,
表示当前帧属于状态
s的标签,
表示模型输出当前
帧属于状态
s的似然度。
如图5-6所示,心音和心电的四个状态满足马尔科夫链,即四个状态的转移顺序确定,在解码中引入维特比解码算法,具体实现方式如下:
首先解码器输出的概率序列为初始概率序列
,即状态概率序列
的初始值,其中
表示第
帧对应的状态。假设
v表示状态序列的终
止状态,则第
m帧属于状态
j的最优概率为:
其中a(i,j,m)表示在m-1帧状态转移概率矩阵A中从状态i转移到状态j的概率a ij ;本实施例中状态转移概率矩阵取值为:
则最优状态序列可通过迭代求解第m帧的最优状态的概率值得到,即:
根据心电和心音最优状态序列分别获取心电和心音同步心拍的子波位置和特征,并以此为基础计算心电心音联合离散特征。心电心音联合离散特征包括RR间期的均值、RR间期的标准差(RR间期指R波峰值间的时间间隔,)、S1起始点和R波峰值的平均间隔、S1起始点和R波峰值的间隔标准差、S2终点和T波截止点的平均间隔、S2终点和T波截止点的间隔标准差,心电中TQ间期、QRS波群宽度和ST-T宽度的均值和标准差,心音中S1、收缩期、S2和舒张期宽度的均值和标准差。
步骤(5),将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合,将融合的数据输入至先验分布网络,将先验分布网络的输出数据再输入至筛查模块,筛选出异常的心电和心音数据。
如图8所示,将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合,将融合的数据输入至先验分布网络,进行正常数据和异常数据的识别,将先验分布网络的输出数据再输入至筛查模块,筛选出异常的心电和心音数据包括:将同步心电数据和心音数据进行融合编码生成第一同步数据,将心电心音联合离散特征输入至包含3层全连接层的多层感知机生成第二同步数据,将第一同步数据和第二同步数据进行拼接后输入至先验分布网络,通过先验分布网络约束正常数据的分布并拉远异常数据和正常数据的分布距离,先验分布网络将表征映射为分布均值和方差,采用高斯分布重采样将均值和方差生成正负样本的变分表征,将变分表征进行正异常分类,输出样本为异常数据的概率值。
如图7所示,输入分割模型中判定为有效数据的10秒同步心音和心电数据并分别
输入各自的多分支卷积模块进行特征编码。将同步心电特征进行升采样后与心音特征合并
为第一融合特征,将同步心音特征进行降采样后与心电特征合并为第二融合特征,将第一
融合特征和第二融合特征分别通过
卷积统一成通道数相同的表征后相加作为心电
和心音的融合表征。
第一同步数据的表征分布服从
的高斯分布,先验分布网络采用卷积
层和全连接层将表征映射为分布均值和方差,先验分布网络输出的
以变分
估计表征。在测试之前需要对先验分布网络进行训练,训练方式采用正负样本对比学习,先
验分布网络中会同时接受一个正常样本数据和异常样本(负样本)数据,分布对比损失函数
为:
式中,JS表示詹森-香农散度,负责度量分布间距离;
u p 和
u n 分别表示正常样本和异
常样本的分布均值,
和
分别表示正常样本和异常样本的分布标准差。本实施例
中将正常样本和负样本编码后的表征为正态分布,并在训练中通过最小化
L n 减小异常样本
表征和正态分布间的距离,即:
将变分表征进行正异常分类,输出样本为异常数据的概率值包括:将变分表征经过全连接层,然后再通过激活函数产生心电心音数据为异常数据的概率值。在正异常分类之前,利用已知正常样本数据和异常样本数据对筛查模块进行训练,损失函数采用二元交叉熵。
本发明提出的异常数据筛查方法主要针对同步心电心音中疑似异常数据的筛查,即做到将绝对正常样本排除。为了达到此目的,本发明提出在分割过程中引入分割置信度度量以尽可能排除无效数据,获取有效的同步心电心音信号片段和联合离散特征。随后在筛查模型中,提出先验分布网络以约束正常数据在编码后的表征分布。该方法不仅能够尽可能减少噪声对异常数据筛查带来的干扰,还能降低在异常筛查过程中普遍存在的假阴风险。同时,本发明充分利用同步心电和心音的信息,不仅分别针对同步心电和心音的连续信号片段建立编码和融合模型,还基于分割结果充分挖掘了心电心音的联合特征,能够更敏锐地捕捉在同步心电和心音信号中发生的异常状态。由于本发明方法针对正异常样本筛查,模型结构简单易部署,适用于边缘计算场景。