CN115640507A

CN115640507A - 一种基于心电心音联合分析的异常数据筛查方法

Info

Publication number: CN115640507A
Application number: CN202211576921.3A
Authority: CN
Inventors: 王星尧; 张峰; 崔畅
Original assignee: Nanjing Beili Medical Technology Co ltd
Current assignee: Jingdian Nanjing Technology Development Co ltd
Priority date: 2022-12-09
Filing date: 2022-12-09
Publication date: 2023-01-24
Anticipated expiration: 2042-12-09
Also published as: CN115640507B

Abstract

本发明公开一种基于心电心音联合分析的异常数据筛查方法，利用分割模型判定心电数据和心音数据每一帧所属的状态；将置信度最高的同步心电数据和心音数据作为有效信号片段；将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征；将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据。本发明引入分割置信度度量以尽可能排除无效数据，获取有效的同步心电心音信号片段和联合离散特征；提出先验分布网络以约束正常数据在编码后表征分布，尽可能减少噪声对异常数据筛查带来的干扰。

Description

一种基于心电心音联合分析的异常数据筛查方法

技术领域

本发明涉及采样数据筛查技术，特别涉及一种基于心电心音联合分析的异常数据筛查方法。

背景技术

对于冠心病的早期筛查，可以针对部分心肺疾病作出早期预警，早干预早治疗，降低医疗成本。在临床应用场景中，同步心电和心音信号可以构成互补，组成完整的心肺检测***，在便携式心脏超声的设备和使用没有成熟的情况下，心电心音联合采集分析在大众环境下由于操作简便是最容易被接受的。但心音听诊是一项技能，约有20%心内科临床实习医生无法根据听诊准确判断患者相应的情况。且单导心电和心音在大部分场景中并不能作为最终确诊的依据，在某些场景可以实现对正常样本数据进行排除。

在很多初筛心电心音数据场景中，难以获得能够有效支撑有监督学习的数据，其难度主要体现在以下三个方面：1、相比于正常人，患有冠心病或者先心病的患者数量很少，要从大量样本中筛选出异常样本，需要耗费很高的人力物力成本；2、病种多样且病理复杂，对于某些稀有疾病，特征的统计显著性很小，使得分类学习方法不可避免地需要面对长尾问题；3、某些疾病类型的心电心音数据因个体差异性会存在不一致性，无法定义其特征，但在实际应用中又要求对其进行识别。

现有针对心电心音数据的筛查主要涉及以下技术路线：1、基于常规有监督学习方法对心电心音数据进行多分类；2、基于信号分割、特征提取，通过规则和模板匹配的方式进行异常数据诊断。但这些方法存在无法有效处理异常数据量少、种类多且变异性强等问题。

发明内容

发明目的：针对以上问题，本发明目的是提供一种基于心电心音联合分析的异常数据筛查方法。

技术方案：本发明的一种基于心电心音联合分析的异常数据筛查方法，该异常数据筛查方法包括：

分别构建心电分割模型和心音分割模型，利用分割模型判定心电数据和心音数据每一帧所属的状态；

将同步心电数据和心音数据分割结果分别输入至对应的置信度模块，将置信度最高的同步心电数据和心音数据作为有效信号片段；

将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征；

将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据。

进一步，分别构建心电分割模型和心音分割模型，利用分割模型判定心电数据和心音数据每一帧所属的状态之前包括：

持续采集第一时长内同步心电数据和心音数据，对采集到的同步心电数据和心音数据进行信号预处理。

进一步，分割模型采用多分支卷积神经网络，多分支卷积神经网络共有m个相同分支，每个分支中设置n层卷积层，m个分支输出的表征会按通道进行拼接并使用卷积层对表征进行跨通道信息融合。

进一步，将同步心电数据和心音数据分割结果分别输入至对应的置信度模块，将置信度最高的同步心电数据和心音数据作为有效信号片段包括：将同步心电数据分割结果输入至第一置信度模块，输出第一置信度分数；将同步心音数据分割结果输入至第二置信度模块，输出第二置信度分数；若第一置信度分数和第二置信度分数同时大于设定置信度阈值，则判定为有效数据；选取有效数据中置信度分数最高的同步心电数据和心音数据作为有效信号片段。

进一步，心电心音联合离散特征包括RR间期的均值、RR间期的标准差、S1起始点和R波峰值的平均间隔、S1起始点和R波峰值的间隔标准差、S2终点和T波截止点的平均间隔、S2终点和T波截止点的间隔标准差，心电中TQ间期、QRS波群宽度和ST-T宽度的均值和标准差，心音中S1、收缩期、S2和舒张期宽度的均值和标准差。

进一步，将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征包括：将有效信号片段输入至解码器进行解码，在解码过程中引入维特比解码算法，输出心电最优状态序列和心音最优状态序列，根据心电最优状态序列和心音最优状态序列计算心电心音联合离散特征；

解码器包括两层全连接层并外接激活函数。

进一步，将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据包括：将同步心电数据和心音数据进行融合编码生成第一同步数据，将心电心音联合离散特征输入至多层感知机生成第二同步数据，将第一同步数据和第二同步数据进行拼接后输入至先验分布网络，先验分布网络将表征映射为分布均值和方差，采用高斯分布重采样将均值和方差生成正负样本的变分表征，将变分表征进行正异常分类，输出样本为异常数据的概率值。

进一步，同步心电数据和心音数据进行融合编码生成第一同步数据包括：将同步心电数据输入至心电分割模型生成第一心电数据，将同步心音数据输入至心音分割模型生成第一心音数据，将第一心电数据进行升采样后与第一心音数据合并为第一融合数据，将第一心音数据进行降采样后与第一心电数据合并为第二融合数据，将第一融合数据和第二融合数据分别通过卷积统一成通道数相同的表征后相加作为心电和心音的融合表征。

进一步，第一同步数据的表征分布服从

的高斯分布，先验分布网络采用卷积层和全连接层将表征映射为分布均值和方差，先验分布网络输出的

以变分估计表征。

进一步，将变分表征进行正异常分类，输出样本为异常数据的概率值包括：将变分表征经过全连接层，然后再通过激活函数产生心电心音数据为异常数据的概率值。

有益效果：本发明与现有技术相比，其显著优点是：本发明提出的异常数据筛查方法主要针对同步心电心音中疑似异常数据的筛查，即做到将绝对正常样本排除。为了达到此目的，本发明提出在分割过程中引入分割置信度度量以尽可能排除无效数据，获取有效的同步心电心音信号片段和联合离散特征；随后在筛查模型中，提出先验分布网络以约束正常数据在编码后的表征分布，该方法不仅能够尽可能减少噪声对异常数据筛查带来的干扰，还能降低在异常筛查过程中普遍存在的假阴风险；同时，本发明充分利用同步心电和心音的信息，不仅分别针对同步心电和心音的连续信号片段建立编码和融合模型，还基于分割结果充分挖掘了心电心音的联合特征，能够更敏锐地捕捉在同步心电和心音信号中发生的异常状态；由于本发明方法针对正异常样本筛查，模型结构简单易部署，适用于边缘计算场景。

附图说明

图1为本发明异常数据筛查方法流程图；

图2为多分支卷积模块结构示意图；

图3为置信度模块的结构示意图；

图4为置信度模块训练示意图；

图5为心音状态转移图；

图6为心电状态转移图；

图7为同步心电心音融合编码流程图；

图8为异常数据筛查流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。

如图1所示，本实施例所述的一种基于心电心音联合分析的异常数据筛查方法，该异常数据筛查方法包括：

步骤（1），持续采集第一时长内同步心电数据和心音数据，对采集到的同步心电数据和心音数据进行信号预处理。

本实施例中第一时长选取为20秒至60秒，即持续采集20秒至60秒时长内的同步心电数据和心音数据，对同步心电数据进行预处理：首先进行滤波，利用0.5-100Hz巴特沃斯带通滤波，之后采用重采样将心电信号统一到250Hz，最后使用Z-score对心电信号进行数据标准化；对同步心音数据进行预处理：首先进行滤波，利用15-800Hz巴特沃斯带通滤波，再采用自适应维纳滤波器以消除不同采集设备的底噪，之后将心音信号统一到1kHz，并采用四种独立的信号处理方法构成心音分割的四通道输入，最后使用Z-score对心音信号进行数据标准化。四种信号处理方法分别为同态包络提取、希尔伯特包络提取、基于墨西哥帽小波的信号分解与重构以及功率谱密度包络提取。进行预处理后的同步心电和心音数据时长都为10秒。

步骤（2），分别构建心电分割模型和心音分割模型，利用分割模型判定心电数据和心音数据每一帧所属的状态。

心电数据包括四种状态，分别是TQ间期、QRS波群、ST段和T波，心音数据包括四种状态，分别为第一心音S1、收缩期、第二心音S2和舒张期。利用心电分割模型判定经过预处理后的心电数据所属状态，利用心音分割模型判定经过预处理后的心音数据所属状态。

心电分割模型和心音分割模型均采用多分支卷积神经网络，通过调整不同分值的卷积占空比在增广卷积视野，可以控制神经网络的深度，避免计算冗余以及防止在训练过程中梯度消失，如图2所示，多分支卷积神经网络共有m个相同分支，每个分支中设置n层卷积层，m个分支输出的表征会按通道进行拼接并使用1

1卷积层对表征进行跨通道信息融合。

本实施例中心电分割模型与心音分割模型中m和n取值不同，心电分割模型中m和n取值分别为3和3，心音分割模型m和n取值分别中4和4。输入心电分割模型与心音分割模型中心电和心音的信号时长都为10秒，采取划窗分割，窗长10秒，步长5秒，最后按照2秒重叠拼接输出的结果。利用已经过分割状态起始点和终止点标注的同步心电数据训练心电分割模型，利用已知状态的同步心音数据训练心音分割模型，保存训练之后的心电分割模型和心音分割模型结构参数，对心电数据和心音数据进行状态的识别。

步骤（3），将同步心电数据和心音数据分割结果分别输入至对应的置信度模块，将置信度最高的同步心电数据和心音数据作为有效信号片段。

为了快速排除同步心电和心音数据中的无效数据，本实施例中引入针对分割结果的置信度模块，基于分割结果的置信度判断信号是否属于有效心电和心音。如果输入信号的噪声含量越大，则结果的置信度越低。设定置信度的阈值并排除低于阈值的信号和分割结果。

置信度模块由一层卷积层、一层全连接层和一层置信度解码层组成，针对心电分割结果采用尺寸为5的卷积核作为第一置信度模块的卷积层，针对心音分割结果采用尺寸为11的卷积核作为第二置信度模块的卷积层。置信度解码层为一层外接sigmoid激活函数的全连接层，具体结构见图3。

对置信度模块进行训练，本实施例中引入高斯白噪声与参与分割训练的心音和心电进行对比学习，在训练过程中按帧输出置信度分数c，并与每一帧的分割输出相乘，如果输入信号为有效心音/心电，则置信度分数接近为1，如果输入信号为噪声，则置信度分数接近为0，噪声对比损失

采用余弦距离，公式如下：

式中，

为心音/心电在置信度模块的映射表征向量，

为高斯噪声在置信度模块的映射表征向量，映射表征向量为置信度模块中全连接层的输出，示意图如图4所示。假设编码器为

，置信度模块为

，输入信号为

，则编码后的表征以及置信度分数分别表示为：

。

将同步心电数据和心音数据分割结果分别输入至训练之后对应的置信度模块，将置信度分数最高的同步心电数据和心音数据作为有效信号片段包括：将同步心电数据分割结果输入至第一置信度模块，输出第一置信度分数；将同步心音数据分割结果输入至第二置信度模块，输出第二置信度分数；若第一置信度分数和第二置信度分数同时大于设定置信度阈值，则判定为有效数据；选取有效数据中置信度分数最高的同步心电数据和心音数据作为有效信号片段。如果所有片段的分割输出结果置信度分数都低于阈值，则判定该采样数据为无效数据，需要重新采集。

根据置信度模块的输出，分别统计心电和噪声、心音和噪声的置信度分布，并分区选取分布交界值作为有效心电和有效心音信号的置信度阈值，分别定位为Ue和Uh，选取心电和心音的置信度同时大于Ue和Uh的信号区间，且区间长度需大于等于10秒，如果不存在，则该段同步心电心音信号无效，需要重新采集。对于大于等于10秒的片段，选取平均置信度分数最高的10秒同步心电心音信号作为有效信号片段。

步骤（4），将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征。

将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征包括：将有效信号片段输入至解码器进行解码，在解码过程中引入维特比解码算法，输出心电最优状态序列和心音最优状态序列。

解码器包括两层全连接层并外接激活函数，损失函数采用交叉熵，表达式为：

式中，s表示状态索引，

表示当前帧属于状态s的标签，

表示模型输出当前帧属于状态s的似然度。

如图5-6所示，心音和心电的四个状态满足马尔科夫链，即四个状态的转移顺序确定，在解码中引入维特比解码算法，具体实现方式如下：

首先解码器输出的概率序列为初始概率序列

，即状态概率序列

的初始值，其中

表示第

帧对应的状态。假设v表示状态序列的终止状态，则第m帧属于状态 j的最优概率为：

其中a(i，j，m)表示在m-1帧状态转移概率矩阵A中从状态i转移到状态j的概率a _ij；本实施例中状态转移概率矩阵取值为：

则最优状态序列可通过迭代求解第m帧的最优状态的概率值得到，即：

。

根据心电和心音最优状态序列分别获取心电和心音同步心拍的子波位置和特征，并以此为基础计算心电心音联合离散特征。心电心音联合离散特征包括RR间期的均值、RR间期的标准差（RR间期指R波峰值间的时间间隔，）、S1起始点和R波峰值的平均间隔、S1起始点和R波峰值的间隔标准差、S2终点和T波截止点的平均间隔、S2终点和T波截止点的间隔标准差，心电中TQ间期、QRS波群宽度和ST-T宽度的均值和标准差，心音中S1、收缩期、S2和舒张期宽度的均值和标准差。

步骤（5），将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据。

如图8所示，将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，进行正常数据和异常数据的识别，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据包括：将同步心电数据和心音数据进行融合编码生成第一同步数据，将心电心音联合离散特征输入至包含3层全连接层的多层感知机生成第二同步数据，将第一同步数据和第二同步数据进行拼接后输入至先验分布网络，通过先验分布网络约束正常数据的分布并拉远异常数据和正常数据的分布距离，先验分布网络将表征映射为分布均值和方差，采用高斯分布重采样将均值和方差生成正负样本的变分表征，将变分表征进行正异常分类，输出样本为异常数据的概率值。

如图7所示，输入分割模型中判定为有效数据的10秒同步心音和心电数据并分别输入各自的多分支卷积模块进行特征编码。将同步心电特征进行升采样后与心音特征合并为第一融合特征，将同步心音特征进行降采样后与心电特征合并为第二融合特征，将第一融合特征和第二融合特征分别通过

卷积统一成通道数相同的表征后相加作为心电和心音的融合表征。

第一同步数据的表征分布服从

以变分估计表征。在测试之前需要对先验分布网络进行训练，训练方式采用正负样本对比学习，先验分布网络中会同时接受一个正常样本数据和异常样本（负样本）数据，分布对比损失函数为：

式中，JS表示詹森-香农散度，负责度量分布间距离；u _p和u _n分别表示正常样本和异常样本的分布均值，

和

分别表示正常样本和异常样本的分布标准差。本实施例中将正常样本和负样本编码后的表征为正态分布，并在训练中通过最小化L _n减小异常样本表征和正态分布间的距离，即：

将变分表征进行正异常分类，输出样本为异常数据的概率值包括：将变分表征经过全连接层，然后再通过激活函数产生心电心音数据为异常数据的概率值。在正异常分类之前，利用已知正常样本数据和异常样本数据对筛查模块进行训练，损失函数采用二元交叉熵。

本发明提出的异常数据筛查方法主要针对同步心电心音中疑似异常数据的筛查，即做到将绝对正常样本排除。为了达到此目的，本发明提出在分割过程中引入分割置信度度量以尽可能排除无效数据，获取有效的同步心电心音信号片段和联合离散特征。随后在筛查模型中，提出先验分布网络以约束正常数据在编码后的表征分布。该方法不仅能够尽可能减少噪声对异常数据筛查带来的干扰，还能降低在异常筛查过程中普遍存在的假阴风险。同时，本发明充分利用同步心电和心音的信息，不仅分别针对同步心电和心音的连续信号片段建立编码和融合模型，还基于分割结果充分挖掘了心电心音的联合特征，能够更敏锐地捕捉在同步心电和心音信号中发生的异常状态。由于本发明方法针对正异常样本筛查，模型结构简单易部署，适用于边缘计算场景。

Claims

1.一种基于心电心音联合分析的异常数据筛查方法，其特征在于，该异常数据筛查方法包括：

2.根据权利要求1所述的异常数据筛查方法，其特征在于，分别构建心电分割模型和心音分割模型，利用分割模型判定心电数据和心音数据每一帧所属的状态之前包括：

3.根据权利要求1所述的异常数据筛查方法，其特征在于，分割模型采用多分支卷积神经网络，多分支卷积神经网络共有m个相同分支，每个分支中设置n层卷积层，m个分支输出的表征会按通道进行拼接并使用卷积层对表征进行跨通道信息融合。

4.根据权利要求3所述的异常数据筛查方法，其特征在于，将同步心电数据和心音数据分割结果分别输入至对应的置信度模块，将置信度最高的同步心电数据和心音数据作为有效信号片段包括：将同步心电数据分割结果输入至第一置信度模块，输出第一置信度分数；将同步心音数据分割结果输入至第二置信度模块，输出第二置信度分数；若第一置信度分数和第二置信度分数同时大于设定置信度阈值，则判定为有效数据；选取有效数据中置信度分数最高的同步心电数据和心音数据作为有效信号片段。

5.根据权利要求1所述的异常数据筛查方法，其特征在于，心电心音联合离散特征包括RR间期的均值、RR间期的标准差、S1起始点和R波峰值的平均间隔、S1起始点和R波峰值的间隔标准差、S2终点和T波截止点的平均间隔、S2终点和T波截止点的间隔标准差，心电中TQ间期、QRS波群宽度和ST-T宽度的均值和标准差，心音中S1、收缩期、S2和舒张期宽度的均值和标准差。

6.根据权利要求5所述的异常数据筛查方法，其特征在于，将有效信号片段进行解码，利用解码后的有效信号片段计算心电心音联合离散特征包括：将有效信号片段输入至解码器进行解码，在解码过程中引入维特比解码算法，输出心电最优状态序列和心音最优状态序列，根据心电最优状态序列和心音最优状态序列计算心电心音联合离散特征；

解码器包括两层全连接层并外接激活函数。

7.根据权利要求6所述的异常数据筛查方法，其特征在于，将解码后的有效信号片段中同步心电数据、心音数据及心电心音联合离散特征进行融合，将融合的数据输入至先验分布网络，将先验分布网络的输出数据再输入至筛查模块，筛选出异常的心电和心音数据包括：将同步心电数据和心音数据进行融合编码生成第一同步数据，将心电心音联合离散特征输入至多层感知机生成第二同步数据，将第一同步数据和第二同步数据进行拼接后输入至先验分布网络，先验分布网络将表征映射为分布均值和方差，采用高斯分布重采样将均值和方差生成正负样本的变分表征，将变分表征进行正异常分类，输出样本为异常数据的概率值。

8.根据权利要求7所述的异常数据筛查方法，其特征在于，同步心电数据和心音数据进行融合编码生成第一同步数据包括：将同步心电数据输入至心电分割模型生成第一心电数据，将同步心音数据输入至心音分割模型生成第一心音数据，将第一心电数据进行升采样后与第一心音数据合并为第一融合数据，将第一心音数据进行降采样后与第一心电数据合并为第二融合数据，将第一融合数据和第二融合数据分别通过卷积统一成通道数相同的表征后相加作为心电和心音的融合表征。

9.根据权利要求7所述的异常数据筛查方法，其特征在于，第一同步数据的表征分布服从

以变分估计表征。

10.根据权利要求7所述的异常数据筛查方法，其特征在于，将变分表征进行正异常分类，输出样本为异常数据的概率值包括：将变分表征经过全连接层，然后再通过激活函数产生心电心音数据为异常数据的概率值。