CN116451129A - 一种脉象分类识别方法及*** - Google Patents

一种脉象分类识别方法及*** Download PDF

Info

Publication number
CN116451129A
CN116451129A CN202310049180.1A CN202310049180A CN116451129A CN 116451129 A CN116451129 A CN 116451129A CN 202310049180 A CN202310049180 A CN 202310049180A CN 116451129 A CN116451129 A CN 116451129A
Authority
CN
China
Prior art keywords
pulse
data
training
layer
pulse condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310049180.1A
Other languages
English (en)
Inventor
苏畅
王惠君
王睿
侯艳
武振宇
左丽君
卢宇红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202310049180.1A priority Critical patent/CN116451129A/zh
Publication of CN116451129A publication Critical patent/CN116451129A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • A61B5/0245Detecting, measuring or recording pulse rate or heart rate by using sensing means generating electric signals, i.e. ECG signals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Cardiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pathology (AREA)
  • Signal Processing (AREA)
  • Physiology (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明涉及一种脉象分类识别方法及***。该方法包括获取多个个体的原始心电数据;对原始心电数据进行预处理,得到预处理后的心电数据;采用深度残差神经网络模型对预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;获取多个个体的原始脉象数据;对原始脉象数据进行预处理,得到预处理后的脉象数据;根据训练优化后的心电数据预测模型和预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;获取需要进行分类的脉象数据;根据训练优化后的脉象数据预测模型对脉象数据进行分类识别。本发明能够对各种脉象进行精准分类,提高脉象识别的准确率。

Description

一种脉象分类识别方法及***
技术领域
本发明涉及脉象分析领域,特别是涉及一种脉象分类识别方法及***。
背景技术
当前,关于脉搏信号的研究主要是基于时域分析、频域分析以及时域-频域分析进行的。时域分析主要是通过测定脉搏波图中具有重要生理意义的基准点的值,也就是所谓的时域特征用于研究分析。频域分析主要是将脉搏波图通过频域变换方法转换成频谱图,计算出频谱图的一些参数,也就是所谓的频域特征用于研究分析。时域-频域分析则同时结合了上述两种方式提取的时域特征和频域特征用于研究分析。王炳和等从280例参与者的脉搏信号谱图中提取出频域特征,结合ANN方法在7类脉象上实现了87%的平均识别准确率。岳沛平等通过对1456例参与者脉搏信号的时域、频域特征以及不同时间-尺度上的能量特征进行提取并利用ANN进行分类,在10类基本脉象上实现了良好识别(准确率>90%),在7类相兼脉象上也具有较佳表现(准确率>82%)。张诗雨等提取了脉搏信号的时域、频域和时频域特征,使用随机森林方法对175例平、实、弦、滑4类脉象进行识别,取得了总体93.0%的准确率。但上述脉象分析方法都需要人工手动提取特征,之后通常还需要多步骤优化,这对研究者的脉象知识和计算机技术都有较高要求故而难以应用到临床实践。
发明内容
本发明的目的是提供一种脉象分类识别方法及***,能够对各种脉象进行精准分类,提高脉象识别的准确率。
为实现上述目的,本发明提供了如下方案:
一种脉象分类识别方法包括:
获取多个个体的原始心电数据;
对所述原始心电数据进行预处理,得到预处理后的心电数据;
采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;
获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉;
对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;
获取需要进行分类的脉象数据;
根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
可选地,所述对所述原始心电数据进行预处理,得到预处理后的心电数据,具体包括:
对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
可选地,所述采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型,具体包括:
将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
可选地,所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。
一种脉象分类识别***包括:
心电数据获取模块,用于获取多个个体的原始心电数据;
心电数据处理模块,用于对所述原始心电数据进行预处理,得到预处理后的心电数据;
心电数据训练优化模块,用于采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;
脉象数据获取模块,用于获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉;
脉象数据处理模块,用于对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
脉象数据训练优化模块,用于根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;
待分类数据获取模块,用于获取需要进行分类的脉象数据;
分类识别模块,用于根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
可选地,所述心电数据处理模块,具体包括:
心电数据处理单元,用于对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
可选地,所述心电数据训练优化模块,具体包括:
心电数据分配单元,用于将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
训练单元,用于采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
优化单元,用于根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
识别效果评价单元,用于根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
可选地,所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供一种脉象分类识别方法,该方法包括获取多个个体的原始心电数据;对原始心电数据进行预处理,得到预处理后的心电数据;采用深度残差神经网络模型对预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;获取多个个体的原始脉象数据;对原始脉象数据进行预处理,得到预处理后的脉象数据;根据训练优化后的心电数据预测模型和预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;获取需要进行分类的脉象数据;根据训练优化后的脉象数据预测模型对脉象数据进行分类识别。本发明能够对各种脉象进行精准分类,提高脉象识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明脉象分类识别方法流程图;
图2为深度残差神经网络模型的结构示意图;
图3为具有跳跃连接的典型残差单元示意图;
图4为ReLU函数示意图;
图5为全连接层的结构示意图;
图6为权重随机采样方法示意图;
图7为本发明脉象分类识别***结构图;
图8为心电波形示例图;
图9为十类脉象波形示例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种脉象分类识别方法及***,能够对各种脉象进行精准分类,提高脉象识别的准确率。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明脉象分类识别方法流程图。如图1所示,一种脉象分类识别方法包括:
步骤101:获取多个个体的原始心电数据;
步骤102:对所述原始心电数据进行预处理,得到预处理后的心电数据,具体包括:
对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
步骤103:采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型,具体包括:
将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。图2为深度残差神经网络模型的结构示意图。
各层的详细参数如表1所示,具体来说,由于心电数据和脉象数据均为一维数据,长度为1000采样点,因此输入层的特征图数为1,神经元数为1*1000。之后的卷积层对输入进行了特征提取和升维,选用的卷积核数目为32,大小为1*10,步长为5,并且对输入数据的两端进行了长度为4的零值填充,因此得到的输出为32维,每一维的长度为1*200。之后的层也是类似的计算方式。全连接层将512个维度上的数值连接起来,因为每一维上只有一个数字,所以输入神经元个数为512。心电识别为二分类任务,因此输出神经元个数为2,同理,脉象分类的输出神经元个数则为10。
表1DRNN各层的具体参数
其中C代表卷积层,R代表残差层,S代表池化层,F代表全连接层。
深度残差神经网络模型预测的原理:
(1)卷积层
卷积层可以看作是一种增强原始信号特征、降低信号噪声的模糊滤波器。在卷积层中,将前一层的特征向量同当前层的卷积核执行卷积运算,之后经过激活函数得到输出特征向量。卷积层的输出的计算表达式为:
式中,是第l-1层第j个卷积核对应的输出特征向量;Mj是当前神经元的感受野;/>表示第l层第j个卷积核,其实际上是一个权值矩阵;/>是偏置系数;f是激活函数。
经过卷积运算后每个输出特征图的神经元数Out_Num的计算公式为:
Out_Num=(In_Num-F+2P)/S+1
式中,In_Num是每个输入特征图的神经元数,F是卷积核的大小,P是填充数,S是卷积步长。
不同于一般图像数据大多是三维的,本发明的心电数据和脉象数据均为一维数据,因此选用一维卷积核以适应数据类型。
(2)池化层
池化层依据局部相关原理可实现对特征的进一步提取,其通过池化运算以一个数字表示滑动窗中的矩阵,不仅能够降低信息冗余也提升了特征的尺度不变性和旋转不变性,进而能够提高训练效率以及降低了模型过拟合风险。池化运算的公式如下:
式中,down()是下采样函数;和/>分别表示下采样层的权值系数和偏置;f为激活函数。池化方式有多种,常用的包括最大池化、平均池化和随机池化等。本发明中的池化方式包括最大池化和适应性平均池化。最大池化是取滑动窗中的矩阵的最大值,适应性平均池化是在指定输出数值个数后自动对滑动窗大小及滑动步幅进行调整,计算每个滑动窗中的矩阵的平均值。
(3)跳跃连接
跳跃连接可以实现不同层之间信息的直接正向或反向传递,解决了网络层数过深时的性能退化问题,同时也有助于梯度在各层间的传播,加快了模型的训练。具有跳跃连接的典型残差单元的示意图如图3所示,其基本公式可以表示为:
式中,xl-1和xl分别是第l个残差单元的输入和输出;F(xl-1,{Wl-1})是待学习的残差映射,其中W为卷积核,R是ReLu激活函数。
(4)批量归一化(BatchNorm)
批量归一化是指对网络中间层的数据进行归一化操作,通过该操作可以使各中间层输入数据的分布一致,从而避免发生内部协变量偏移问题,加快网络收敛。最常用的批量归一化操作为标准归一化,就是将中间层数据的每一维都归一化到标准正态分布,之后对归一化值进行缩放变换和平移变换,以此避免因数值归一化而造成网络表达性能的下降。批量归一化(以标准归一化为例)后中间层的输出的表达式为:
式中,x是中间层的输入数据;μB是输入数据的每一维在当前批次上的均值和方差;γ和β分别代表缩放和平移参数向量,通过学习得到。
(5)ReLU函数
ReLU函数是目前神经网络中最为常用的激活函数之一,相比于Sigmoid型函数,其在一定程度上缓解了神经网络的梯度消失问题,加快了梯度下降的收敛速度。ReLU是一个斜坡函数,图4为ReLU函数示意图,表达式为:
(6)Dropout方法
Dropout方法一种通过随机丢弃一部分神经元(也包括这些神经元对应的连接边)来防止神经网络过拟合的技术。较为常用的一种方式是设置一个固定的丢弃率p,每一个神经元都以丢弃率p判定是否保留。
(7)全连接层
全连接层的结构示意图见图5,其将所有上层特征拼接成一维数组作为该层的输入,可以实现特征的升维或压缩,当作为网络最后一层时可用于对输入进行分类。全连接层l的输出xl的数学表达式为:
xl=f(wT·xl-1+b)
式中,xl和xl-1分别表示输出和输入特征向量;w和b分别是全连接层的权值矩阵和偏置系数;f是激活函数。
深度残差神经网络模型参数的估计包括前向传播阶段、误差反向传播阶段和权重随机采样阶段。
(1)前向传播阶段
在前向传播阶段,数据按深度残差模型结构图(图1)所示的方向逐层传播。具体而言,在非残差连接层,数据经过卷积操作、批标准化、ReLU函数和Dropout(除第一、第二卷积层间无Dropout)后作为下一卷积层的输入;在残差连接层,经过卷积操作的该层数据和前一层输入数据相加(或和经最大池化操作后的前一层数据相加),并经过批标准化、ReLU函数后作为下一层的输入。最后通过适应性平均池化层和全连接层得到最终输出。
(2)误差反向传播阶段
鉴于多分类问题,选用交叉熵函数作为损失函数,其函数形式如下:
其中W和b分别是网络中所有的权重矩阵和偏置向量;N和M分别是样本数量和脉象类别数量;yic是指示变量(0或1),表示如果该类别和观测样本i的类别相同则为1,否则为0;pic是观测样本i属于类别c的预测概率。
通过损失函数计算实际输出与期望输出之间的误差来反向传播,采用Adam梯度下降法对网络参数进行优化更新,在梯度下降法的每次迭代中,第l层的参数Wl和bl的更新方式为:
其中α为学习率。通过不断计算迭代,使得训练样本的实际输出与期望输出之间的误差和达到最小或小于某一预期阈值。本研究的初试学习率为0.001,当分类效果在连续10个轮次的训练后依然无明显提升,学习率则递减为先前的1/10。
(3)权重随机采样阶段
由于各类脉象的样本数并不均衡,如果以原始样本分布训练神经网络会导致模型易于将验证样本预测为训练样本数较多的脉象类别,以至于无法保证样本数较少的脉象的识别效果。通过基于权重的抽样方法对原始训练数据集进行随机抽样,其中每类脉象的权重等于其计数的倒数,从而实现了处理后的训练数据实例中每一类脉象的样本量基本是相等的。在验证和测试数据集中则评估它们的真实分布。权重随机采样方法的示意图见图6。
步骤104:获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉。
以下对各类脉象进行具体介绍:
平脉:是正常人在一般状态下的脉象,其特点是能在寸、关、尺三部都能触及,一息四五至,也就是72~80次/分,节律平缓一致,不快不慢,不浮不沉,且随着生理活动、季节、环境和状态等不同有着相应变化。平脉表明机体脏腑功能协同、气机健旺、气血盈润、阴阳协调、心神宁和,是机体健康的体现;
弦脉:脉型端直且形长,脉道较硬、脉势较强。脉道硬紧程度随病情轻重而有所不同,轻则如按琴弦,重则如按弓弦,甚至如循刀刃。多见于肝胆病、痰饮、疼痛,或胃气衰败等;
滑脉:脉搏搏动极为流利,形态应指圆滑如珠,往来间有种由尺部向寸部回旋翻滚之感。多见于痰湿、实热和食积等病症;
数脉:脉率较快,一息五六至,相当于每分钟90~120次。数脉是热证的主要脉型,还可见于气血不足的虚症;
沉脉:脉管搏动部位于皮肉下近筋骨处,因而轻指力按寻无法触及,中等指力按寻搏动亦不明显,只有以重指力按至筋骨间方能触及明显的脉搏跳动。沉脉的形成有虚实两方面因素,实症多为气滞、食积、血瘀、痰饮等病症,虚症多由脏腑虚弱,气血不足所致;
虚脉:脉管搏动力度减弱,按之空豁,寸、关、尺三部,浮、中、沉三候均无力。主要见于虚症,多为气血两虚;
结代脉:脉来缓慢,脉律不规整,时有不规则的歇止。多见于阴寒偏盛、痰凝、气结、血瘀,可也见于气血虚衰等症;
迟脉:脉动缓迟,一息不及四至,也就是低于60次/分钟。多见于寒症,亦可见于邪热结聚之里实热症;
涩脉:特点是脉型较细,搏动间艰涩迟滞,极为不畅,脉力与脉律不匀,表现出三五不调之状。多见于血瘀、气滞、宿食、痰浊以及精血亏少、津液耗伤;
疾脉:脉来急促,一息七八至,相当于每分钟120次以上。多见于阳极阴竭,元气欲脱之病症。
步骤105:对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
步骤106:根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型。
深度学习需要大量的高质量标注数据,但在很多实际场景中,经常会碰到诸如数据标注成本高、可及样本少等问题,无法为一个目标任务提供足够的训练数据。此时如果有一个相关任务已经有了大量训练数据,那么可以从这些与目标任务数据性质接近的数据中学习某些可以泛化的知识,再将可泛化知识迁移到目标任务上帮助目标任务的实现,这一过程称为迁移学习。
脉搏信号与心电信号均为波形信号,具有相似的数据性质,在如波峰、波谷、波频等一些底层特征上两者是相通的。受限于研究经费,本发明收集的脉象数据样本量相对较少,而The PhysioNet Challenge 2017数据集中有大量具有专家标签的心电数据并且是开源的,非常适合作为迁移学习的预训练数据集。具体来说:首先在预处理后的心电数据集上对构建的深度残差模型进行预训练;之后冻结预训练模型中特征提取层的参数,并且将模型的最后一层,也就是全连接层的输出神经元数修改为脉象数据集的脉象类别数10;最后用脉象数据训练集和验证集完成脉象识别模型的训练,也即学习调整最后一层全连接层的参数,以脉搏测试数据集对模型效果进行最终评价。
训练优化后的脉象数据预测模型预测结果的统计量定义如下:
真阳性(True Positive,TP):预测为某一类标签的样本中实际也为该类标签的样本数;
假阳性(False Positive,FP):预测为某一类标签的样本中实际并非该类标签的样本数;
假阴性(False Negative,FN):实际为该类标签但被预测为其他类型标签的样本数。
模型的分类性能通过查准率(Precision)、查全率(Recall)和F1分数(F1-score)进行评价,它们的计算公式如下:
查准率表示预测为某类标签的样本中实际也为该类的样本比例,查全率表示实际为某类标签的样本中预测为该类的比例,F1分数则为两指标的综合反映。查准率、查全率和F1分数在各类标签上的平均值称为数据集的总体宏查准率、宏查全率和宏F1分数。
步骤107:获取需要进行分类的脉象数据。
步骤108:根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
图7为本发明脉象分类识别***结构图。如图7所示,本发明还提供一种脉象分类识别***,该***包括:
心电数据获取模块201,用于获取多个个体的原始心电数据;
心电数据处理模块202,用于对所述原始心电数据进行预处理,得到预处理后的心电数据;
心电数据训练优化模块203,用于采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;
脉象数据获取模块204,用于获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉;
脉象数据处理模块205,用于对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
脉象数据训练优化模块206,用于根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;
待分类数据获取模块207,用于获取需要进行分类的脉象数据;
分类识别模块208,用于根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
所述心电数据处理模块202具体包括:
心电数据处理单元,用于对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
所述心电数据训练优化模块203具体包括:
心电数据分配单元,用于将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
训练单元,用于采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
优化单元,用于根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
识别效果评价单元,用于根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。
实施例1:
(1)数据收集
(1.1)用于迁移学习的心电图数据
心电数据来自心电数据库The PhysioNet/Computing in CardiologyChallenge2017。该数据库由美国国立卫生研究院国家研究资源中心赞助创建,并且是开放获取的。数据收集自购买了AliveCor三代单导联心电设备的个体,心电设备采样频率是300Hz,采集原理是通过两只手分别握住两个电极可创建等效于Lead I的心电图。心电数据采样持续时间在9秒至61秒不等,平均采集时间在32.5秒,所有数据都经过多重质量审查后再录入数据库中。心电类型由第三方临床专家进行标定,之后又进行了人工检查以确保标签的准确性。
(1.2)用于脉象识别检测的脉象数据
脉象数据采集自2018年10月至2019年3月间于北部战区总医院中医科就诊的门诊或住院患者。患者的年龄需要在18-65岁之间,自愿参加本实验并签署知情同意书。有以下情形的患者被排除在外,包括:安装了心脏起搏器的;急症患者;妊娠或哺乳期妇女;神志不清、语言或听力障碍等无法配合实验者。受试者被要求脉象数据采集和脉象诊断前24小时内不得服用咖啡、酒精等可能影响循环***的食品或药品,前30分钟不得进行剧烈运动,并且在安静环境中静卧或静坐15分钟方可进行脉搏采集和诊断。
脉象数据采集设备为LGX-2016H腕带充气式脉搏仪,由***(北部战区)总医院中医科林一帆教授团队和星泽健康科技有限公司联合研发,采样频率为50Hz。脉搏采集时患者被要求仰卧于床,左手自然伸直于躯体一侧,掌心朝上,充分暴露出腕部,将脉搏仪压力传感器所在位置对准左腕桡动脉端并调整腕带松紧。按下“开/关”按键后,腕带逐渐开始充气加压,压力传感器接收并记录脉搏对袖带的压力,当袖带压力增至传感器接收不到脉搏对袖带的压力时袖带逐渐开始放气减压,一直减到0为止,整个测量过程大约持续60s。
脉象类型由该团队三位副高及以上职称的中医师在双盲状态下进行诊断。具体来说,三位医师分别在三个的独立的房间里,被检者依次进入各个房间,医师通过手指切脉方式对脉象类别独立做出诊断,并记录下每位参与者对应的具体脉象。之后由实验助手对三位医师的脉诊结果进行比对,对于医师间诊断不一致的个体则行二次独立诊断并做好二次记录,如果结果依然不一致则判定为相兼脉,也就是同时具备两类脉象的特征。由于相兼脉的形成较为复杂且数量也比较少,因此不在本发明的讨论范围内。
(2)数据预处理和脉象信号识别模型
(2.1)用于迁移学习的心电数据的特征提取
本实施例共纳入了The PhysioNet Challenge 2017数据库中5925例心电样本,其中正常节律5154例,心房颤动771例。图8为心电波形示例图,其中(A)为正常节律,(B)为心房颤动节律。每个正常节律样本用大小为1000,步幅为1000的滑动窗进行分割,每个心房颤动样本用大小为1000,步幅为100的滑动窗进行分割,不同大小的步幅是为了让两类数据在处理后基本平衡。分割后共得到91217条心电记录,其中正常节律记录46894条,心房颤动记录44323条,每条记录都由1000个数值组成。之后对每条记录进行标准化,使其服从标准正态分布,进行标准化的主要目的是加快网络的收敛。
预处理后的心电数据以7:1:2的比例随机分配到训练集、验证集和测试集。因为数据集内存较大而显存有限,无法将整个数据集放入显存中进行网络的训练和测试,所以每个数据集都被划分成了数量不等的批次,每个批次由100条心电记录组成。之后逐训练集批次对网络进行训练,一次完整的训练集训练称为一个轮次,每个轮次训练后都用验证集对模型效果进行评估,一共训练500个轮次也意味着进行了500次评估。以验证集上宏F1分数最高的模型作为最终的房颤识别模型,以测试集对模型进行房颤识别效果评价。
在500个轮次的训练中,心电验证集上的总体宏F1分数最高能达到95.30%,对应的总体宏查准率和宏查全率为95.28%和95.32%。此时心电训练集上的总体宏查准率、宏查全率和宏F1分数分别为99.56%、99.54%和99.56%。用不参与模型训练过程的心电测试集对构建的房颤识别模型进行效果评价,结果显示测试集的总体宏查准率、宏查全率和宏F1分数分别是94.06%、94.04%和94.02%,其中心电正常节律和心房颤动节律的F1分数分别为94.05%和93.98%。心电训练集、验证集和测试集的详细房颤识别结果列于表2、表3和表4中。
表2The 2017PhysioNet Challenge训练数据集房颤识别结果
表3The 2017PhysioNet Challenge验证数据集房颤识别结果
表4The 2017PhysioNet Challenge测试数据集房颤识别结果
(2.2)脉象数据预处理和脉象识别模型
在剔除一部分相兼脉以及采集时受较大干扰而测定不准确的脉象数据后,本实施例共纳入了1831例个体的脉象数据,包括平脉343例,弦脉278例,滑脉208例,数脉199例,沉脉187例,虚脉176例,结代脉136例,迟脉134例,涩脉95例以及疾脉75例。十类脉象的波形示例见图9,其中(A)为沉脉,(B)为弦脉,(C)为虚脉,(D)为疾脉,(E)为平脉,(F)为数脉,(G)为滑脉,(H)为结代脉,(I)为涩脉,(J)为迟脉。脉象仪开始工作后的一段时间是腕带加压过程,结束工作前的一段时间腕带压力接近于0,在这两个时段仪器并没有有效采集脉象数据,因此研究选取了每个个体中间稳定波段的1000个采样点,这足以覆盖有效的采样区间。之后对每条数据进行标准化使其服从标准正态分布。
脉象识别模型构建过程中脉象数据在各个集上的分配方式、批次大小、训练轮次数以及最终模型选择方式都和房颤识别模型构建时相同,此处不再赘述。这里需要说明的是,考虑到脉象数据集中各类脉象数量较不均衡,运用了权重随机采样方法对训练数据进行重新抽样,因此训练集中各类脉象的数量基本是平衡的。
(2.3)脉象识别结果和评价
在500轮训练中,脉搏验证集的最高总体宏F1分数为93.59%,对应的总体宏查准率和宏查全率为94.29%和93.19%。与此同时,脉搏训练集的总体宏查准率、宏查全率和宏F1分数均为100.00%。对于脉搏测试集,总体的宏查准率、宏查全率和宏F1分数分别为89.96%、90.89%和90.28%,各类脉象的F1分数分别为平脉91.85%、弦脉92.59%、滑脉93.98%、数脉95.12%、沉脉89.47%、虚脉92.75%、结代脉92.31%、迟脉86.67%、涩脉84.21%以及疾脉83.87%。三个数据集上脉象识别的详细结果见表5、表6和表7。混淆矩阵图能够可视化每个数据集上各类脉象的错分情况,以测试集的弦脉为例,绝大多数样本被正确分类,有个别样本被错分成了数脉、涩脉和迟脉。脉象识别模型在三个数据集上的总体分类效果以及对各类脉象的分类效果都较为优良。
表5十类脉象的训练数据集识别结果
表6十类脉象的验证数据集识别结果
表7十类脉象的测试数据集识别结果
与以往脉象研究相比,本发明致力于自动提取脉搏信号中的特征对十类脉象进行准确识别,难度相对更高。为了实现波形特征自动提取,构建了DRNN模型并在大型心电数据集上对模型进行了预训练。结果显示心电测试集的总体宏F1分数为94.02%,表明了本发明的模型可以很好的提取心电信号中的一些波形特征,具有开展迁移学习的潜力。之后在预训练模型的基础上调整了最后的全连接层的神经元数并利用脉象数据对该层的参数进行了学习,使模型适用于脉象分类任务。结果显示脉搏测试集的总体宏F1分数为90.28%,说明基于深度残差网络的迁移学习方法在脉象识别上具有良好的应用性。模型之所以能有效区分十类脉象,有以下几个方面的原因:首先,层数多达19层的神经网络具有足够的效力来表征波形信号的复杂变化;其次,跳跃连接保证了神经网络在层数较深时依然能够有效传播梯度,学习更新各层参数;再者,样本量足够大的心电数据集可以让残差模型得到充分训练,更为准确地提取波形信号的一些底层特征;此外,池化操作、ReLU函数和Dropout技术有效改善了梯度消失和模型过拟合,增强了模型的泛化能力;最后,专业的医生团队保证了脉象数据收集的规范性以及脉象标签给定的准确性,高质量的脉象数据是实现脉象精准识别的前提。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种脉象分类识别方法,其特征在于,包括:
获取多个个体的原始心电数据;
对所述原始心电数据进行预处理,得到预处理后的心电数据;
采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;
获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉;
对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;
获取需要进行分类的脉象数据;
根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
2.根据权利要求1所述的脉象分类识别方法,其特征在于,所述对所述原始心电数据进行预处理,得到预处理后的心电数据,具体包括:
对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
3.根据权利要求1所述的脉象分类识别方法,其特征在于,所述采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型,具体包括:
将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
4.根据权利要求1所述的脉象分类识别方法,其特征在于,所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。
5.一种脉象分类识别***,其特征在于,包括:
心电数据获取模块,用于获取多个个体的原始心电数据;
心电数据处理模块,用于对所述原始心电数据进行预处理,得到预处理后的心电数据;
心电数据训练优化模块,用于采用深度残差神经网络模型对所述预处理后的心电数据进行训练和优化,得到训练优化后的心电数据预测模型;
脉象数据获取模块,用于获取多个个体的原始脉象数据,所述脉象数据包括平脉、弦脉、滑脉、数脉、沉脉、虚脉、结代脉、迟脉、涩脉和疾脉;
脉象数据处理模块,用于对所述原始脉象数据进行预处理,得到预处理后的脉象数据;
脉象数据训练优化模块,用于根据所述训练优化后的心电数据预测模型和所述预处理后的脉象数据采用迁移学习方法,得到训练优化后的脉象数据预测模型;
待分类数据获取模块,用于获取需要进行分类的脉象数据;
分类识别模块,用于根据所述训练优化后的脉象数据预测模型对所述脉象数据进行分类识别。
6.根据权利要求5所述的脉象分类识别***,其特征在于,所述心电数据处理模块,具体包括:
心电数据处理单元,用于对所述原始心电数据进行峰对齐和峰识别处理,得到处理后的心电数据。
7.根据权利要求5所述的脉象分类识别***,其特征在于,所述心电数据训练优化模块,具体包括:
心电数据分配单元,用于将所述预处理后的心电数据以7:1:2的比例随机分配到心电数据训练集、心电数据验证集和心电数据测试集;
训练单元,用于采用深度残差神经网络模型对所述心电数据训练集进行训练,得到训练后的心电数据预测模型;
优化单元,用于根据所述心电数据验证集上宏F1分数最高的训练后的心电数据预测模型作为优化后的心电数据预测模型;
识别效果评价单元,用于根据所述心电数据测试集对所述优化后的心电数据预测模型进行房颤识别效果评价。
8.根据权利要求6所述的脉象分类识别***,其特征在于,所述深度残差神经网络模型包括15个卷积层、1个适应性平均池化层、1个全连接层以及输入层和输出层,还包括7个残差单元,其中4个残差单元对前面层的输入进行最大池化运算后与后面层的输出进行加和,作为下一个残差单元的输入,其中3个残差单元则将前面层的输入与后面层的输出直接进行加和,当残差单元前后层的维数不相等时,使用零值填充的方式对前面层的输入进行维数扩充,使前面层的输入和后面层的输出具有相等的维数便于进行加和,层和层之间还加入了BatchNorm、ReLU函数和Dropout深度学习方法。
CN202310049180.1A 2023-02-01 2023-02-01 一种脉象分类识别方法及*** Pending CN116451129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310049180.1A CN116451129A (zh) 2023-02-01 2023-02-01 一种脉象分类识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310049180.1A CN116451129A (zh) 2023-02-01 2023-02-01 一种脉象分类识别方法及***

Publications (1)

Publication Number Publication Date
CN116451129A true CN116451129A (zh) 2023-07-18

Family

ID=87130931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310049180.1A Pending CN116451129A (zh) 2023-02-01 2023-02-01 一种脉象分类识别方法及***

Country Status (1)

Country Link
CN (1) CN116451129A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117582185A (zh) * 2024-01-19 2024-02-23 季华实验室 一种基于cllsr混合模型的脉力等级预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117582185A (zh) * 2024-01-19 2024-02-23 季华实验室 一种基于cllsr混合模型的脉力等级预测方法
CN117582185B (zh) * 2024-01-19 2024-05-07 季华实验室 一种基于cllsr混合模型的脉力等级预测方法

Similar Documents

Publication Publication Date Title
CN109998525B (zh) 一种基于判别式深度置信网络的心律失常自动分类方法
CN106251880A (zh) 识别生理声音的方法以及***
CN109864714A (zh) 一种基于深度学习的心电信号分析方法
CN108024730A (zh) 使用数学分析和机器学习来诊断疾病的方法和***
CN110619322A (zh) 一种基于多流态卷积循环神经网络的多导联心电异常信号识别方法及***
CN109846472A (zh) 基于BiLSTM-Attention深度神经网络的心搏分类方法
CN107832737A (zh) 基于人工智能的心电图干扰识别方法
WO2021164345A1 (zh) 一种血压预测的方法和装置
CN112826513B (zh) 一种基于深度学习和特异性矫正在fecg上胎儿心率检测***
CN110558960A (zh) 一种基于ptt和miv-ga-svr的连续血压无创监测方法
CN104473660A (zh) 一种基于子带能量包络自相关特征的异常心音识别方法
CN113349793A (zh) 一种基于分层注意力模型的心律失常分类方法
CN114847905B (zh) 一种心率失常数据检测识别方法及***
CN113509186A (zh) 基于深度卷积神经网络的ecg分类***与方法
CN116451129A (zh) 一种脉象分类识别方法及***
CN113729648B (zh) 一种基于多脉搏传感器的穿戴式脉诊手环***
CN117153379B (zh) 一种胸廓出口综合征的预测装置
CN111329467A (zh) 一种基于人工智能的心脏疾病辅助检测方法
Tung et al. Multi-lead ECG classification via an information-based attention convolutional neural network
Li et al. Detection of muscle fatigue by fusion of agonist and synergistic muscle semg signals
CN117582235A (zh) 基于cnn-lstm模型的心电信号分类方法
CN116649924A (zh) 一种脉搏分析方法及装置
CN114145725B (zh) 一种基于无创连续血压测量的ppg采样率估算方法
CN116451110A (zh) 基于信号能量特征和脉搏周期的血糖预测模型构建方法
CN112842355B (zh) 基于深度学习目标检测的心电信号心搏检测识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20230718

WD01 Invention patent application deemed withdrawn after publication