CN109907751B

CN109907751B - 一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法

Info

Publication number: CN109907751B
Application number: CN201910147228.6A
Authority: CN
Inventors: 严洋; 严金川
Original assignee: Individual
Current assignee: Individual
Priority date: 2019-02-27
Filing date: 2019-02-27
Publication date: 2021-02-02
Anticipated expiration: 2039-02-27
Also published as: CN109907751A

Abstract

发明公开了一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法，属于人工智能医疗技术领域，包括AI***，AI***获取临床医生、患者信息和数据库信息，AI***将从数据库中找出疾病的诊断标准，对每个标准与患者入院后收集到的实际情况进行比较，如果比较结果匹配，则警告***将不会启动，如果结果不一致，人工智能会发出警报，提醒临床医生重新检查患者的诊断。本发明将人工智能与胸痛的检查联合起来，实现智能化医学检验，增加判断的灵敏度和正确率。

Description

一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法

技术领域

本发明人工智能与机器学习融合的医疗技术领域，具体涉及一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法。

背景技术

近年来，人工智能领域取得了飞速发展，其应用也越来越广泛，人工智能离不开数据分析和机器学习，研究智能数据分析的理论和方法已经成为人工智能的必要基础之一。它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。

胸痛是一种常见而又能危及生命的病症，造成胸痛的原因复杂多样，包括急性冠脉综合征(ACS)、主动脉夹层、肺栓塞(PE)、心包填塞等，其中ACS在这些严重危及生命的疾病中所占比例最高，心肌梗死(AMI)的误诊率在3％～5％，主动脉夹层动脉瘤的发病率约0.5～1/10万人，如果误诊其死亡率超过90％。PE的发病率大约70/10万人，自发性气胸发病率2.5～18/10万人，食管破裂发病率是12.5/10万人。2009年，北京急性胸痛注册研究，共入选5666例患者，结果显示胸痛患者占急诊就诊患者的4％，其中ACS占27.4％。如何快速、准确诊断和鉴别ACS及其他致死性胸痛的病因，成为急诊处理的难点和重点。

因此将人工智能与胸痛的检查联合起来，尤其是将心电数据和血液等实验室常规数据检测结合起来，实现智能化医学鉴定，增加判断的灵敏度和正确率，变得尤为重要。

发明内容

针对现有技术的不足，本发明公开了一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法，将人工智能与胸痛的检查联合起来，尤其是将心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体和动脉血样分压数据融合识别，实现智能化医学鉴定，增加对胸痛疾病辅助判断的灵敏度和正确率。

本发明通过以下技术方案予以实现：

基于人工智能监督学习的实验室胸痛数据检查辅助识别方法，包括AI***，所述AI***获取临床医生诊断信息、患者实验室检查信息和数据库信息，并对患者实验室检查的心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D聚体、动脉血样分压数据进行融合分析处理；所述AI***将从数据库中找出对患者实验室检查信息的诊断标准，与患者入院后临床医生诊断信息的分析标准进行比较，如果比较结果匹配，则警告***将不会启动，如果结果不一致，人工智能会发出警报，提醒临床医生重新对患者进行检查。

进一步，进行融合分析处理过程中，包括：

AI***采用改进Tri-Training算法实现对肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体和动脉血样分压数据的半监督学习：

算法输入为：通过数据采样获得肌钙蛋白，肌红蛋白、肌酸激酶同工酶含量、D-二聚体；动脉血样分压的样本数据，将样本数据分为无标记样本集U，Must-link约束集M，Cannot-link约束集C，标记样本选取的最大数目为N_max；算法输出为：D-二聚体两个区间划分、心肌损伤标志物区间划分、血气分析三个区间划分，将上述划分为有标记样本集R′和更新后的无标记样本集U′；

A1，初始化已标记样本数目N＝0，

U′＝U；

A2，然后，对于

由下述公式计算其对应的样本间距离：

其中d为样本属性数目，从M中确定具有最大距离值的样本对(x_i′，x_j′)，x_i′为用户标注样本，y_i′为得到的类别，令(x_i′，y_i′)，和(x_j′，y_i′)添加到R′中，x_i′和x_j′从U′中删除，N＝N+2；

A3，对于

由下述公式计算其对应的样本间距离：

其中从C中确定具有最小距离值的样本对(x_p′，x_q′)，x_p′为用户标注样本，y_p′为得到的类别，令(x_p′，y_p′)，和(x_q′，-y_p′)添加到R′中，-y_p′与y_p′为相反的类别，将x_p′和x_q′从U′中删除，N＝N+2；

A4，若N＜N_max，则转向步骤A2，否则，算法结束；

引入聚类算法，解决在心肌损伤标志物、D-2聚体、血气分析数据处理过程中带来不必要的样本误判，产生更合适的数据划分；

输入：标记样本

未标记样本

其中U为未标记样本数，令标签数目为labelN，总样本为allN，正样本数目为posN，负样本数目为negN；

首先，对每个有标签数据求其与其他点的欧氏距离Kdist，自小到大排序为：

其次，求取有标签数据前后两个距离的差值rate：

rate＝abs(Kdist(i，j+1)-Kdist(i，j))；

再次，通过距离差值获得聚类算法中的领域参数Eps和输入参数MinPts，其中，领域参数Eps为对x_j属于数据集D＝{x₁，x₂，...，x_m，}，包含样本集中数据集D与x_j的Eps的样本，MinPts为一个样本点的Eps领域中包含最少的对象数目，同一个MinPts为j时，当前后两个数变化幅度小于0.01则认定达到初步收敛；

最后获取标签，令噪声点为为负样本，剩下的为正样本；输出为y∈{1，-1}^u，即未标记数据的标记指派；记

为不同类别比例下聚类算法对未标记数据的预测结果，T为类别比例个数，y^middle为预测中结合正负样本在未标记数据中的预测结果，对于聚类算法采用最坏情况集成多个预测结果y^*可以表示为：

进一步，进行融合分析处理过程中，还包括：AI***通过改进支持向量机算法对患者信息的心电信号进行处理，具体包括以下步骤：

S1，对采集的心电数据进行预处理，噪声滤波，提取心电数据的时域特征，并生成心电数据训练样本集；对采集的心电数据进行特征提取的数据包括正常P波、QRS波群、T波、PR间期、RR间期、ST段，其中，将ST段弓背向上抬高或压低、两支不对称T波作为附加提取特征；

S2,对心电数据训练样本集进行分类，设置参数Z和Z^*，采用支持向量机算法对带标签样本(x₁，y₁),……,(x_n，y_n)进行训练，并构建出初始的分类器，然后对具有正标签值的不带标识的示例x₁ ^*,……,x_k ^*的数量n_abn进行设置，其中Z和Z^*是训练指定的参数；

S3，由S2得到的分类器对不带标识的示例x₁ ^*,……,x_k ^*进行分类，并且根据w×x_j ^*+b的输出值对每个不带标签样本的标签进行赋值，w为权值，b为定值参数，输出值最大的n_abn个不带标签样本的指定为y_j ^*＝1，其余的样本指定为y_j ^*＝-1，然后设置参数Z^* _n和Z^* _abn；重新对样本进行训练，获得第二个分类器，设置Z^*的值小于Z，找到具有不同标签值的一组测试示例，并对其标签值进行交换，使得式中的优化目标函数值最大程度减小，重复这一步骤，直到不满足条件结束；

S4逐步增加调节参数Z^* _n和Z^* _abn的值，并重新回到S3执行，当Z^* _n>Z^*且Z^* _abn>Z^*时，算法结束，以达到识别出2-3个相邻导联呈现ST段的弓背向上抬高(或压低)，以及心电图为异常高大且两支不对称的T波的目的。

进一步，AI***对采集的心电数据进行特征提取过程中，包括以下步骤：

S1.1，构造一个稀疏二进制随机矩阵，将其作为观测矩阵Q，基于压缩感知模型Y＝QX对预处理后的心电信号进行观测，得到心电信号的压缩值；

S1.2，跳过心电信号重构步骤，使用改进的主成分分析方法直接对压缩后的心电数据进行特征提取，得到心电信号的特征向量；

S1.3，将S1.2中所提取的正常P波、QRS波群、T波、PR间期、RR间期、ST段特征向量，以及附加提取特征向量作为分类器的输入。

进一步，S1.2中也可以采用卷积CNN对心电数据特征提取，其中卷积CNN包括三层，卷积层一Conv1、第一层池化层一Pooling1和归一化层一BN1，Conv1的卷积核大小为6×6，步长为3，共166个卷积核；卷积层二Conv2和归一化层二BN2，Conv2的卷积核大小为5×5，步长为3，共128个卷积核；池化层三Pooling3和归一化层三BN3，Conv3的卷积核大小为3×3，步长为1，共128个卷积核；然后依次连接Inception结构、卷积层四Conv4和全局池化层，由分类器对输出结果进行分类，所述分类器采用Softmax分类，以此提高心电数据分类精度和效率。

进一步，对采集的心电数据进行预处理中还包括：

S41利用sql语句对其中的属性特征进行提取，编写递归函数，进行关键字提取，若出现关键字所表示的疾病，就记为1，否则为0；

S42将分布在不同数据库或数据表中的数据进行合并与集成；

S43将S42中特征属性进行离散化；

S44对S43中数据清洗，删除重复、异常、冗余数据。

进一步，进行融合分析处理过程中，处理数据需要满足以下顺序：

步骤a，将D-二聚体进行两个区间划分：0<D-二聚体<500ug/L，D-二聚体＞500ug/L，当0<D-二聚体<500ug/L时进入步骤b；

步骤b，对心肌损伤标志物进行区间划分：TNI(肌钙蛋白I)为0-0.05ng/ml，肌红蛋白为0-107ng/ml，CKMB(肌酸激酶同工酶)为0-4.3ng/ml；当TNI(肌钙蛋白I)＞0.05ng/ml或者TNI(肌钙蛋白I)＞0.05ng/ml加上其余两项任一项或两项超标进入步骤c；

步骤c，进行血气分析三个区间划分：1)83-108mmhg；2)小于83mmhg；3)大于108mmhg；当血样分压小于83mmhg，进入步骤d；

步骤d，心电数据分析：出现2～3个相邻导联呈现ST段≥1mm的弓背向上抬高(或压低)；或者如果心电图为异常高大且两支不对称的T波。

进一步，所述数据库运行于win7环境，采用Microsoft公司的SQL Server 2000数据库管理***作为开发工具，Microsoft的VC+6.0作为数据库前端，CPU：AMD XP1800+，内存kingston 3G DDR，硬盘戴尔600G。

进一步，所述AI***为PC机，Intel/英特尔酷睿i5-8500盒装处理器，CPU主频:3.0GHz，16G内存，操作***Windows7X64,开发工具Matlab2010。

本发明的有益效果为：

本发明的创新点在于，对患者实验室检查的心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体、动脉血样分压数据进行融合分析处理，实现对胸痛实验室数据的快速识别，提高辅助识别的效率，有助于辅助医生实现对ACS等胸痛疾病的逐步判断，提高人工算法的统筹融合。增加辅助判断的灵敏度和正确率。

本发明将人工智能与胸痛的检查联合起来，实现智能化医学鉴定，增加判断的灵敏度和正确率，在数据库上进行实验，该方法得到了97.85％的准确度。实验结果表明，与在非压缩域上心电信号分类准确度相比，可以压缩掉约33％的心电数据。因此，该方法在具有低功耗和实时性需求的可穿戴式健康监测***中具有一定的可行性，也为今后在压缩域上进行心电信号处理研究工作奠定了良好的基础。

在改进Tri-Training算法的基础上引入半监督聚类，解决分类器过分依赖于有标签的数据，带来分类性能下降的问题，在心肌损伤标志物、D-2聚体、血气分析数据处理过程中带来不必要的样本误判，引入该算法能够有效提高学习性能和稳定性，产生更合适的数据划分，使得数据样本处理更加准确，提高对心脏疾病的诊断准确率。在对心电数据进行分类识别中，改进的SVM算法泛化能力和识别精度都能够满足对于ST段和T波异常的有效识别，在SVM分类前进行卷积神经网络进行心电数据的特征提取，进一步提高了对心肌梗死的辅助诊断的精度和效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的流程示意图；

图2是本发明实施例改进Tri-Training算法流程图；

图3是本发明实施例改进SVM算法的心电数据训练流程图。

图4为本发明实施例改进Tri-Training算法分类结果对照图；

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示的基于人工智能监督学习的实验室胸痛数据检查辅助识别方法，包括AI***，所述AI***获取临床医生诊断信息、患者实验室检查信息和数据库信息，并对患者实验室检查的心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体、动脉血样分压数据进行融合分析处理；所述AI***将从数据库中找出对患者实验室检查信息的诊断标准，与患者入院后临床医生诊断信息的分析标准进行比较，如果比较结果匹配，则警告***将不会启动，如果结果不一致，人工智能会发出警报，提醒临床医生重新对患者进行检查。

为了提高辅助识别的效率，实现逐步判断，提高人工算法的统筹融合识别，AI***对于采集的数据进行分析需要满足先后顺序：

所述数据库运行于win7环境，采用Microsoft公司的SQL Server 2000数据库管理***作为开发工具，Microsoft的VC+6.0作为数据库前端，CPU：AMD XP1800+，内存kingston3G DDR，硬盘戴尔600G。

所述AI***为PC机，Intel/英特尔酷睿i5-8500盒装处理器，CPU主频:3.0GHz，16G内存，操作***Windows7X64,开发工具Matlab2010。

患者信息的数据包括心电数据ST段波形和T波；肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量；D-二聚体和动脉血样分压。数据库的特征包括疑似肺栓塞、急性冠脉综合和心肌梗死特征。

本实施例将人工智能与胸痛数据的检查联合起来，尤其是将心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体和动脉血样分压数据融合识别，增强对于急性冠脉综合征(ACS)、肺栓塞、急性冠脉综合征(ACS)中的心肌梗死实现智能化医学鉴定，增加判断的灵敏度和正确率。

AI***在进行实验室胸痛检查时，先要比较判断患者采集的指标信息，包括心电数据(主要是ST段波形、T波)；肌钙蛋白，肌红蛋白、肌酸激酶同工酶含量；D-二聚体；动脉血样分压；数据库中找出对患者实验室检查信息的诊断标准为：

将D-二聚体划分不同区间，当D-二聚体<500ug/L，可以基本除外急性肺血栓栓塞症；当D-二聚体＞500ug/L，需行增强CT检查判断是会否为肺栓塞；

判断心肌损伤标志物：当出现急性冠脉综合征时心梗三项检查异常升高；TNI(肌钙蛋白I)0-0.05ng/ml，肌红蛋白0-107ng/ml，CKMB(肌酸激酶同工酶)0-4.3ng/ml；TNI(肌钙蛋白I)＞0.05ng/ml或者TNI(肌钙蛋白I)＞0.05ng/ml加上其余两项任一项或两项超标，提示为急性冠脉综合征；

进行血样分析：1)成人正常动脉血样分压：83-108mmhg；2)小于83mmhg为低氧血症，大于108mmhg为高氧血症；

结合心电数据分析进一步判断急性冠脉综合征是不是属于心肌梗死病症：出现2～3个相邻导联呈现ST段≥1mm的弓背向上抬高(或压低)；或者如果心电图为异常高大且两支不对称的T波，则为ST段抬高的急性心肌梗死的超急期。

如图2所示，在算法应用的过程中，采用改进Tri-Training算法实现上述步骤1-3的半监督学习，具体过程为：

算法输入为：通过数据采样获得肌钙蛋白，肌红蛋白、肌酸激酶同工酶含量、D-二聚体；动脉血样分压的样本数据，将样本数据划分为：无标记样本集U，Must-link约束集M，Cannot-link约束集C，标记样本选取的最大数目为N_max；算法输出为：D-二聚体两个区间划分、心肌损伤标志物区间划分、血气分析三个区间划分；通过上述划分得出常见胸痛疾病的分类，实验室胸痛检查中常见的肺栓塞、急性冠脉综合征，将这两种病症划分为有标记样本集R′和更新后的无标记样本集U′：

A1，初始化已标记样本数目N＝0，

U′＝U：

A2，然后，对于

由下述公式计算其对应的样本间距离：

A3，对于

由下述公式计算其对应的样本间距离：

其中从C中确定具有最小距离值的样本对(x_p′，x_q′)，x_p′为用户标注样本，y_p′为得到的类别，令(x_q′，y_p′)，和(x_q′，-y_p′)添加到R′中，-y_p′与y_p′为相反的类别，将x_p′和x_q′从U′中删除，N＝N+2；

A4，若N＜N_max，则转向步骤A2，否则，算法结束。

在改进Tri-Training算法的基础上引入半监督聚类，解决分类器过分依赖于有标签的数据，带来分类性能下降的问题，在心肌损伤标志物、D-2聚体、血气分析数据处理过程中带来不必要的样本误判，引入该算法能够有效提高学习性能和稳定性，产生更合适的数据划分，使得数据样本处理更加准确，提高对心脏疾病的诊断准确率。如图4所示。

输入：标记样本

未标记样本

其次，求取有标签数据前后两个距离的差值rate：

rate＝abs(Kdist(i，j+1)-Kdist(i，j))；

再次，通过距离差值获得聚类算法中的领域参数Eps和输入参数MinPts，其中，领域参数Eps为对x_j属于数据集D＝{x₁，x₂，...，x_m，}，包含样本集中数据集D与x_j的Eps的样本，MinPts为一个样本点的Eps领域中包含最少的对象数目，同一个MinPts为j时，当前后两个数变化幅度小于0.01则认定达到初步收敛，次数在两次以上则MinPts和Eps语句表达为：

MinPts＝j；

Epsl＝mean(Kdist(1：posN，j))；

Eps2＝mean(Kdist(posnum+1：posN+negN，j))；

Eps2＝mean(Kdist(1：posN+negN，j))；

为不同类别比例下聚类算法对未标记数据的预测结果，T为类别比例个数，y^middle为预测中结合正负样本在未标记数据中的预测结果，对于半监督聚类算法采用最坏情况集成多个预测结果y^*可以表示为：

如图3所示，AI***通过改进支持向量机算法提取步骤4中，患者信息的心电信号，具体包括以下步骤：

S1，对采集的心电数据进行预处理，噪声滤波，提取心电数据的时域特征，并生成心电数据训练样本集；心电数据训练样本集包括正常P波、QRS波群、T波、PR间期、RR间期、ST段，其中，将ST段弓背向上抬高(或压低)、两支不对称T波作为附加提取特征；

S2，对心电数据训练样本集进行分类，设置两个参数Z和Z^*，采用支持向量机算法对带标签样本(x₁，y₁)，……，(x_n，y_n)进行训练，并构建出初始的分类器，然后对具有正标签值的不带标识的示例x₁ ^*，……，x_k ^*的数量n_abn进行设置，其中Z和Z^*是训练指定的参数；

S3，由S2得到的分类器对不带标识的示例x₁ ^*,……,x_k ^*进行分类，并且根据w×x_j ^*+b的输出值对每个不带标签样本的标签进行赋值，输出值最大的n_abn个不带标签样本的指定为y_j ^*＝1，其余的样本指定为y_j ^*＝-1，然后设置参数Z^* _n和Z^* _abn；重新对样本进行训练，获得第二个分类器，设置Z^*的值小于Z，找到具有不同标签值的一组测试示例，并对其标签值进行交换，使得式中的优化目标函数值最大程度减小，重复这一步骤，直到不满足条件结束；

S4逐步增加调节参数Z^* _n和Z^* _abn的值，并重新回到S3执行，当Z^* _n>Z^*且Z^* _abn>Z^*时，算法结束，最后得到分类结果，以达到识别出2-3个相邻导联呈现ST段的弓背向上抬高(或压低)，以及心电图为异常高大且两支不对称的T波的目的。

AI***对采集的心电数据进行特征提取过程中，包括以下步骤：

作为本发明的一个实施例，也可以采用卷积CNN对心电数据特征提取，其中卷积CNN包括三层，卷积层一Conv1、第一层池化层一Pooling1和归一化层一BN1，Conv1的卷积核大小为6×6，步长为3，共166个卷积核；卷积层二Conv2和归一化层二BN2，Conv2的卷积核大小为5×5，步长为3，共128个卷积核；池化层三Pooling3和归一化层三BN3，Conv3的卷积核大小为3×3，步长为1，共128个卷积核；然后依次连接Inception结构、卷积层四Conv4和全局池化层，由分类器对输出结果进行分类，所述分类器采用Softmax分类，以此提高心电数据分类精度和效率。

数据库信息包括数据预处理与特征选择，具体为：

S42将分布在不同数据库或数据表中的数据进行合并与集成；

S43将S42中特征属性进行离散化；

S44对S43中数据清洗，删除重复、异常、冗余数据。

作为胸痛实验室检查的一个实施例，如果患者患有心肌梗死：则需要满足：心电图出现2～3个相邻导联呈现ST段≥1mm的弓背向上抬高(或压低)；或者如果心电图为异常高大且两支不对称的T波。在对心电数据进行分类识别中，改进的SVM算法泛化能力和识别精度都能够满足对于ST段和T波异常的有效识别，进一步提高了对心肌梗死的辅助诊断。

本实施例针对心电数据信息采集分类之前必须加以预处理。胸痛数据集类型结构复杂，既有检查检验等纯数字型数据，又包含了如患者既往史、个人史及病程记录等文本数据。文本数据并不能直接作为特征输入，而在检查检验表中各项指标的单位不同，并且不同指标间的数值数量级也不在同一层面上，若直接使用原始数据作为分类模型的输入参数，可能导致数值较大的属性在分类过程中占据较大的权重，影响分类效果。

其中胸痛数据集中的入院记录表和病程记录表是以文本的形式存在的，如入院记录表中的既往史项内容：有无糖尿病、高血压、肝炎。因此先要对其中的属性特征进行提取，这里主要使用sql语句，编写递归函数，进行关键字提取，如果出现关键字所表示的疾病，就记为1，否则为0。由于有关患者胸痛的数据分布在不同的数据表中，如患者个人信息表，各种检查表等。因此想要对数据有更加全面的认识，必须要将分散在不同地方的数据进行整合。对心脏病患者进行诊断时，部分特征信息并不需要具体数值，只需要对相关范围进行判断即可。

在进行心电数据的采集中，将相关特征属性进行离散化，离散之后的数据更为稀疏，在分类模型的训练中可以提高分类器的计算速度。心电数据各个数据表中会包含大量的无用或者对当前疾病诊断价值比较低的数据，对后续数据分析造成干扰，影响分析的准确性，因此，要对其进行清洗。同时，胸痛病历数据特征项维数较多，其中包含有对胸痛分类无用或者用处较小的特征，因此要对该部分特征进行删除，提取出对分类结果影响较大的特征。

删除各个表中的对胸痛诊断无用或价值较小的属性，在患者个人信息表中选取了患者年龄、性别2个属性，既往史中选取了与胸痛相关的患者高血压史、糖尿病史、肝炎史3个属性，个人史选取了是否吸烟1个属性，体格检查选取了体温、脉搏、呼吸、血压、营养状态5个属性，常见症状选取了胸痛、呼吸困难、心悸、发绀、晕厥、水肿、咳嗽、咳血、心率衰竭、心率失常10个属性，常见体征选取了高血压、低血压、心脏震颤、心动过速、心动过缓、心音改变、心脏杂音、脉搏异常、心脏扩大9个属性，检查检验项目选取了典型的肌钙蛋白，肌红蛋白、肌酸激酶同工酶含量；D-二聚体；动脉血样分压这几个属性。

本发明首先由临床医生给出诊断。根据临床医生的诊断，人工智能将从数据库中找出疾病的诊断标准A，并将每个标准与病人入院后收集到的实际情况标准B进行比较。如果比较结果匹配，则警告***将不会启动。如果结果不一致，人工智能会发出警报，提醒临床医生重新检查他/她的诊断。在数据库上进行实验，该方法得到了97.85％的准确度。实验结果表明，与在非压缩域上心电信号分类准确度相比，可以压缩掉约33％的心电数据。因此，该方法在具有低功耗和实时性需求的可穿戴式健康监测***中具有一定的可行性，也为今后在压缩域上进行心电信号处理研究工作奠定了良好的基础。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.基于人工智能监督学习的实验室胸痛数据检查辅助识别***，其特征在于，包括AI***，所述AI***获取临床医生诊断信息、患者实验室检查信息和数据库信息，并对患者实验室检查的心电数据和肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体、动脉血样分压数据进行融合分析处理；

进行融合分析处理中包括：AI***采用改进Tri-Training算法实现对肌钙蛋白、肌红蛋白、肌酸激酶同工酶含量、D-二聚体和动脉血样分压数据的半监督学习：算法输入为：通过数据采样获得肌钙蛋白，肌红蛋白、肌酸激酶同工酶含量、D-二聚体；动脉血样分压的样本数据，将样本数据分为无标记样本集U，Must-link约束集M，Cannot-link约束集C，标记样本选取的最大数目为N_max；算法输出为：D-二聚体两个区间划分、心肌损伤标志物区间划分、血气分析三个区间划分，将上述划分为有标记样本集R′和更新后的无标记样本集U′；

AI***通过改进支持向量机算法对患者信息的心电信号进行处理，包括对采集的心电数据进行预处理，噪声滤波，提取心电数据的时域特征，并生成心电数据训练样本集；对采集的心电数据进行特征提取的数据包括正常P波、QRS波群、T波、PR间期、RR间期、ST段，其中，将ST段弓背向上抬高或压低、两支不对称T波作为附加提取特征；对心电数据训练样本集进行分类，设置参数Z和Z^*，采用支持向量机算法对带标签样本(x₁，y₁)，……，(x_n，y_n)进行训练，并构建出初始的分类器，然后对具有正标签值的不带标识的示例x₁ ^*，……，x_k ^*的数量n_abn进行设置，其中Z和Z^*是训练指定的参数；由分类器对不带标识的示例x₁ ^*，……，x_k ^*进行分类，并且根据w×x_j ^*+b的输出值对每个不带标签样本的标签进行赋值，w为权值，b为定值参数，输出值最大的n_abn个不带标签样本的指定为y_j ^*＝1，其余的样本指定为y_j ^*＝-1，然后设置参数Z^* _n和Z^* _abn；重新对样本进行训练，获得第二个分类器，设置Z^*的值小于Z，找到具有不同标签值的一组测试示例，并对其标签值进行交换，使得式中的优化目标函数值最大程度减小；逐步增加调节参数Z^* _n和Z^* _abn的值，当Z^* _n＞Z^*且Z^* _abn＞Z^*时，算法结束，以达到识别出2-3个相邻导联呈现ST段的弓背向上抬高或压低，以及心电图为异常高大且两支不对称的T波的目的；

采用卷积CNN对心电数据特征提取，其中卷积CNN包括三层，卷积层一Conv1、第一层池化层一Pooling1和归一化层一BN1，Conv1的卷积核大小为6×6，步长为3，共166个卷积核；卷积层二Conv2和归一化层二BN2，Conv2的卷积核大小为5×5，步长为3，共128个卷积核；池化层三Pooling3和归一化层三BN3，Conv3的卷积核大小为3×3，步长为1，共128个卷积核；然后依次连接Inception结构、卷积层四Conv4和全局池化层，由分类器对输出结果进行分类，所述分类器采用Softmax分类；

所述AI***将从数据库中找出对患者实验室检查信息的诊断标准，与患者入院后临床医生诊断信息的分析标准进行比较，如果比较结果匹配，则警告***将不会启动，如果结果不一致，人工智能会发出警报，提醒临床医生重新对患者进行检查。

2.根据权利要求1所述的基于人工智能监督学习的实验室胸痛数据检查辅助识别***，其特征在于，所述数据库运行于win7环境，采用Microsoft公司的SQL Server 2000数据库管理***作为开发工具，Microsoft的VC+6.0作为数据库前端，CPU：AMD XP1800+，内存kingston 3G DDR，硬盘戴尔600G。

3.根据权利要求1所述的基于人工智能监督学习的实验室胸痛数据检查辅助识别***，其特征在于，所述AI***为PC机，Intel/英特尔酷睿i5-8500盒装处理器，CPU主频：3.0GHz，16G内存，操作***Windows7X64，开发工具Matlab2010。