CN114203298A - 基于深度神经网络的辅助诊断方法及*** - Google Patents

基于深度神经网络的辅助诊断方法及*** Download PDF

Info

Publication number
CN114203298A
CN114203298A CN202111536753.0A CN202111536753A CN114203298A CN 114203298 A CN114203298 A CN 114203298A CN 202111536753 A CN202111536753 A CN 202111536753A CN 114203298 A CN114203298 A CN 114203298A
Authority
CN
China
Prior art keywords
diagnosis
neural network
deep neural
names
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111536753.0A
Other languages
English (en)
Inventor
李涛
孙钊
吴军
冯德杰
王琪琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Msunhealth Technology Group Co Ltd
Original Assignee
Shandong Msunhealth Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Msunhealth Technology Group Co Ltd filed Critical Shandong Msunhealth Technology Group Co Ltd
Priority to CN202111536753.0A priority Critical patent/CN114203298A/zh
Publication of CN114203298A publication Critical patent/CN114203298A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提供了一种基于深度神经网络的辅助诊断方法及***,涉及人工智能技术领域,方法包括获取患者信息,将患者信息向量化;若患者信息中不包括诊断信息,将向量化的患者信息输入训练好的深度神经网络模型,基于深度神经网络模型的输出,得到若干个辅助诊断名称;若患者信息中包括诊断信息,按照预设的匹配规则,将诊断信息与预设的诊断库内的诊断名称进行匹配,得到若干个辅助诊断名称。本发明利用深度学习算法,根据患者信息进行辅助诊断,避免了诊断推荐依赖医生输入字符和输入字符后匹配到的诊断名称排序不合理的情况,为医生下诊断和采取进一步的治疗方案提供准确参考,提高医生的工作效率和患者的就医体验。

Description

基于深度神经网络的辅助诊断方法及***
技术领域
本发明涉及人工智能技术领域,尤其是基于深度神经网络的辅助诊断***。
背景技术
医生下诊断是整个医疗过程中最为重要一个工作,随着医疗信息化水平的不断提高,医生目前主要在信息***中录入诊断,而医生每天面临大量的患者就医,临床诊断缺乏标准统一的规范,手动输入诊断极大降低了医生的工作效率和患者的就医体验;另一方面由于下诊断需要综合考虑患者的信息,对医生的专业素养要求高,经验浅的年轻医生下的诊断不合理,还会造成医疗事故和医疗纠纷的增加。
以神经网络为代表的深度学习技术的发展,为高效准确的推荐诊断提供了一定的可能,利用深度学习辅助医生开具诊断,对减少医生工作量,提升医生工作效率,具有非常重要的意义。
现阶段的辅助诊断手段主要是构建诊断名称的数据库,根据医生的手工输入进行匹配,但是由于匹配库中的诊断不全,导致匹配不到医生想要下的诊断,必须手动输入诊断全称,这对每天面对大量病患的医生来说无疑是较为耗时耗力的,而且无法帮助医生获得更准确合理的诊断。
发明内容
本发明提供了基于深度神经网络的辅助诊断***,用于解决现有辅助诊断手段给出的匹配结果不准确的问题。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种基于深度神经网络的辅助诊断方法,所述辅助诊断方法包括以下步骤:
获取患者信息,将所述患者信息向量化;
若所述患者信息中不包括诊断信息,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;
若所述患者信息中包括诊断信息,按照预设的匹配规则,将所述诊断信息与预设的诊断库内的诊断名称进行匹配,得到若干个辅助诊断名称。
进一步地,所述辅助诊断方法在所述步骤之前还包括构建患者信息库D和诊断库D’;
所述患者信息库中包括患者ID、年龄、性别、主诉和诊断名称;所述诊断库中包括诊断名称,以及当前诊断名称在每个科室下的概率值。
进一步地,所述患者信息包括年龄、性别和主诉。
进一步地,所述深度神经网络模型的结构具体为:
将年龄向量Ap通过一个全连接网络mlp1转化为
Figure BDA0003412319550000021
将性别向量Sp通过另一个全连接网络mlp2转化为
Figure BDA0003412319550000022
将主诉对应的矩阵
Figure BDA0003412319550000023
经双向LSTM模型后输出
Figure BDA0003412319550000024
与诊断名称向量Yp形成注意力矩阵Att,
Figure BDA0003412319550000025
d为诊断名称向量的维度;
Figure BDA0003412319550000026
和Att结合,得到
Figure BDA0003412319550000027
Figure BDA0003412319550000028
通过两层全连接网络得到预测的诊断向量
Figure BDA0003412319550000029
其中WY和bY分别为权重和偏置;
将YP
Figure BDA00034123195500000210
的focal Loss交叉熵作为深度神经网络模型的损失函数。
进一步地,所述深度神经网络模型的训练具体为:
将训练集分成若干个batch,将batch中每个患者经所述深度神经网络模型的结构,得到每个batch的平均损失
Figure BDA00034123195500000211
以最小化所述平均损失作为训练目标;
在训练过程中,设置记录验证集准确度的参数acc,在训练完一个batch后,计算当前验证集准确度α,当α大于acc时,保存模型并更新acc为α;
基于循环约束机制训练完后,保存准确度参数acc。
进一步地,所述循环约束机制具体为:
设置更新循环步数和最大停滞步数;
当所述准确度参数更新时,所述更新循环步数赋值为0,当所述准确度参数未更新时,所述更新循环步数的值加1;
在所述更新循环步数的值超过所述最大停滞步数时,退出循环,模型训练结束。
进一步地,所述匹配规则具体为:
将诊断信息与诊断库中的诊断名称进行首字段匹配,得到匹配集合s1
将诊断信息与诊断库中的诊断名称进行非首字段匹配,得到匹配集合s2
将匹配集合s1和s2分别进行概率分析,得到对应的排序列表l1和l2
将所述排序列表l1和l2中的诊断名称在各自列表中按照概率值大小依次排序,且两序列表的诊断名称不交叉排序,基于预设的辅助诊断名称的数量从排序中依次取值。
进一步地,所述概率分析具体为:
获取患者所在科室,基于诊断库中所述科室对应的概率值,将匹配集合中的所有诊断名称基于所述概率值大小进行排序,得到排序列表。
本发明第二方面提供了基于深度神经网络的辅助诊断***,所述辅助诊断***包括:
信息采集单元,用于获取患者信息,将所述患者信息向量化;
第一辅助诊断单元,当所述患者信息中不包括诊断信息时,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;
第二辅助诊断单元,当所述患者信息中包括诊断信息时,按照预设的匹配规则,将所述诊断信息与预设的诊断名称库内的诊断名称进行匹配,得到若干个辅助诊断名称。
本发明第三方面提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,所述计算机指令在所述辅助诊断***上运行时,使所述辅助诊断***执行所述辅助诊断方法的步骤。
本发明第二方面的所述辅助诊断***能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明基于患者信息中是否有诊断信息的情况,分别进行算法分析,得到若干个辅助诊断名称,利用深度学习算法,根据患者信息进行辅助诊断,避免了诊断推荐依赖医生输入字符和输入字符后匹配到的诊断名称排序不合理的情况,为医生下诊断和采取进一步的治疗方案提供准确参考,提高医生的工作效率和患者的就医体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述方法实施例的流程示意图;
图2是本发明所述方法实施例中神经网络模型的结构示意图;
图3是本发明所述***实施例的结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明实施例提供的一种基于深度神经网络的辅助诊断方法,包括以下步骤:
S1,获取患者信息,将所述患者信息向量化,判断所述患者信息中是否含有诊断信息;
S2,若所述患者信息中不包括诊断信息,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;
S3,若所述患者信息中包括诊断信息,按照预设的匹配规则,将所述诊断信息与预设的诊断库内的诊断名称进行匹配,得到若干个辅助诊断名称。
本实施例的其一实现方式中,在上述步骤S1之前还包括构建患者信息库D和诊断库D’。
所述患者信息库中包括患者ID、年龄、性别、主诉和诊断名称;所述诊断库中包括诊断名称,以及当前诊断名称在每个科室下的概率值。
患者信息库D的构建过程为:从数据库中抽取诊断对应的病例,选取诊断对应的病例数量在100到500份之间的诊断,使得D中的诊断对应的病历分布均匀,将筛选出的这些病历中的信息构建为患者信息库D,其中每条数据成如下表1的格式:
Figure BDA0003412319550000061
表1
诊断库D’的构建过程为:提取患者信息库D中的所有诊断集合{d},计算{d}在每个医院科室下对应的概率(如某个科室下诊断d1概率
Figure BDA0003412319550000062
其中n1为d1在该科室下出现次数,s为该科室下诊断的总数量),得到诊断库D',如下表2所示:
诊断名称 骨一科 妇产科 心内科 儿科
高血压 0.0015 0.0012 0.4 0.00001
皮疹 0.0001 0.0011 0.0002 0.0019
股骨头坏死 0.014 0.000001 0.000001 0.000011
表2
另外,还构建了症状体征库Dsymp,包括症状体征及其对应的别名,如下表3所示:
症状名称 对应别名
腹痛 腹疼、肚子痛、肚子疼
表3
步骤S1中,所述患者信息包括年龄、性别、主诉和诊断信息,并分别用向量表示。
将年龄分为婴幼儿(0-5岁)、少年(6-14岁)、青年(15-39岁)、中年(40-59岁)和老年(>=60岁),每个年龄段进行onehot编码,例如婴幼儿编为[1,0,0,0,0],青年编为[0,0,1,0,0],记为Ap
对性别进行onehot编码,男、女的onehot编码分别为[1,0]、[0,1],记为Sp
对于主诉,首先将医学中常见的4750个字符(包括汉字、标点符号和特殊符号)进行编码,将这些字符用一个80维的向量来表达,第i个字符记为
Figure BDA0003412319550000063
则主诉可表示为矩阵
Figure BDA0003412319550000071
r表示矩阵的行。
对于诊断信息,神经网络模型M推荐200种常见诊断(假设患者信息库D中的诊断有200个),对这200种常见诊断名称进行编码,编码规则为将病人p包含的全部诊断进行onehot编码之后相加,得到诊断的向量,记为Yp
步骤S2中,深度神经网络模型M的构建包括:
(i)划分训练集、验证集和测试集:
在患者信息库D中对要预测的每种诊断对应的数量按65%,15%,20%的比例划分为训练集,验证集和测试集。将每种诊断名称对应的训练集合并作为神经网络模型M的训练集,验证集和测试集同理。
(ii)如图2所示,构建深度神经网络模型的结构:
将年龄向量Ap通过一个三层的全连接网络mlp1转化为
Figure BDA0003412319550000072
层与层之间的激活函数均是tanh;将性别向量Sp通过另一个三层的全连接网络mlp2转化为
Figure BDA0003412319550000073
层与层之间的激活函数均是tanh。
将主诉对应的矩阵
Figure BDA0003412319550000074
经双向LSTM模型后输出
Figure BDA0003412319550000075
与诊断名称向量Yp形成注意力矩阵Att,
Figure BDA0003412319550000076
d为诊断名称向量的维度。LSTM模型主要由遗忘门、输入门和输出门组成,具体来说:t时刻遗忘门的输出ft=σ(Wf·[ht-1,xt]+bf),其中xt为第t个字符的字向量,ht-1为第t-1时刻隐藏状态的输出,Wf和bf分别为线性变换的矩阵参数和偏置参数;输入门主要由两个矩阵决定it=σ(Wi·[ht-1,xt]+bi)和
Figure BDA0003412319550000077
其中it是决定哪些信息需要更新,Wi和bi是对应的线性变换权重矩阵和偏置参数,而
Figure BDA0003412319550000078
是备选的用来更新的内容。在t时刻的长期记忆为
Figure BDA0003412319550000079
最后输出门t时刻输出的短期记忆为ht=ot·tanh(Ct),其中ot=σ(WO·[ht-1,xt]+bO)而WO和bO是对应的权重和偏置。由于t时刻的输出与上下文有关系,所以采用双向LSTM,第t个字符的语义输出为
Figure BDA00034123195500000710
其中[ht,ht′]为两个向量最后一个维度结合的新向量。最终主诉矩阵
Figure BDA0003412319550000081
经双向LSTM后输出为
Figure BDA0003412319550000082
将年龄的输出
Figure BDA0003412319550000083
性别的输出
Figure BDA0003412319550000084
和主诉的注意力矩阵Att结合,得到
Figure BDA0003412319550000085
Figure BDA0003412319550000086
通过最后的两层全连接网络,得到预测的诊断向量
Figure BDA0003412319550000087
其中WY和bY分别为权重和偏置;
将YP
Figure BDA0003412319550000088
的focal Loss交叉熵作为深度神经网络模型的损失函数,即
Figure BDA0003412319550000089
(iii)训练获得神经网络模型的参数:
将训练集分成若干个batch(批),每个batch的大小设置为20,所有batch都通过一遍模型M称为一个epoch,采用随机梯度下降的方式对网络进行训练,将batch中每个患者经所述深度神经网络模型的结构,得到每个batch的平均损失
Figure BDA00034123195500000810
以最小化所述平均损失Lbatch作为训练目标;
在训练过程中,采用自动保存模型的方式,即设置记录验证集准确度的参数acc(初始值设置为0),当一个batch的数据经过神经网络模型后得到损失Lbatch,利用反向传播算法最小化损失Lbatch从而实现模型M参数的更新,每训练完一个epoch后,利用当前参数的模型计算验证集中所有数据的准确度(计算方式为
Figure BDA00034123195500000811
n1为验证集预测正确的诊断名称总数量,n2为验证集上样例诊断名称的总数量),比较α与acc的值,当α大于当前acc值时,保存模型,并更新acc值(即令α=acc)。
基于循环约束机制训练完后,保存准确度参数acc。
循环约束机制具体为:当训练完若干个epoch之后,会出现过拟合的现象,即每次得到的α会不再增加或者持续振荡,针对这种情况为了得到最优模型减少没必要的循环,我们设置了三个参数:更新停滞步数update_wait_step(初始值为0),最大停滞步数max_wait_step(初始值假设为10)和退出循环标志break_flag(初始值为False)。具体运行方式为当模型的参数更新时(即α大于当前acc时),更新停滞步数update_wait_step重新被赋值0,当模型的参数不再更新时(即α小于当前acc),更新停滞步数update_wait_step值增加1,判断更新停滞步数update_wait_step是否大于最大停滞步数max_wait_step,若否退出循环标志break_flag仍为False,若是退出循环标志break_flag变为True,每进行完一个epoch之后,判断break_flag,若break_flag为True跳出循环训练完成,若为False继续下一次循环。
循环完成或跳出循环之后,程序保存的参数即作为最终模型M的参数。
步骤S2中,所述将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称的具体过程为:
S21,对于病人p,将其病情信息转化为向量
Figure BDA0003412319550000091
再输入模型M,模型输出值
Figure BDA0003412319550000092
为一个200维的向量(我们假设有200种疾病),将
Figure BDA0003412319550000093
中前n个最大的分量记录下来,获取n个最大分量的位置数字,并将这些数字按分量值的大小从大到小排列,然后根据位置数字和诊断名称的编号获取诊断名称,最后将诊断的名称按排列顺序进行展示,即为模型M对病人p推荐的诊断。
S22,若医生已填过诊断名称在这200个诊断中(由于一个病人可能有多个诊断),则从200个诊断中选择除填过的诊断外最大的n个分量按照步骤S21的方式推荐n个诊断。
步骤S21和步骤S22中推荐的诊断即作为医生的辅助诊断结果。
步骤S3中,所述匹配规则具体为:将诊断信息与诊断库中的诊断名称进行首字段匹配,得到匹配集合s1;将诊断信息与诊断库中的诊断名称进行非首字段匹配,得到匹配集合s2;将匹配集合s1和s2分别进行概率分析,得到对应的排序列表l1和l2
将所述排序列表l1和l2中的诊断名称在各自列表中按照概率值大小依次排序,且两序列表的诊断名称不交叉排序,基于预设的辅助诊断名称的数量从排序中依次取值。具体为:若诊断名称的总数量|l1|+|l2|小于要求推荐的诊断名称数量n,则将l1和l2中所有诊断全部展示,顺序为l1在前l2在后,l1中所有诊断名称按l1中的顺序依次展示,l2中所有诊断名称按l2中的顺序依次展示。若诊断名称的总数量|l1|+|l2|大于要求推荐的诊断名称数量n,我们将其分为两种情况,(1)|l1|大于等于n,将l1中前n个诊断名称进行展示;(2)|l1|小于n,将l1中诊断名称全部依次展示,将l2中前n-|l1|个排在l1后按l2中的顺序展示出来。
所述概率分析具体为:
获取患者所在科室,基于诊断库中所述科室对应的概率值,将匹配集合中的所有诊断名称基于所述概率值大小进行排序,得到排序列表。具体为:将匹配到的诊断名称合集s1根据患者所在的科室找到s1中所有诊断名称在该科室下的概率值,根据各诊断名称的概率值由大到小将s1中所有诊断名称进行排序得到列表l1,从l1中剔除概率为0的诊断,若l1中含有医生已填过的诊断,也从l1中剔除。同理步骤(301)得到的集合s2按照s1方式得到概率列表l2
如图3所示,本发明还提供了一种基于深度神经网络的辅助诊断***,所述辅助诊断***包括信息采集单元、第一辅助诊断单元和第二辅助诊断单元。
信息采集单元用于获取患者信息,将所述患者信息向量化;第一辅助诊断单元当所述患者信息中不包括诊断信息时,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;第二辅助诊断单元当所述患者信息中包括诊断信息时,按照预设的匹配规则,将所述诊断信息与预设的诊断名称库内的诊断名称进行匹配,得到若干个辅助诊断名称。
本发明还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,所述计算机指令在所述辅助诊断***上运行时,使所述辅助诊断***执行所述辅助诊断方法的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于深度神经网络的辅助诊断方法,其特征是,所述辅助诊断方法包括以下步骤:
获取患者信息,将所述患者信息向量化;
若所述患者信息中不包括诊断信息,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;
若所述患者信息中包括诊断信息,按照预设的匹配规则,将所述诊断信息与预设的诊断库内的诊断名称进行匹配,得到若干个辅助诊断名称。
2.根据权利要求1所述基于深度神经网络的辅助诊断方法,其特征是,所述辅助诊断方法在所述步骤之前还包括构建患者信息库D和诊断库D’;
所述患者信息库中包括患者ID、年龄、性别、主诉和诊断名称;所述诊断库中包括诊断名称,以及当前诊断名称在每个科室下的概率值。
3.根据权利要求2所述基于深度神经网络的辅助诊断方法,其特征是,所述患者信息包括年龄、性别和主诉。
4.根据权利要求3所述基于深度神经网络的辅助诊断方法,其特征是,所述深度神经网络模型的结构具体为:
将年龄向量Ap通过一个全连接网络mlp1转化为
Figure FDA0003412319540000011
将性别向量Sp通过另一个全连接网络mlp2转化为
Figure FDA0003412319540000012
将主诉对应的矩阵
Figure FDA0003412319540000013
经双向LSTM模型后输出
Figure FDA0003412319540000014
与诊断名称向量Yp形成注意力矩阵Att,
Figure FDA0003412319540000015
d为诊断名称向量的维度;
Figure FDA0003412319540000016
和Att结合,得到
Figure FDA0003412319540000017
Figure FDA0003412319540000018
通过两层全连接网络得到预测的诊断向量
Figure FDA0003412319540000021
其中WY和bY分别为权重和偏置;
将YP
Figure FDA0003412319540000022
的focal Loss交叉熵作为深度神经网络模型的损失函数。
5.根据权利要求2所述基于深度神经网络的辅助诊断方法,其特征是,所述深度神经网络模型的训练具体为:
将训练集分成若干个batch,将batch中每个患者经所述深度神经网络模型的结构,得到每个batch的平均损失
Figure FDA0003412319540000023
以最小化所述平均损失作为训练目标;
在训练过程中,设置记录验证集准确度的参数acc,在训练完一个batch后,计算当前验证集准确度α,当α大于acc时,保存模型并更新acc为α;
基于循环约束机制训练完后,保存准确度参数acc。
6.根据权利要求5所述基于深度神经网络的辅助诊断方法,其特征是,所述循环约束机制具体为:
设置更新循环步数和最大停滞步数;
当所述准确度参数更新时,所述更新循环步数赋值为0,当所述准确度参数未更新时,所述更新循环步数的值加1;
在所述更新循环步数的值超过所述最大停滞步数时,退出循环,模型训练结束。
7.根据权利要求2所述基于深度神经网络的辅助诊断方法,其特征是,所述匹配规则具体为:
将诊断信息与诊断库中的诊断名称进行首字段匹配,得到匹配集合s1
将诊断信息与诊断库中的诊断名称进行非首字段匹配,得到匹配集合s2
将匹配集合s1和s2分别进行概率分析,得到对应的排序列表l1和l2
将所述排序列表l1和l2中的诊断名称在各自列表中按照概率值大小依次排序,且两序列表的诊断名称不交叉排序,基于预设的辅助诊断名称的数量从排序中依次取值。
8.根据权利要求7所述基于深度神经网络的辅助诊断方法,其特征是,所述概率分析具体为:
获取患者所在科室,基于诊断库中所述科室对应的概率值,将匹配集合中的所有诊断名称基于所述概率值大小进行排序,得到排序列表。
9.基于深度神经网络的辅助诊断***,其特征是,所述辅助诊断***包括:
信息采集单元,用于获取患者信息,将所述患者信息向量化;
第一辅助诊断单元,当所述患者信息中不包括诊断信息时,将所述向量化的患者信息输入训练好的深度神经网络模型,基于所述深度神经网络模型的输出,得到若干个辅助诊断名称;
第二辅助诊断单元,当所述患者信息中包括诊断信息时,按照预设的匹配规则,将所述诊断信息与预设的诊断名称库内的诊断名称进行匹配,得到若干个辅助诊断名称。
10.一种计算机存储介质,所述计算机存储介质中存储有计算机指令,其特征是,所述计算机指令在权利要求9所述辅助诊断***上运行时,使所述辅助诊断***执行如权利要求1-8任一项所述辅助诊断方法的步骤。
CN202111536753.0A 2021-12-15 2021-12-15 基于深度神经网络的辅助诊断方法及*** Pending CN114203298A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111536753.0A CN114203298A (zh) 2021-12-15 2021-12-15 基于深度神经网络的辅助诊断方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111536753.0A CN114203298A (zh) 2021-12-15 2021-12-15 基于深度神经网络的辅助诊断方法及***

Publications (1)

Publication Number Publication Date
CN114203298A true CN114203298A (zh) 2022-03-18

Family

ID=80654237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111536753.0A Pending CN114203298A (zh) 2021-12-15 2021-12-15 基于深度神经网络的辅助诊断方法及***

Country Status (1)

Country Link
CN (1) CN114203298A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107863147A (zh) * 2017-10-24 2018-03-30 清华大学 基于深度卷积神经网络的医疗诊断的方法
CN108197648A (zh) * 2017-12-28 2018-06-22 华中科技大学 一种基于lstm深度学习模型的水电机组故障诊断方法与***
CN109949929A (zh) * 2019-03-19 2019-06-28 挂号网(杭州)科技有限公司 一种基于深度学习大规模病历的辅助诊断***
CN110322962A (zh) * 2019-07-03 2019-10-11 重庆邮电大学 一种自动生成诊断结果的方法、***及计算机设备
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、***、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107863147A (zh) * 2017-10-24 2018-03-30 清华大学 基于深度卷积神经网络的医疗诊断的方法
CN108197648A (zh) * 2017-12-28 2018-06-22 华中科技大学 一种基于lstm深度学习模型的水电机组故障诊断方法与***
CN109949929A (zh) * 2019-03-19 2019-06-28 挂号网(杭州)科技有限公司 一种基于深度学习大规模病历的辅助诊断***
CN110322962A (zh) * 2019-07-03 2019-10-11 重庆邮电大学 一种自动生成诊断结果的方法、***及计算机设备
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、***、设备及介质

Similar Documents

Publication Publication Date Title
CN109670179B (zh) 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法
CN109920501B (zh) 基于卷积神经网络和主动学习的电子病历分类方法及***
US11488718B2 (en) Computer aided medical method and medical system for medical prediction
WO2023202508A1 (zh) 一种基于认知图谱的全科患者个性化诊疗方案推荐***
US20200185102A1 (en) System and method for providing health information
US11670420B2 (en) Drawing conclusions from free form texts with deep reinforcement learning
CN109637669B (zh) 基于深度学习的治疗方案的生成方法、装置及存储介质
CN111048167B (zh) 一种层级式病例结构化方法及***
CN116682553B (zh) 一种融合知识与患者表示的诊断推荐***
CN113688248B (zh) 一种小样本弱标注条件下的医疗事件识别方法及***
US20220044809A1 (en) Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients
CN111785387B (zh) 一种使用Bert做疾病标准化映射分类的方法及***
CN112420191A (zh) 一种中医辅助决策***及方法
CN110444261B (zh) 序列标注网络训练方法、电子病历处理方法及相关装置
US11170898B2 (en) Methods and systems for prioritizing user symptom complaint inputs
CN110767279A (zh) 基于lstm的电子健康记录缺失数据补全方法及***
CN112182168B (zh) 病历文本分析方法、装置、电子设备及存储介质
CN112541066A (zh) 基于文本结构化的医技报告检测方法及相关设备
CN117034142B (zh) 一种不平衡医疗数据缺失值填充方法及***
CN116910172A (zh) 基于人工智能的随访量表生成方法及***
CN116682541A (zh) 医疗就诊的推荐***及其方法
CN115713078A (zh) 知识图谱构建方法、装置、存储介质及电子设备
CN114203298A (zh) 基于深度神经网络的辅助诊断方法及***
CN116469534A (zh) 医院叫号管理***及其方法
Dong et al. A hybrid approach to identifying key factors in environmental health studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination