CN114188022A - 一种基于TextCNN模型的临床儿童咳嗽智能预诊断*** - Google Patents

一种基于TextCNN模型的临床儿童咳嗽智能预诊断*** Download PDF

Info

Publication number
CN114188022A
CN114188022A CN202111521359.XA CN202111521359A CN114188022A CN 114188022 A CN114188022 A CN 114188022A CN 202111521359 A CN202111521359 A CN 202111521359A CN 114188022 A CN114188022 A CN 114188022A
Authority
CN
China
Prior art keywords
model
diagnosis
word
disease
textcnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111521359.XA
Other languages
English (en)
Inventor
俞刚
朱珠
李竞
张洪健
陈思宇
钟千惠
王颖硕
王玉琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111521359.XA priority Critical patent/CN114188022A/zh
Publication of CN114188022A publication Critical patent/CN114188022A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于TextCNN模型的临床儿童咳嗽智能预诊断***,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在所述计算机处理器上执行的计算机程序,计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;所述计算机处理器执行所述计算机程序时实现以下步骤:将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。利用本发明,可以对咳嗽的儿童提供疾病预诊断和检查检验推荐,提高诊断精确度。

Description

一种基于TextCNN模型的临床儿童咳嗽智能预诊断***
技术领域
本发明属于医学人工智能领域,尤其是涉及一种基于TextCNN模型的临床儿童咳嗽智能预诊断***。
背景技术
咳嗽是导致儿童就诊最常见的症状,长期咳嗽可引起诸多并发症。引起咳嗽的病因众多,受限于医生经验水平的差异,临床咳嗽诊断存在误诊、不充分或多余的检查等问题。
公开机号为CN105339486A的中国专利文献公开了一种用于从患者收集样本以便诊断的***和方法。样本收集和分析***集中样本中源自患者咳嗽、喷嚏或者呼吸的颗粒,用于诊断患者呼吸道感染或者其它小疾病。样本收集和分析***具有预先收集组件、与样本储器流体连通的收集器,所述预先收集组件和收集器组合执行功能:有效捕获由主体排出的空气体积,将排出的空气朝向样本储器引导,并且从排出的空气将所需粒径分离到样本储器中。
公开号为CN107242857A的中国专利文献公开了一种基于深度学习的智能中医综合诊疗***,包括:望诊采集子***、闻诊采集子***、问诊采集子***、脉诊采集子***,以及综合分析子***。其中,望诊采集子***采集患者的面部、舌体等局部图像信息;闻诊采集子***对患者语音、呼吸、咳嗽等声音信息进行采集;问诊采集子***采用交互问答方式获取患者症状信息;脉诊采集子***采集患者的脉搏信号;综合分析子***采用深度学习相关理论和技术对以上子***得到的信息数据进行综合分析,得到诊断结果并给出建议处方。该发明实现了中医望、闻、问、切四方面的结合,借助深度学习理论得到全面详实的诊断结果,为患者就诊提供了便利。
然而现有的技术中,只聚焦于诊断阶段,且依赖密集的特征工程,而对尚未展开检验检查的预诊阶段,并没有针对性的方法辅助基层医生通过问诊信息进行疾病预判和检查检验推荐。在实际诊疗中,收集患者的咳嗽、喷嚏或者呼吸的颗粒并进行辅助诊断需要依赖一定的设备,在临床操作中并不十分方便,大多数的咳嗽患儿也并不一定通过中医进行问诊,因此现有的技术在推广层面缺乏普适性。然而,对绝大多数患者来说,问诊是就诊过程必经也是首要的一步,直接影响到医生的后续判断及决策。基于病患问诊信息和优秀医生的诊疗经验进行智能预诊断辅助可以在就诊初始阶段即对基层医生的工作产生正向帮助。因此,亟需设计一种的儿童咳嗽预诊断技术解决方案。
发明内容
本发明提供了一种基于TextCNN模型的临床儿童咳嗽智能预诊断***,可以对咳嗽的儿童提供疾病预诊断和检查检验推荐,提高诊断精确度。
一种基于TextCNN模型的临床儿童咳嗽智能预诊断***,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;
所述计算机处理器执行所述计算机程序时实现以下步骤:
将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;
将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;
将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。
进一步地,所述的语言表示模型基于采用Word2vec中的Skip-Gram模型。
进一步地,采用大量医疗文献数据对语言表示模型进行训练,获取医学词汇在特征空间的语义表示向量;Skip-gram模型的训练目标是:最大化训练集中文本序列[w1,w2,w3,...,wT]的给定单词wt作为中心词时,固定大小窗口内的上下文单词wt+j的概率P(wt+j|wt),Skip-gram模型的目标函数表示为:
Figure BDA0003407781020000031
式中,c为上下文窗口大小。
进一步地,采用负采样算法选择性地更新训练样本的小部分权重,加速梯度下降过程;
在负采样中,对于给定的词w,假设c表示它的上下文,那么词w是正例,其他词是负例,基于负采样的Skip-gram算法使用一元模型分布来选择负采样词,达到减少计算开销的目的;一个单词被选作负样本的概率跟它出现的频次有关,出现频次越高的单词越容易被选作负样本词;每个上下文词的概率计算公式如下:
Figure BDA0003407781020000032
其中,f(wi)表示单词w出现的词频,分母代表所有单词的权重和;
基于负采样的Skip-gram模型的另一目标函数为找到使所有观测值来自数据的概率最大化的参数:
Figure BDA0003407781020000033
Ppos=p(D=1|c,w;θ)
Pneg=p(D=0|c,w;θ)
式中,D表示上下文词集合,D‘表示非上下文词的集合,w和c表示D中的单词,Ppos表示w和c作为上下文词出现的概率,Pneg表示w和c不作为非上下文词出现的概率。目标函数的意义为最大化窗口中上下文词的概率。
进一步地,所述疾病预诊断模型采用textCNN模型,将病例记录的文本进行OneHot编码后输入到训练好的语言表示模型中,经过word2vec词嵌入得到句子的语言特征表示向量,该向量将作为textCNN模型卷积层的输入。textCNN模型的网络结构如下:
卷积层中将kernel_size设置为(3,4,5),为了避免词向量信息丢失,卷积核宽度设置与词向量维度相同,每个kernel_size有128个输出channel;网络初始化阶段采用Glorot_normal正态分布初始化方法,并在TextCNN网络中加入Batch Normalization网络重新调整数据分布后再进行池化的方法提高模型训练时的稳定性,生成3个长度为128的特征向量,再将其合并变为384维的向量后进行dropout。
疾病预诊断模型中,Softmax函数的计算公式如下:
Figure BDA0003407781020000041
损失函数采用交叉熵,计算公式如下:
Figure BDA0003407781020000042
其中,tki是样本k属于类别i的概率,yki是模型对样本k预测属于类别i的概率。
在训练疾病预诊断模型时,提取病人的病历记录,包括年龄、主诉症状、现病史、既往史、家族史、过敏史、用药情况7种属性;
对不同属性的文本去除停用词与特殊符号后进行自然语言式的拼接:对每条病例记录,将属性名与属性值拼接,并将不同属性拼接成一个短文本,作为病人信息的综合文本描述,将这个综合文本输入语言表示模型,得到语言特征表示向量,再对疾病预诊断模型进行训练。
进一步地,所述的检查推荐模型也采用textCNN模型,损失函数采用二元交叉熵损失,将预测出的每个检验检查推荐类别平均概率误差作为模型整体的误差,通过BP算法对参数进行更新。
与现有技术相比,本发明具有以下有益效果:
1、将辅助诊断服务前置,从源头上提高诊断准确率、降低医疗成本,基于问诊信息和临床电子病历数据提供儿童咳嗽疾病预诊断和检查检验推荐服务。
2、通过建立预训练语言表示模型强化对医疗文本数据的语义理解,该预训练语言模型可通过迁移学习被快速应用于下游的AI任务中。3、应用方便、普适性及可操作性强,无需借助任何设备,可快速推广应用于基层医院,对基层医生的辅助诊疗具有显著意义。
附图说明
图1为本发明临床儿童咳嗽智能预诊断***的框架图;
图2为本发明实施例中Skip-gram模型的结构图;
图3为本发明实施例中TextCNN模型的结构图;
图4为本发明方法与现有算法进行疾病预诊断Top1结果Precision对比图;
图5为本发明方法与现有算法进行疾病预诊断Top1结果Recall对比图;
图6为本发明方法与现有算法进行疾病预诊断Top1结果F1-Score对比图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
一种基于TextCNN模型的临床儿童咳嗽智能预诊断***,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在计算机处理器上执行的计算机程序,计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型。如图1所示,计算机处理器执行所述计算机程序时实现以下步骤:
将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;
将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;
将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。
本发明中,语言表示模型基于word2vec,目的是为了生成对医学语义理解更精准的语言特征表示向量,从而提高文本预测的准确率。此外,预训练的语言表示模型通过从使用大量语料训练出的模型中提取参数权重的方式,迁移到其他神经网络模型中,实现知识转移的目标,使得下游任务模型可以基于这些参数进行微调,大大加速了下游任务的模型的收敛速度。本发明利用大量医疗文献据进行预训练,生成医用的语言表示模型,该模型会被用于下游任务(疾病预诊断和检查检验推荐)中对文本数据进行词嵌入,生成对医学语言上下文敏感的语言特征表示。
具体的,语言表示模型基于采用Word2vec中的Skip-Gram模型,通过中心词预测上下文词的方式,更有效的从上下文中学习信息。
如图2所示,Skip-gram模型的训练目标是:最大化训练集中文本序列[w1,w2,w3,...,wT]的给定单词wt作为中心词时,固定大小窗口内的上下文单词wt+j的概率P(wt+j|wt),因此,Skip-gram模型的目标函数表示为:
Figure BDA0003407781020000061
式中,c为上下文窗口大小。
本发明采用负采样算法选择性地更新训练样本的小部分权重,加速梯度下降过程。在负采样中,对于给定的词w,假设c表示它的上下文,那么词w是正例,其他词是负例,基于负采样的Skip-gram算法使用一元模型分布来选择负采样词,达到减少计算开销的目的;一个单词被选作负样本的概率跟它出现的频次有关,出现频次越高的单词越容易被选作负样本词;每个上下文词的概率计算公式如下:
Figure BDA0003407781020000071
其中,f(wi)表示单词w出现的词频,分母代表所有单词的权重和。
基于负采样的Skip-gram模型的另一目标函数为找到使所有观测值来自数据的概率最大化的参数:
Figure BDA0003407781020000072
Ppos=p(D=1|c,w;θ)
Pneg=p(D=0|c,w;θ)
基于负采样的skip-gram算法通过对(w,c)∈D'负样本集合进行采样达到减少计算开销的目的。
本发明将textCNN模型应用于预问诊疾病类型预测任务,并将该任务训练好的模型迁移至检验检查任务中进行微调。
具体的,疾病预诊断模型采用textCNN模型,如图3所示,其网络结构如下:
卷积层中将kernel_size设置为(3,4,5),为了避免词向量信息丢失,卷积核宽度设置与词向量维度相同,每个kernel_size有128个输出channel;网络初始化阶段采用Glorot_normal正态分布初始化方法,并在TextCNN网络中加入Batch Normalization网络重新调整数据分布后再进行池化的方法提高模型训练时的稳定性,生成3个长度为128的特征向量,再将其合并变为384维的向量后进行dropout。
网络采用了1-Max池化,即为从每个滑动窗口产生的特征向量中筛选出一个最大的特征,然后将这些特征拼接起来构成向量表示。对于输出层,我们采用全连接结构和Softmax,Softmax函数的计算公式如下:
Figure BDA0003407781020000081
损失函数采用交叉熵,计算公式如下:
Figure BDA0003407781020000082
其中,tki是样本k属于类别i的概率,yki是模型对样本k预测属于类别i的概率。
检查检验推荐和疾病预诊断类似,本质上是一个分类问题,但不同的是,检查检验推荐是一个多标签分类任务,预测生成一个向量,向量的每个维度对应各项检查的结果。该数值是二元的(0表示不推荐,1表示推荐),而疾病预诊断需要生成的是模型预测为各疾病的概率分布。
在样本训练阶段,根据病人的主诉、现病史、既往史、过敏史等基本信息和医生诊断的疾病类型来推荐相应的检查检验项目。对测试数据来说,由于预诊断阶段还没有产生确切的疾病诊断,因此我们采用疾病预诊断模型预测出的概率最大的疾病作为疾病类型,结合病人的问诊信息进行检查检验推荐。
为了让模型更准确学习到疾病特征,本发明在EHR数据提取的特征基础上加入了疾病预测结果描述文本,从而使模型学习到疾病与检验检查类别对应关系的特征。
模型训练时,仍然采用textCNN模型,但不同的是,损失函数采用Binary CrossEntropy loss,将预测出的每个检验检查推荐类别平均概率误差作为模型整体的误差,通过BP算法对参数进行更新。
为了验证本发明的效果,对临床儿童咳嗽智能预诊断***进行测试。
抽取了浙江大学医学院附属儿童医院的呼吸科门诊EHR真实数据。按ICD-10疾病诊断码进行过滤,在2019年08月到2020年11月之间,浙江大学医学院附属儿童医院共有107840名患者被诊断为咳嗽类疾病,总就诊记录数181229条。2936例因为信息缺失无法满足我们的训练任务而被排除,剩余的178293条记录,我们按7:3的比例进行划分,133719条用于疾病预诊断的样本训练,44574条用于测试集。
统计了儿童咳嗽的常见疾病,咨询院内呼吸内科专家后按症状的相似性重新进行了划分,合并了一些细分类,最终形成12种疾病类型作为预测目标,经过自然数字编码,编码后的类别记为0-11。
为了更好地进行疾病类型预测,提取了病人的病历文书记录,包括年龄、主诉症状、病史、过敏史等7种属性。对不同的属性的文本去除停用词与特殊符号后进行自然语言式的拼接:对每条病例记录,我们将属性名与属性值(文本)拼接,并将不同属性拼接成一个短文本,作为病人信息的综合文本描述,基于这个综合文本进行学习。
疾病预诊断任务与检验检查推荐任务的评价指标均基于混淆矩阵,由于疾病的预诊断是一个多分类任务,计算评价指标时对每个类别单独计算。用a表示本身属于某类别且被正确分到该类别的实例数目,b表示本身不属于某类别但被误分到该类别的实例数目,c表示本身属于某类别但被误分到其他类别的实例数目,d表示本身不属于某类别的实例数目,具体如下表1所示。
表1
Figure BDA0003407781020000091
Figure BDA0003407781020000101
准确率、精确率、召回率、F1值计算公式如下所示:
精确率:
Figure BDA0003407781020000102
召回率:
Figure BDA0003407781020000103
F1值:
Figure BDA0003407781020000104
对每类疾病,分别统计每个类别在逻辑回归(LR)、梯度下降算法(GDBT)、HAN模型和TextCNN模型下的Precision、Recall和F1-Score值。然后使用准确率、宏平均、和加权平均来评估算法对测试数据集的整体效果。准确率、宏平均和加权平均的计算公式如下:
准确率(Accuracy):
Figure BDA0003407781020000105
宏平均(Macro Average):
Figure BDA0003407781020000106
加权平均(Weighted Average):
Figure BDA0003407781020000107
wi=Csupport/CTotal
其中,CTP表示真值为某类疾病且预诊断也判定为该类疾病的实例数目,CTN表示真值不属于12类疾病中的任何一类且预诊断也判定为其他疾病的实例数目。CTotal表示测试集中的实例总数。n表示级别类别总数,FSi表示每个类别的F1-Score值。wi表示每个类别的权重,由每个类别的实例数量Csupport除以测试集总数CTotal得到。
LR和GBDT属于机器学习方法,HAN和TextCNN属于深度学习算法。利用儿童电子病历数据训练模型,根据患者主诉信息预测患者在12类呼吸科疾病下的可能性。把数据分成10折进行交叉验证,测得的关于12个疾病类的预测数据如图4~图6所示。图中,横坐标对应的疾病类型分别为AURI(急性上呼吸道感染),Bronchitis(支气管炎),Asthma(哮喘),Pharyngitis(咽炎),Pneumonia(肺炎),Rhinitis(鼻炎),Tonsillitis(扁桃体炎),Laryngitis(喉炎),Nasosinusitis(鼻窦炎),FLU(流行性感冒),FBAO(气道异物阻塞),Others(其他疾病)。由于疾病预诊断输出的是一个12维的疾病概率向量,向量的每个维度表示根据病人主诉信息预诊断为某疾病的概率,概率最大的分量即为Top1结果。图4-图6展示的就是四种算法在12个疾病类上预测的Top 1返回结果的准确率、召回率和F1值统计情况。由上图可知,通过四种算法训练出的模型表现与模型特征提取能力基本成正比,逻辑回归、GBDT这两种机器学习模型预测能力较弱,在一些疾病类别上,如咽炎(Pharyngitis)、扁桃体炎(Tonsillitis)和流行性感冒(FLU)甚至低于0.1。相比之下,深度学习方法的预测效果明显更优,本发明的模型(TextCNN)比HAN的预测能力更强。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于TextCNN模型的临床儿童咳嗽智能预诊断***,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于:
所述计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;
所述计算机处理器执行所述计算机程序时实现以下步骤:
将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;
将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;
将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。
2.根据权利要求1所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,所述的语言表示模型基于采用Word2vec中的Skip-Gram模型。
3.根据权利要求2所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,采用大量医疗文献数据对语言表示模型进行训练,获取医学词汇在特征空间的语义表示向量;Skip-gram模型的训练目标是:最大化训练集中文本序列[w1,w2,w3,...,wT]的给定单词wt作为中心词时,固定大小窗口内的上下文单词wt+j的概率P(wt+j|wt),Skip-gram模型的目标函数表示为:
Figure FDA0003407781010000011
式中,c为上下文窗口大小。
4.根据权利要求3所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,采用负采样算法选择性地更新训练样本的小部分权重,加速梯度下降过程;
在负采样中,对于给定的词w,假设c表示它的上下文,那么词w是正例,其他词是负例,基于负采样的Skip-gram算法使用一元模型分布来选择负采样词,达到减少计算开销的目的;一个单词被选作负样本的概率跟它出现的频次有关,出现频次越高的单词越容易被选作负样本词;每个上下文词的概率计算公式如下:
Figure FDA0003407781010000021
其中,f(wi)表示单词w出现的词频,分母代表所有单词的权重和;
基于负采样的Skip-gram模型的另一目标函数为找到使所有观测值来自数据的概率最大化的参数:
Figure FDA0003407781010000022
Ppos=p(D=1|c,w;θ)
Pneg=p(D=0|c,w;θ)
式中,D表示上下文词集合,D‘表示非上下文词的集合,w和c表示D中的单词,Ppos表示w和c作为上下文词出现的概率,Pneg表示w和c不作为非上下文词出现的概率。目标函数的意义为最大化窗口中上下文词的概率。
5.根据权利要求1所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,所述疾病预诊断模型采用textCNN模型,其网络结构如下:
卷积层中将kernel_size设置为(3,4,5),为了避免词向量信息丢失,卷积核宽度设置与词向量维度相同,每个kernel_size有128个输出channel;网络初始化阶段采用Glorot_normal正态分布初始化方法,并在TextCNN网络中加入Batch Normalization网络重新调整数据分布后再进行池化的方法提高模型训练时的稳定性,生成3个长度为128的特征向量,再将其合并变为384维的向量后进行dropout。
6.根据权利要求5所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,疾病预诊断模型中,Softmax函数的计算公式如下:
Figure FDA0003407781010000031
损失函数采用交叉熵,计算公式如下:
Figure FDA0003407781010000032
其中,tki是样本k属于类别i的概率,yki是模型对样本k预测属于类别i的概率。
7.根据权利要求1所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,在训练疾病预诊断模型时,提取病人的病历记录,包括年龄、主诉症状、现病史、既往史、家族史、过敏史、用药情况7种属性;
对不同属性的文本去除停用词与特殊符号后进行自然语言式的拼接:对每条病例记录,将属性名与属性值拼接,并将不同属性拼接成一个短文本,作为病人信息的综合文本描述,将这个综合文本输入语言表示模型,得到语言特征表示向量,再对疾病预诊断模型进行训练。
8.根据权利要求1所述的基于TextCNN模型的临床儿童咳嗽智能预诊断***,其特征在于,所述的检查推荐模型采用textCNN模型,损失函数采用二元交叉熵损失,将预测出的每个检验检查推荐类别平均概率误差作为模型整体的误差,通过BP算法对参数进行更新。
CN202111521359.XA 2021-12-13 2021-12-13 一种基于TextCNN模型的临床儿童咳嗽智能预诊断*** Pending CN114188022A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111521359.XA CN114188022A (zh) 2021-12-13 2021-12-13 一种基于TextCNN模型的临床儿童咳嗽智能预诊断***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111521359.XA CN114188022A (zh) 2021-12-13 2021-12-13 一种基于TextCNN模型的临床儿童咳嗽智能预诊断***

Publications (1)

Publication Number Publication Date
CN114188022A true CN114188022A (zh) 2022-03-15

Family

ID=80604777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111521359.XA Pending CN114188022A (zh) 2021-12-13 2021-12-13 一种基于TextCNN模型的临床儿童咳嗽智能预诊断***

Country Status (1)

Country Link
CN (1) CN114188022A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115101198A (zh) * 2022-05-05 2022-09-23 东南大学 一种面向临床问诊记录的疾病预测方法与装置
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理***
CN116994698A (zh) * 2023-03-31 2023-11-03 河北医科大学第一医院 基于深度学习的舍曲林剂量个体化推荐方法及装置
CN117370525A (zh) * 2023-10-20 2024-01-09 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109935336A (zh) * 2019-01-15 2019-06-25 北京思普科软件股份有限公司 一种儿童呼吸科疾病的智能辅助诊断方法及诊断***
CN110415818A (zh) * 2019-08-05 2019-11-05 儿康智能科技(苏州)有限公司 一种基于可观察病症的智能儿科疾病问诊***及方法
CN112470171A (zh) * 2018-05-10 2021-03-09 微软技术许可有限责任公司 选择用于有监督机器学习问题的神经网络架构
CN112562809A (zh) * 2020-12-15 2021-03-26 贵州小宝健康科技有限公司 一种基于电子病历文本进行辅助诊断的方法及***
CN113724858A (zh) * 2021-08-31 2021-11-30 平安国际智慧城市科技股份有限公司 基于人工智能的疾病检查项目推荐设备、方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112470171A (zh) * 2018-05-10 2021-03-09 微软技术许可有限责任公司 选择用于有监督机器学习问题的神经网络架构
CN109935336A (zh) * 2019-01-15 2019-06-25 北京思普科软件股份有限公司 一种儿童呼吸科疾病的智能辅助诊断方法及诊断***
CN110415818A (zh) * 2019-08-05 2019-11-05 儿康智能科技(苏州)有限公司 一种基于可观察病症的智能儿科疾病问诊***及方法
CN112562809A (zh) * 2020-12-15 2021-03-26 贵州小宝健康科技有限公司 一种基于电子病历文本进行辅助诊断的方法及***
CN113724858A (zh) * 2021-08-31 2021-11-30 平安国际智慧城市科技股份有限公司 基于人工智能的疾病检查项目推荐设备、方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
汤人杰等: "基于自然语言学习的智能云导诊技术", 《电信科学》 *
罗文馨等: "基于Word2Vec及大众健康信息源的疾病关联探测", 《现代图书情报技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115101198A (zh) * 2022-05-05 2022-09-23 东南大学 一种面向临床问诊记录的疾病预测方法与装置
CN116994698A (zh) * 2023-03-31 2023-11-03 河北医科大学第一医院 基于深度学习的舍曲林剂量个体化推荐方法及装置
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理***
CN117370525A (zh) * 2023-10-20 2024-01-09 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法

Similar Documents

Publication Publication Date Title
CN109460473B (zh) 基于症状提取和特征表示的电子病历多标签分类方法
CN111192680B (zh) 一种基于深度学习和集成分类的智能辅助诊断方法
WO2022227294A1 (zh) 一种基于多模态融合的疾病风险预测方法和***
CN114188022A (zh) 一种基于TextCNN模型的临床儿童咳嗽智能预诊断***
CN112712118A (zh) 一种面向医疗文本数据的过滤方法及***
CN111949759A (zh) 病历文本相似度的检索方法、***及计算机设备
CN110287337A (zh) 基于深度学习和知识图谱获取医学同义词的***及方法
CN108091397A (zh) 一种基于提升-重采样和特征关联分析的缺血性心脏病患者的出血事件预测方法
CN117077786A (zh) 一种基于知识图谱的数据知识双驱动智能医疗对话***和方法
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN111145903A (zh) 获取眩晕症问诊文本的方法、装置、电子设备及问诊***
CN112489740A (zh) 病历检测方法及相关模型的训练方法和相关设备、装置
CN112037909B (zh) 诊断信息复核***
CN112541066A (zh) 基于文本结构化的医技报告检测方法及相关设备
CN111859938B (zh) 基于位置向量降噪和丰富语义的电子病历实体关系抽取方法
CN111477320A (zh) 治疗效果预测模型的构建***、治疗效果预测***及终端
CN111540470B (zh) 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法
CN114492444A (zh) 一种中文电子病例医疗实体词类标注方法
CN112466284B (zh) 一种口罩语音鉴别方法
CN113360643A (zh) 一种基于短文本分类的电子病历数据质量评价方法
CN117877660A (zh) 基于语音识别的医学报告获取方法及***
CN116050419B (zh) 一种面向科学文献知识实体的无监督识别方法及***
CN116313141A (zh) 一种基于知识图谱的不明原因发热智能问诊方法
CN116130091A (zh) 基于知识推理的多模态辅助疾病诊断的***及装置
CN113658688B (zh) 基于无分词深度学习的临床决策支持方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220315

RJ01 Rejection of invention patent application after publication