CN110297908B - 诊疗方案预测方法及装置 - Google Patents

诊疗方案预测方法及装置 Download PDF

Info

Publication number
CN110297908B
CN110297908B CN201910584729.0A CN201910584729A CN110297908B CN 110297908 B CN110297908 B CN 110297908B CN 201910584729 A CN201910584729 A CN 201910584729A CN 110297908 B CN110297908 B CN 110297908B
Authority
CN
China
Prior art keywords
text
medical record
predicted
medical
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910584729.0A
Other languages
English (en)
Other versions
CN110297908A (zh
Inventor
李姣
覃露
徐晓巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Information CAMS
Original Assignee
Institute of Medical Information CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Information CAMS filed Critical Institute of Medical Information CAMS
Priority to CN201910584729.0A priority Critical patent/CN110297908B/zh
Publication of CN110297908A publication Critical patent/CN110297908A/zh
Application granted granted Critical
Publication of CN110297908B publication Critical patent/CN110297908B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了诊疗方案预测方法及装置,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。由上述内容可知,本发明在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失,提高了待预测病历文本的特征向量的准确度,进而提高了诊疗方案的预测准确率。

Description

诊疗方案预测方法及装置
技术领域
本发明属于医疗诊断技术领域,尤其涉及诊疗方案预测方法及装置。
背景技术
目前,在临床上,医生给出的诊疗方案完全依赖于医生自身的经验,为了加快医生的临床决策速度,提出了诊疗方案预测***,从而辅助医生快速给出有效的诊疗方案,减少患者等待时间。
目前的诊疗方案预测***主要是根据医学专家的临床经验与临床指南整理出临床规则,然后借助本体推理机进行推理,进而预测相应的诊疗方案。但是,这种方式需要人为从临床专家经验及临床指南中提取出临床规则,这个过程费时费力,而且,规则制定的全面性及逻辑性直接影响到预测结果的准确性,同时这种方式也存在效率低的问题。
发明内容
有鉴于此,本发明的目的在于提供一种诊疗方案预测方法及装置,以解决目前的诊疗方案预测方法准确率低且效率低的技术问题,其具体技术方案如下:
一方面,本发明提供了一种诊疗方案预测方法,包括:
获取待预测病历文本;
获取所述待预测病历文本包含的医学实体对应的医学实体向量,并获取所述待预测病历文本对应的文本特征向量;
利用预先训练得到的诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,所述诊疗方案包括药物、手术和检查项中的至少一种。
可选地,所述诊疗方案预测模型包括预设类别对应的预测模型;
所述利用诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,包括:
将所述待预测病历文本对应的文本特征向量输入至预选训练得到的基于深度学习的文本分类模型,得到所述待预测病历文本对应的文本类别;
将所述待预测病历文本对应的医学实体向量和文本向量,输入至与所述待预测病历文本的文本类别对应的预测模型中,预测得到与所述待预测病历文本相匹配的诊疗方案。
可选地,训练基于深度学习的文本分类模型的过程,包括:
获取已标注文本类别的病历训练样本;
利用词向量将所述病历训练样本转换为文本向量;
将所述病历训练样本的文本向量输入至预先构建的多层次注意力模型,提取得到文本特征向量,并基于所述文本特征向量对所述病历训练样本进行预测得到预测文本类别;
基于每一个所述病历训练样本对应的预测文本类别和已标注文本类别,调整所述多层次注意力模型中的模型参数,直到利用调整后的多层次注意力模型对所述病历训练样本进行预测得到的预测文本类型满足预设收敛条件。
可选地,获取所述待预测病历文本对应的文本特征向量,包括:
利用分词算法对所述待预测病历文本进行分词,得到所述待预测病历文本的文本分词结果;
利用词向量将所述文本分词结果中的各个词映射为对应的向量,得到所述待预测病历文本对应的文本向量;
利用多层次注意力模型从所述待预测病历文本对应的文本向量中提取得到文本特征向量;
其中,所述文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征。
可选地,所述获取所述待预测病历文本包含的医学实体对应的医学实体向量,包括:
获取所述待预测病历文本所包含的医学实体;
依据所述医学知识图谱表示学习模型,将所述待预测病历文本中的医学实体映射为对应的医学实体向量。
可选地,训练所述诊疗方案预测模型的过程,包括:
获取已标注诊疗方案的病历训练样本;
获取所述病历训练样本所包含医学实体的医学实体向量,并获取所述病历训练样本对应的文本特征向量;
将所述病历训练样本对应的医学实体向量及文本特征向量输入至预先构建的Seq2Seq模型,预测得到所述病历训练样本对应的预测诊疗方案;
基于每一个所述病历训练样本对应的预测诊疗方案和已标注诊疗方案,调整所述Seq2Seq模型中的模型参数,直到利用调整后的Seq2Seq模型对所述病历训练样本进行预测得到的预测诊疗方案满足预设收敛条件。
另一方面,本发明还提供了一种诊疗方案预测装置,包括:
第一获取模块,用于获取待预测病历文本;
第二获取模块,用于获取所述待预测病历文本包含的医学实体对应的医学实体向量;
第三获取模块,用于获取所述待预测病历文本对应的文本特征向量;
预测模块,用于利用预先训练得到的诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,所述诊疗方案包括药物、手术和检查项中的至少一种。
可选地,所述诊疗方案预测模型包括预设类别对应的预测模型;所述预测模块包括:
分类子模块,用于将所述待预测病历文本对应的文本特征向量输入至预选训练得到的基于深度学习的文本分类模型,得到所述待预测病历文本对应的文本类别;
预测子模块,用于将所述待预测病历文本对应的医学实体向量和文本向量,输入至与所述待预测病历文本的文本类别对应的预测模型中,预测得到与所述待预测病历文本相匹配的诊疗方案。
可选地,所述第三获取模块包括:
分词子模块,用于利用分词算法对所述待预测病历文本进行分词,得到所述待预测病历文本的文本分词结果;
映射子模块,用于利用词向量将所述文本分词结果中的各个词映射为对应的向量,得到所述待预测病历文本对应的文本向量;
特征提取子模块,用于利用多层次注意力模型从所述待预测病历文本对应的文本向量中提取得到文本特征向量;
其中,所述文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征。
可选地,所述第二获取模块包括:
第一获取子模块,用于获取所述待预测病历文本所包含的医学实体;
映射子模块,用于依据医学知识图谱表示学习模型,将所述待预测病历文本中的医学实体映射为对应的医学实体向量。
本发明提供的诊疗方案预测方法,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。由上述内容可知,该方法在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失,提高了待预测病历文本的特征向量的准确度,进而提高了诊疗方案的预测准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种诊疗方案预测方法的流程图;
图2是本发明实施例提供的诊疗方案预测***的结构示意图;
图3是本发明实施例提供的文本分类预测模型的训练过程的流程图;
图4是本发明实施例提供的诊疗方案预测模型的训练过程的流程图;
图5是本发明实施例提供的一种诊疗方案预测装置的框图;
图6是本发明实施例提供的一种第二获取模块的框图;
图7是本发明实施例提供的一种第三获取模块的框图;
图8是本发明实施例提供的一种预测模块的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,示出了本发明实施例提供的一种诊疗方案预测方法的流程图,该方法应用于终端或服务器中,如图1所示,该方法可以包括如下步骤:
S110,获取待预测病历文本。
待预测病历文本是指待治疗的患者的电子病历文本,目前很多医疗机构都能生成电子病历文本。
S120,获取待预测病历文本包含的医学实体对应的医学实体向量,并获取待预测病历文本对应的文本特征向量。
从待预测病历文本中提取所包含的各个医学实体,以及获取各个医学实体间的关联关系,并将该医学实体及其关联关系转换得到对应的医学实体向量。
其中,医学实体是指医学领域客观存在的实体,例如,疾病、病症、药物、手术等。例如,医学实体之间的关联关系可以包括:药物与疾病之间是治疗关系,病症与疾病之间是因果关系,手术与疾病之间是治疗关系。
在本发明的一个实施例中,
医学知识图谱是一种描述医学领域客观存在的实体、概念及它们之间关联关系的语义网络,采用语义技术形式表达***化、机构化、集成化的医学领域知识。
医学知识图谱表示学习模型旨在为知识图谱中的每个医学实体及关联关系学习得到相应的向量,同时,保留医学知识图谱中原有的结构或予以信息。利用医学知识图谱表示学习模型在知识融合及知识推理过程中提升计算效率。
利用医学知识图谱表示学习模型,获得待预测病历文本所包含的医学实体的向量表示,即得到医学实体向量。利用医学知识图谱表示学习模型得到的医学实体向量能够更准确地表达其在医学领域的语义信息,以及该医学实体与其它医学实体之间的关系。
在本发明的一个实施例中,医学知识图谱表示学习模型可以采用基于距离的翻译模型,具体的,将医学知识图谱用三元组(如,头实体、关系、尾实体)的形式进行表示,然后将三元组形式表示的医学知识图谱输入至基于距离的翻译模型后,得到医学知识图谱中各个医学实体及其关联关系的向量。
待预测病历文本中存在医学实体的上下文语境信息,因此,还需要将待预测病历文本转换为对应的文本特征向量。
在本发明的一个实施例中,先利用分词算法对待预测病历文本进行分词,得到该待预测病历文本的文本分词结果;然后,利用词向量将该文本分词结果中的各个词映射为对应的向量,得到该待预测病历文本对应的文本向量;然后,再利用基于深度学习的文本表示模型从该文本向量中提取得到文本特征向量。
该文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征。
其中,词向量是用来表示词语的向量,其作用是将文本中的每个词语映射为一个向量,实现文本到向量的转换。
S130,利用预先训练得到的诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与待预测病历文本相匹配的诊疗方案。
其中,所述诊疗方案包括药物、手术和检查项中的至少一种。
将S120得到的医学实体向量和文本特征向量输入至诊疗方案预测模型中,得到与该待预测病历文本相匹配的诊疗方案,例如,检查项、治疗药物、手术等。
在本申请的一个实施例中,该诊疗方案预测模型采用Seq2Seq (sequence-to-sequence)模型。Seq2Seq模型是一个Encoder–Decoder结构的网络,它的输入是一个序列,输出也是一个序列,Encoder将一个可变长度的信号序列变为固定长度的向量表达,Decoder将这个固定长度的向量变成可变长度的目标的信号序列。简而言之,Seq2Seq模型就是一个翻译模型,将一个语言序列翻译成另一种语言序列,整个处理过程通过使用深度神经网络 (如,LSTM网络)或RNN网络将一个序列作为输入映射为另一个输出序列。
如图2所示,利用医学知识图谱表示学习模型得到患者病历(即待预测病历文本)的医学实体向量;以及,利用基于深度学习的文本分类模型学习得到患者病历的文本特征向量,最后,将患者病历的医学实体向量及文本特征向量输入至Seq2Seq模型,Seq2Seq模型输出相应预测结果。
具体的,将待预测病历文本中的医学实体向量和文本特征向量组合,具体的,医学实体向量按照医学实体在待预测病历文中出现的先后顺序组成一个序列,然后,将文本特征向量添加到该序列最末端,得到输入序列。将该输入序列输入至Seq2Seq模型后,输出疾病序列(如多种疾病),或者,手术序列(如多种手术),或者,检查项序列(如多个检查)。
另外,因为Seq2Seq在Decoder中生成的序列中的每一项,都依赖于序列中该项前面的项,因此利用Seq2Seq模型考虑了每个项即预测结果之间的相关性。
在实际应用场景中,医生为一个患者所开处方中的药物不止一种,同理,检查项和手术也可能不止一种,所以,在进行诊疗方案预测时,预测模型会预测得到多种药物、多种检查项、多种手术等,即预测得到多个项。对于药物预测模型,一种药物对应一个结果标签,而预测结果之间往往存在相关性,例如,药物A和药物B之间有副作用关系不能同时使用,此时,应该换用另一种功能相同的药物替换药物A或药物B,如果预测模型考虑到这种相关性会使预测结果更可靠、更有用。
对于不同类型的诊疗方案,需要利用相对应的Seq2Seq模型进行预测得到,即,需要预先训练不同类型诊疗方案对应的Seq2Seq模型,例如,预测疾病的Seq2Seq模型、预测手术的Seq2Seq模型、预测治疗药物的Seq2Seq 模型,预测检查项的Seq2Seq模型等。
在训练不同预测结果类型的Seq2Seq模型时,利用与预测结果类型对应的训练样本进行模型训练,例如,利用包含治疗药物的训练样本训练Seq2Seq 模型得到预测治疗药物的Seq2Seq模型。因此,需要对病历训练样本进行分类。
在本申请的一个实施例中,可以利用基于深度学习的文本分类模型对大量的病历训练样本进行分类。将病历文本输入至基于深度学习的文本分类模型中,得到该病历文本对应的文本类别。
在本发明一种可能的实现方式中,基于深度学习的文本分类模型对病历文本进行分类的过程中会将该病历文本先转换为相应的文本特征向量,然后,依据该文本特征向量对病历文本进行分类。可见,提取文本特征向量是基于深度学习的文本分类模型的中间产物,因此,S120提取待预测病历文本对应的文本特征向量也可以采用基于深度学习的文本分类模型实现。
例如,基于深度学习的文本分类模型可以采用多层次注意力模型(HAN 模型)实现。当然,在本发明的其它可能的实现方式中,可以采用其它基于深度学习的模型代替,此处不再详述。
本实施例提供的诊疗方案预测方法,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。由上述内容可知,该方法在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失,提高了待预测病历文本的特征向量的准确度,进而提高了诊疗方案的预测准确率。
下面以HAN模型为例详细介绍HAN模型的训练过程,如图3所示,该训练过程可以包括以下步骤:
S210,获取已标注文本类别的病历训练样本。
本实施例中的病历训练样本已经预先标注了该病历训练样本所属的文本类别,其中,可以人工标注已有电子病历文本所属的文本类别,其中,文本类别与预测结果类别相同,包括疾病类别、药物类别、手术类别中的至少一项。
S220,利用词向量将病历训练样本转换为文本向量。
词向量是用来表示词语的向量,其作用是将文本中的每个词语映射为一个向量,实现文本到向量的转换。
但是,通用的词向量由通用的大型语料训练得到,这种词向量由于含义比较泛化,大部分的词向量所代表的意义不具备特定领域的词语意义。因此,为了得到更具某领域词语特点的词向量,需要利用该领域的词语语料对词向量模型进行训练,利用训练得到的词向量模型生成具有该领域的词语意义的词向量;训练得到的词向量能够该领域的词语转换得到更好地表达该领域词语含义的向量。
例如,利用医学领域的语料训练得到该领域的词向量,利用医学领域的词向量转换得到的向量能够更好地表征医学领域的词语。
S230,将病历训练样本的文本向量输入至预先构建的多层次注意力模型,提取得到文本特征向量,并基于文本特征向量对病历训练样本进行预测得到预测文本类别。
多层次注意力模型(HAN模型)包括三层依次为词汇层、句子层和输出层;其中,首先将待预测病历文本划分成多个句子,然后,用CNN (Convolutional Neural Networks,卷积神经网络)/LSTM(long-short term memory,长短期记忆)提取各个句子中的向量得到句子特征向量,考虑到每个词对句子具有不同的信息量,以及每个句子对整个文本具有不同的信息量,因此该层会加入Attention机制;然后,利用双向GRU对句子特征向量进行编码得到文本整体语义特征向量,同时考虑到每个句子对整个文本的信息量贡献不同引入注意力机制(即,Attention机制)。最后,将得到的文本特征向量输入至带有激活函数的全连接层即输出层,最终得到待预测病历文本的类别置信度。
其中,GRU网络是LSTM网络的一种效果很好的变体,GRU网络的结构比LSTM网络的结构更简单,而且效果好,LSTM网络能够学习长的依赖关系,记住较长的历史信息,同样,LSTM网络的变体GRU网络也能够学习较长的依赖关系,例如,文本中各个词语之间的位置关系。
自然语言作为一种序列类型,词与词之间有位置关系(即,语序关系), GRU模型能够记录这种词与词之间的相互位置关系,用来分析文本向量效果更好。其中,双向GRU(Bi-GRU)模型既可以对文本向量进行正向和逆向双向分析得到正向语义和逆向语义,从而能够更准确地提取出文本向量中的语义特征。
Attention机制,又叫做注意力机制,这种机制可以在训练模型的过程中,使模型更关注一些重要的信息,如在医学领域,更加关注那些与医学实体有关的词,这样能够使模型学习能力更好,使得模型最终预测的准确率更高。例如,使用Bi-GRU模型提取得到的语义特征中每一个词维度的向量没有表示重要性的权重,增加Attention机制后,使得该语义特征中的词维度向量具有重要性的权重,使得最终的病历训练样本的分类结果更准确。
预先构建的HAN模型中的模型参数是初始化时的参数或自定义的参数,模型训练过程就是不断地优化模型参数的过程。
S240,基于每一个病历训练样本对应的预测文本类别和已标注文本类别,优化多层次注意力模型中的模型参数,直到利用优化后的多层次注意力模型对所述病历训练样本进行预测得到的预测文本类型满足预设收敛条件。
模型训练过程就是不断地优化预先构建的HAN模型中的模型参数,直到满足预设收敛条件,其中,该收敛条件可以包括损失函数降至最低,同时准确率升至最高。换言之,模型参数优化过程就是通过学习病历文本的文本特征向量与其所属的文本类别之间的内在关系,最终确定出能够准确识别出内在关系的模型参数组合。
具体的,利用当前HAN模型预测得到所有病历训练样本所属的文本类别的预测结果;由于病历训练样本标注有其文本类别标签,根据病历训练样本的预测结果及标注的真实文本类别可以计算得到当前HAN模型的损失值及准确率。不断根据损失值和准确率对当前HAN模型中的模型参数进行优化,直到利用优化后的HAN模型预测病历训练样本得到的预测结果与其标注的文本类别结果之间的损失值小于损失值阈值,且该预测结果的准确率高于准确率阈值,此时确定当前模型参数为最优模型参数组合,即得到最终的HAN 模型。
请参见图4,示出了本发明实施例提供的诊疗方案预测模型的训练过程的流程图。如图4所示,该训练过程主要包括以下步骤:
S310,获取已标注诊疗方案的病历训练样本。
在本发明的一个实施例中,可以人工标注电子病历文本样本中所采用的诊疗方案,例如,治疗药物、手术、检查项中的至少一项。
S320,获取病历训练样本所包含医学实体的医学实体向量。
提取病历训练样本所包含的医学实体,并依据医学知识图谱获取病历训练样本所包含的各个医学实体之间的关联关系;然后,依据医学知识图谱表示学习模型,将医学实体及其关联关系映射为对应的医学实体向量。
S330,利用基于深度学习的文本分类模型,获取病历训练样本对应的文本特征向量及文本类别。
不同的病历训练样本所对应的诊疗方案类型可能不同,不同的诊疗方案类型对应的特征向量可能不同,因此,需要分别针对不同的诊疗方案类型对应的病历训练样本分别训练相应的诊疗方案预测模型。
其中,基于深度学习的文本分类模型用于对病历训练样本进行分类得到该病历训练样本的文本类别。
在本发明提供的一个实施例中,首先对病历训练样本进行分词,并利用词向量将分词得到的分词结果映射为相应的向量,然后对各个向量进行编码得到病历训练样本的文本向量。将病历训练样本的文本向量输入至基于深度学习的文本分类模型中,该文本分类模型先从病历训练样本的文本向量中提取得到文本特征向量,并依据该文本特征向量对病历训练样本进行分类得到该病历训练样本对应的文本类别。可见,文本特征向量是基于深度学习的文本分类模型的中间产物,因此,利用基于深度学习的文本分类模型在得到病历训练样本的文本类别的同时,还能得到该病历训练样本的文本特征向量。
例如,基于深度学习的文本分类模型可以是HAN模型。
S340,将病历训练样本对应的医学实体向量及文本特征向量输入至预先构建的Seq2Seq模型,预测得到病历训练样本对应的预测诊疗方案。
将病历训练样本对应的医学实体向量及文本特征向量组合后输入至预先构建的Seq2Seq模型中,其中,按照医学实体在病历训练样本中出现的先后顺序组成一个向量序列,然后,将文本特征向量添加到该序列最末端得到输入序列,将该输入序列输入至Seq2Seq模型,该Seq2Seq模型输出该病历训练样本对应的预测诊疗方案。
不同类别的病历训练样本分别输入至不同的Seq2Seq模型中,例如,病历训练样本的文本类别包括4类,则需要分别预先构建4个Seq2Seq模型,同一类别的病历训练样本分别输入至同一个Seq2Seq模型中。
S350,针对每一个类别的诊疗方案预测模型,基于该类别对应的每一个病历训练样本对应的预测诊疗方案和已标注诊疗方案,调整Seq2Seq模型中的模型参数,直到利用调整后的Seq2Seq模型对病历训练样本进行预测得到的预测诊疗方案满足预设收敛条件。
模型训练过程就是不断地优化预先构建的Seq2Seq模型中的模型参数,直到满足预设收敛条件,其中,该收敛条件可以包括损失函数降至最低,同时准确率升至最高。换言之,模型参数优化过程就是通过学习病历训练样本的医学特征向量和文本特征向量与对应的诊疗方案之间的内在关系,最终确定出能够准确识别出内在关系的模型参数组合。
具体的,预测诊疗方案是利用当前的Seq2Seq模型对病历训练样本进行预测得到的预测结果。每个病历训练样本标注有其对应的诊疗方案,即已标注诊疗方案。然后,根据病历训练样本的预测诊疗结果与已标注诊疗结果之间计算得到当前Seq2Seq模型的损失函数和准确率。不断地根据损失函数和准确率对当前Seq2Seq模型中的模型参数进行优化,直到利用优化后的 Seq2Seq模型预测得到每个病历训练样本的预测诊疗方案与其标注的已标注诊疗方案之间的损失函数小于损失值阈值,且准确率高于准确率阈值,此时,待确定当前模型参数为最优模型参数组合,即得到最终的Seq2Seq模型。
本实施例提供的诊疗方案预测模型训练过程,获取病历训练样本后,提取病历训练样本中的医学实体并获得各个医学实体之间的关联关系所对应的体特征向量,得到医学实体向量。然后,利用基于深度学习文本分类模型对病历训练样本进行分类得到各个病历训练样本对应的文本类别及文本特征向量。将同一类别的病历训练样本对应的医学特征向量和文本特征向量输入至 Seq2Seq模型中,预测得到预测诊疗方案,并依据预测诊疗方案和已标注诊疗方案优化当前Seq2Seq模型的模型参数,直到满足预设收敛条件。上述的整个训练过程不需要人工构建规则和特征,省时省力。
相应于上述的诊疗方案预测方法实施例,本发明还提供了相应的装置实施例。
请参见图5,示出了本发明实施例提供的一种诊疗方案预测装置的框图,该装置应用于服务端,如图5所示该装置包括:第一获取模块110、第二获取模块120、第三获取模块130和预测模块140。
第一获取模块110,用于获取待预测病历文本。
第二获取模块120,用于获取待预测病历文本包含的医学实体对应的医学实体向量。
在本发明的一个实施例中,如图6所示,第二获取模块120可以包括第一获取子模块121和映射子模块122;
该第一获取子模块121,用于获取待预测病历文本所包含的医学实体。
该映射子模块122,用于依据医学知识图谱表示学习模型,将待预测病历文本中的医学实体映射为对应的医学实体向量。
第三获取模块130,用于获取待预测病历文本对应的文本特征向量。
在本发明的一个实施例中,如图7所示,该第三获取模块130包括:分词子模块131、映射子模块132和特征提取子模块133;
该分词子模块131,用于利用分词算法对待预测病历文本进行分词,得到待预测病历文本的文本分词结果。
该映射子模块132,用于利用词向量将文本分词结果中的各个词映射为对应的向量,得到待预测病历文本对应的文本向量。
该特征提取子模块133,用于利用多层次注意力模型从待预测病历文本对应的文本向量中提取得到文本特征向量。
其中,文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征。
预测模块140,用于利用预先训练得到的诊疗方案预测模型分析待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案。
其中,所述诊疗方案包括药物、手术和检查项中的至少一种。
在本发明的一个实施例中,诊疗方案预测模型包括多个预设类别对应的预测模型,如图8所示,所述预测模块140包括:分类子模块141和预测子模块142。
该分类子模块141,用于将待预测病历文本对应的文本特征向量输入至预选训练得到的基于深度学习的文本分类模型,得到待预测病历文本对应的文本类别。
该预测子模块142,用于将待预测病历文本对应的医学实体向量和文本向量,输入至与待预测病历文本的文本类别对应的预测模型中,预测得到与待预测病历文本相匹配的诊疗方案。
在本发明的一个实施例中,训练基于深度学习的文本分类模型的过程如下:
获取已标注文本类别的病历训练样本;
利用词向量将所述病历训练样本转换为文本向量;
将所述病历训练样本的文本向量输入至预先构建的多层次注意力模型,提取得到文本特征向量,并基于所述文本特征向量对所述病历训练样本进行预测得到预测文本类别;
基于每一个所述病历训练样本对应的预测文本类别和已标注文本类别,调整所述多层次注意力模型中的模型参数,直到利用调整后的多层次注意力模型对所述病历训练样本进行预测得到的预测文本类型满足预设收敛条件。
在本发明的另一个实施例中,训练所述诊疗方案预测模型的过程包括:
获取已标注诊疗方案的病历训练样本;
获取所述病历训练样本所包含医学实体的医学实体向量,并获取所述病历训练样本对应的文本特征向量;
将所述病历训练样本对应的医学实体向量及文本特征向量输入至预先构建的Seq2Seq模型,预测得到所述病历训练样本对应的预测诊疗方案;
基于每一个所述病历训练样本对应的预测诊疗方案和已标注诊疗方案,调整所述Seq2Seq模型中的模型参数,直到利用调整后的Seq2Seq模型对所述病历训练样本进行预测得到的预测诊疗方案满足预设收敛条件。
本实施例提供的诊疗方案预测装置,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。由上述内容可知,该装置在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失,提高了待预测病历文本的特征向量的准确度,进而提高了诊疗方案的预测准确率。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请各实施例中的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种诊疗方案预测方法,其特征在于,包括:
获取待预测病历文本;
获取所述待预测病历文本包含的医学实体对应的医学实体向量,并获取所述待预测病历文本对应的文本特征向量;
利用预先训练得到的诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,所述诊疗方案包括药物、手术和检查项中的至少一种;
获取所述待预测病历文本对应的文本特征向量,包括:
利用分词算法对所述待预测病历文本进行分词,得到所述待预测病历文本的文本分词结果;
利用词向量将所述文本分词结果中的各个词映射为对应的向量,得到所述待预测病历文本对应的文本向量;其中,所述词向量为利用医学领域的语料训练得到的;
利用多层次注意力模型从所述待预测病历文本对应的文本向量中提取得到文本特征向量;其中,所述文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征;
所述诊疗方案预测模型包括预设类别对应的预测模型;
利用诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,包括:
将所述待预测病历文本对应的文本特征向量输入至预选训练得到的基于深度学习的文本分类模型,得到所述待预测病历文本对应的文本类别;
将所述待预测病历文本对应的医学实体向量和文本向量,输入至与所述待预测病历文本的文本类别对应的预测模型中,预测得到与所述待预测病历文本相匹配的诊疗方案。
2.根据权利要求1所述的方法,其特征在于,训练基于深度学习的文本分类模型的过程,包括:
获取已标注文本类别的病历训练样本;
利用词向量将所述病历训练样本转换为文本向量;
将所述病历训练样本的文本向量输入至预先构建的多层次注意力模型,提取得到文本特征向量,并基于所述文本特征向量对所述病历训练样本进行预测得到预测文本类别;
基于每一个所述病历训练样本对应的预测文本类别和已标注文本类别,调整所述多层次注意力模型中的模型参数,直到利用调整后的多层次注意力模型对所述病历训练样本进行预测得到的预测文本类型满足预设收敛条件。
3.根据权利要求1所述的方法,其特征在于,所述获取所述待预测病历文本包含的医学实体对应的医学实体向量,包括:
获取所述待预测病历文本所包含的医学实体;
依据医学知识图谱表示学习模型,将所述待预测病历文本中的医学实体映射为对应的医学实体向量。
4.根据权利要求1所述的方法,其特征在于,训练所述诊疗方案预测模型的过程,包括:
获取已标注诊疗方案的病历训练样本;
获取所述病历训练样本所包含医学实体的医学实体向量,并获取所述病历训练样本对应的文本特征向量;
将所述病历训练样本对应的医学实体向量及文本特征向量输入至预先构建的Seq2Seq模型,预测得到所述病历训练样本对应的预测诊疗方案;
基于每一个所述病历训练样本对应的预测诊疗方案和已标注诊疗方案,调整所述Seq2Seq模型中的模型参数,直到利用调整后的Seq2Seq模型对所述病历训练样本进行预测得到的预测诊疗方案满足预设收敛条件。
5.一种诊疗方案预测装置,其特征在于,包括:
第一获取模块,用于获取待预测病历文本;
第二获取模块,用于获取所述待预测病历文本包含的医学实体对应的医学实体向量;
第三获取模块,用于获取所述待预测病历文本对应的文本特征向量;
预测模块,用于利用预先训练得到的诊疗方案预测模型分析所述待预测病历文本对应的医学实体向量和文本向量,得到与所述待预测病历文本相匹配的诊疗方案,所述诊疗方案包括药物、手术和检查项中的至少一种;
所述诊疗方案预测模型包括预设类别对应的预测模型;所述预测模块包括:
分类子模块,用于将所述待预测病历文本对应的文本特征向量输入至预选训练得到的基于深度学习的文本分类模型,得到所述待预测病历文本对应的文本类别;
预测子模块,用于将所述待预测病历文本对应的医学实体向量和文本向量,输入至与所述待预测病历文本的文本类别对应的预测模型中,预测得到与所述待预测病历文本相匹配的诊疗方案;
所述第三获取模块包括:
分词子模块,用于利用分词算法对所述待预测病历文本进行分词,得到所述待预测病历文本的文本分词结果;
映射子模块,用于利用词向量将所述文本分词结果中的各个词映射为对应的向量,得到所述待预测病历文本对应的文本向量;其中,所述词向量为利用医学领域的语料训练得到的;
特征提取子模块,用于利用多层次注意力模型从所述待预测病历文本对应的文本向量中提取得到文本特征向量;
其中,所述文本特征向量包含词间语义特征、句间语义特征和文本整体语义特征。
6.根据权利要求5所述的装置,其特征在于,所述第二获取模块包括:
第一获取子模块,用于获取所述待预测病历文本所包含的医学实体;
映射子模块,用于依据医学知识图谱表示学习模型,将所述待预测病历文本中的医学实体映射为对应的医学实体向量。
CN201910584729.0A 2019-07-01 2019-07-01 诊疗方案预测方法及装置 Active CN110297908B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910584729.0A CN110297908B (zh) 2019-07-01 2019-07-01 诊疗方案预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910584729.0A CN110297908B (zh) 2019-07-01 2019-07-01 诊疗方案预测方法及装置

Publications (2)

Publication Number Publication Date
CN110297908A CN110297908A (zh) 2019-10-01
CN110297908B true CN110297908B (zh) 2021-09-21

Family

ID=68029775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910584729.0A Active CN110297908B (zh) 2019-07-01 2019-07-01 诊疗方案预测方法及装置

Country Status (1)

Country Link
CN (1) CN110297908B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128391B (zh) * 2019-12-24 2021-01-12 推想医疗科技股份有限公司 一种信息处理设备、方法和存储介质
CN111191035B (zh) * 2019-12-30 2022-07-19 四川大学华西医院 一种识别肺癌临床数据库文本实体的方法及装置
CN111259111B (zh) * 2020-01-13 2022-02-18 安徽科大讯飞医疗信息技术有限公司 基于病历的辅助决策方法、装置、电子设备和存储介质
CN111259112B (zh) * 2020-01-14 2023-07-04 北京百度网讯科技有限公司 医疗事实的验证方法和装置
CN111274397B (zh) * 2020-01-20 2023-10-27 北京百度网讯科技有限公司 建立实体关系检测模型的方法以及装置
CN111383770B (zh) * 2020-03-09 2022-08-30 北京大学 一种临床研究与随访融合***和方法
CN111507827A (zh) * 2020-04-20 2020-08-07 上海商涌网络科技有限公司 一种健康风险评估的方法、终端及计算机存储介质
CN111540468B (zh) * 2020-04-21 2023-05-16 重庆大学 一种诊断原因可视化的icd自动编码方法与***
CN111724897B (zh) * 2020-06-12 2022-07-01 电子科技大学 一种运动功能数据处理方法及***
CN111834017A (zh) * 2020-07-09 2020-10-27 上海市精神卫生中心(上海市心理咨询培训中心) 一种精神药物治疗效果预测方法,***和装置
CN112071425B (zh) * 2020-09-04 2022-10-21 平安科技(深圳)有限公司 一种数据处理方法、装置、计算机设备及存储介质
CN112331332A (zh) * 2020-10-14 2021-02-05 北京工业大学 一种基于多粒度特征融合的疾病预测方法及***
CN112259246B (zh) * 2020-10-21 2023-07-25 平安科技(深圳)有限公司 一种融合医学概念层级结构的疾病预测方法及相关设备
CN112017776B (zh) * 2020-10-27 2021-01-15 平安科技(深圳)有限公司 基于动态图和医学知识图谱的疾病预测方法及相关设备
CN112435761A (zh) * 2020-12-04 2021-03-02 中国信息通信研究院 一种信息推荐方法和装置
CN112635050B (zh) * 2020-12-23 2022-12-06 安徽讯飞医疗股份有限公司 诊断推荐方法及电子设备、存储装置
CN112820411B (zh) * 2021-01-27 2022-07-29 清华大学 医学关系提取方法及装置
CN112786198B (zh) * 2021-02-08 2024-05-31 科大讯飞股份有限公司 诊疗信息推荐模型构建方法、诊疗信息推荐方法及装置
CN113270189B (zh) * 2021-05-19 2023-08-18 复旦大学附属肿瘤医院 一种基于强化学习的肿瘤治疗辅助决策方法
CN113094476A (zh) * 2021-06-08 2021-07-09 明品云(北京)数据科技有限公司 基于自然语言处理风险预警方法、***、设备及介质
CN113535974B (zh) * 2021-06-28 2024-04-09 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN113470827A (zh) * 2021-06-30 2021-10-01 上海商汤智能科技有限公司 分类方法及装置、电子设备和存储介质
CN113345286B (zh) * 2021-08-03 2021-11-19 南京大经中医药信息技术有限公司 一种融合了ai技术和视频技术的师承教学***及方法
CN114238558A (zh) * 2021-11-12 2022-03-25 北京惠及智医科技有限公司 一种电子病历的质检方法、装置、存储介质及设备
CN114373553A (zh) * 2021-12-20 2022-04-19 中国科学院苏州生物医学工程技术研究所 基于多标签预测模型的医疗处置措施预测***及其应用
CN114999599A (zh) * 2022-05-26 2022-09-02 中国科学技术信息研究所 数据处理方法、装置、电子设备及计算机可读存储介质
CN116306925B (zh) * 2023-03-14 2024-05-03 中国人民解放军总医院 一种生成端到端实体链接方法和***
CN116504331B (zh) * 2023-04-28 2024-07-26 东北林业大学 基于多模态和多任务的药物副作用的频率分数预测方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200508858A (en) * 2003-08-20 2005-03-01 Primax Electronics Ltd File management method for a digital device
US8126736B2 (en) * 2009-01-23 2012-02-28 Warsaw Orthopedic, Inc. Methods and systems for diagnosing, treating, or tracking spinal disorders
CN108305690A (zh) * 2018-02-07 2018-07-20 王博冉 神经***疾病分诊方法及神经***疾病的分诊***
CN108595708A (zh) * 2018-05-10 2018-09-28 北京航空航天大学 一种基于知识图谱的异常信息文本分类方法
CN108984745B (zh) * 2018-07-16 2021-11-02 福州大学 一种融合多知识图谱的神经网络文本分类方法
CN109087691A (zh) * 2018-08-02 2018-12-25 科大智能机器人技术有限公司 一种基于深度学习的非处方药品推荐***和推荐方法
CN109346169A (zh) * 2018-10-17 2019-02-15 长沙瀚云信息科技有限公司 一种人工智能辅助诊疗***及其构建方法、设备和存储介质
CN109378064B (zh) * 2018-10-29 2021-02-02 南京医基云医疗数据研究院有限公司 医疗数据处理方法、装置电子设备及计算机可读介质
CN109785928B (zh) * 2018-12-25 2024-06-25 平安科技(深圳)有限公司 诊疗方案推荐方法、装置及存储介质
CN109920508B (zh) * 2018-12-28 2022-11-01 安徽省立医院 处方审核方法及***
CN109754886A (zh) * 2019-01-07 2019-05-14 广州达美智能科技有限公司 治疗方案智能生成***、方法及可读存储介质、电子设备
CN109920501B (zh) * 2019-01-24 2021-04-20 西安交通大学 基于卷积神经网络和主动学习的电子病历分类方法及***

Also Published As

Publication number Publication date
CN110297908A (zh) 2019-10-01

Similar Documents

Publication Publication Date Title
CN110297908B (zh) 诊疗方案预测方法及装置
CN111274373B (zh) 一种基于知识图谱的电子病历问答方法及***
CN111613339B (zh) 一种基于深度学习的相似病历查找方法与***
CN109871545B (zh) 命名实体识别方法及装置
CN110119786B (zh) 文本话题分类方法及装置
US11501182B2 (en) Method and apparatus for generating model
CN107977361B (zh) 基于深度语义信息表示的中文临床医疗实体识别方法
CN112002411A (zh) 一种基于电子病历的心脑血管病知识图谱问答方法
CN109871538A (zh) 一种中文电子病历命名实体识别方法
CN110114764B (zh) 在会话中提供饮食帮助
WO2023029502A1 (zh) 基于问诊会话构建用户画像的方法、装置、设备和介质
CN111222340B (zh) 基于多标准主动学习的乳腺电子病历实体识别***
CN108628824A (zh) 一种基于中文电子病历的实体识别方法
US20190057773A1 (en) Method and system for performing triage
CN110675944A (zh) 分诊方法及装置、计算机设备及介质
CN110895559B (zh) 模型训练、文本处理方法、装置以及设备
CN111538845A (zh) 一种构建肾病专科医学知识图谱的方法、模型及***
CN110110059B (zh) 一种基于深度学习的医疗对话***意图识别分类方法
CN110210036A (zh) 一种意图识别方法及装置
CN113707307A (zh) 病情分析方法、装置、电子设备及存储介质
CN112420191A (zh) 一种中医辅助决策***及方法
CN113689951A (zh) 一种智能导诊方法、***和计算机可读存储介质
CN111611780A (zh) 基于深度学习的消化内镜报告结构化方法与***
CN114330482A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN117577253A (zh) 基于大数据的医疗临床数据质量分析方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant