CN108831559A - 一种中文电子病历文本分析方法与*** - Google Patents

一种中文电子病历文本分析方法与*** Download PDF

Info

Publication number
CN108831559A
CN108831559A CN201810635258.7A CN201810635258A CN108831559A CN 108831559 A CN108831559 A CN 108831559A CN 201810635258 A CN201810635258 A CN 201810635258A CN 108831559 A CN108831559 A CN 108831559A
Authority
CN
China
Prior art keywords
case history
text
information
similitude
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810635258.7A
Other languages
English (en)
Other versions
CN108831559B (zh
Inventor
张学工
李季
闾海荣
陈文昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810635258.7A priority Critical patent/CN108831559B/zh
Publication of CN108831559A publication Critical patent/CN108831559A/zh
Application granted granted Critical
Publication of CN108831559B publication Critical patent/CN108831559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

中文电子病历文本分析方法与***,该方法包括以下步骤:利用病历文本获取病历数据集;用正则处理分离数值变量和文本信息,根据上下文表述确定数值信息含义,利用正则表达式搜索并结构化保存不同类别的时间信息;采用自然语言处理对文本分词及词性标注,结合医学实体识别进一步筛选,确定文本中医学关键词汇的位置及类型;分析筛选出医学关键词汇和信息;利用上述相关结果,对病历进行仿真;将文本内容转化成数值向量;对各病历文本添加相似性标签;对病历文本的标注进行学习;根据标注和训练结果对新到的病历样本在病历数据集中筛选出具有相似性的病历。本发明对不同的评价标准,每一新到病历文本可从已有病历文本中找到不同的相似病历文本簇。

Description

一种中文电子病历文本分析方法与***
技术领域
本发明涉及机器学习技术领域,具体地说,涉及一种中文电子病历文本分析方法与***。
背景技术
基于电子医疗信息分析的辅助诊断***随着医院电子化和信息化的水平提高而得到广泛应用。医生除了可以从既往经手病历中获得对新病人的诊断治疗经验,也可以从辅助诊断***中存储的其他相似病人的治疗手段得到启发。分析和利用电子病历中存储的信息,可以为医生做出精准的诊断提供帮助。本发明旨在对过往病历进行分析,如果专家对其中部分病历的相似性已经做出了判断,那么本发明将依据这种相似性关系,对新到病历进行分析,查找已有病历中和当前病历比较相似的病历或病历簇。
现阶段的对中文病历的分析主要是使用机器学习方法去对病历所描述的病人进行预测或结合医学图像信息对病人的病情进行分类等。相似性评估的主要手段则是通过度量学习来对结构化程度较高的病历中的数值型特征进行分析。
现有技术的缺陷和不足:
现有技术虽然将传统距离度量学习方法应用于中文病历文本分析***当中,但是由于其数据或者研究方法的局限性导致现有技术仍然存在如下缺点:
(1)对数据的结构化程度要求较高。现有方法研究对象都是结构化程度比较高的病历。病历的各项内容都已经以某种特定的形式整理好。对于以大量自由医学文本形式存在的病历的分析较少,而本发明则提供了从中文病历的自由文本中抽取数值变量、时间信息、医学实体等部分。
(2)从实际应用角度考虑,现有技术从病历内容出发,试图去寻找一种合适的算法,计算病历之间的相似度,而没有挖掘给定标签背后潜在的规律或特质,进而寻找相似病历。
发明内容
为解决以上问题,本发明提供一种中文电子病历文本分析方法,包括以下步骤:
步骤S10,将真实病历文本作为原始数据,经过输入、格式变换并存储得到待处理的病历数据集;
步骤S30,利用正则处理分离数值变量和文本信息,其中,
步骤S301,构建数值变量所对应的正则表达式,并根据上下文表述确定数值信息的含义类别,搜索并结构化保存不同类别的时间信息;
步骤S302,采用自然语言处理方法对文本进行分词,并对分词结果进行词性标注,结合医学实体识别做进一步筛选,确定文本信息中医学关键词汇信息的位置及类型;
步骤S303,根据分词、词性标注和实体识别结果,分析得到筛选后的医学关键词汇和信息;
步骤S50,将文本信息转化成能够被计算机识别处理的数值向量;
步骤S60,对各病历文本之间添加相似性关系标签;
步骤S70,结合相似性学习方法、距离度量学习方法,对病历文本的标注进行学习;
步骤S80,根据标注和训练结果对新到的病历样本在病历数据集中筛选出具有相似性的病历。
优选地,还包括步骤S20,根据真实病历文本所属的病历类型分类存储,形成病历数据集,并且,对每个病历,针对病历中记载的医疗活动过程的不同将每个病历文本划分成多个段落。
优选地,在步骤S60中,将在病历的诊断部分中医生的结论进行特征提取,并参考这些特征评判病历之间的相似程度,从而对各病历文本添加相似性标签。
优选地,采用机器学习方法对病历文本进行分类、聚类分析,验证所提取特征是否适于判断病历相似性。
优选地,还将步骤S60中提取的医生的结论和步骤S30筛选的医学关键词汇和信息应用于生成仿真病历文本。
优选地,在步骤S60中,还对数值化的高维向量做维数压缩,将高维向量用降维算法压缩维数,降低稀疏性。
优选地,在步骤S70中,以步骤S60中进行了相似性标注的病历文本数据作为训练数据,针对不同的相似性标准,并根据病历文本之间标注的相似性关系,利用半监督或弱监督的度量学习算法进行训练;
在步骤S80中,根据不同的相似性标准,筛选出对应该相似性标准的相似病历。
优选地,数值信息的含义类别包括时间信息、用药剂量信息、化验检验结果记录信息。
优选地,步骤S303中,筛选后的医学关键词汇和信息按照其发生的时间顺序进行存储。
一种中文电子病历文本分析***,包括:
病历文本输入模块,获取真实病历文本,并经过输入、存储和格式变换操作得到待处理的病历数据集;
关键信息筛选模块,对病历数据集进行医学语言处理,筛选医学关键词汇和信息,并将其转化成计算机可处理的数字量形式;
特征提取模块,对在病历的诊断部分中医生的结论进行特征提取;
病历文本仿真模块,将提取的医生的结论和筛选出的医学关键词汇信息应用于训练生成仿真病历文本及其段落;
相似性标注模块,根据相似性标准对病历数据集进行相似性标注;
相似性训练模块,训练模块根据相似性标注模块的相似性标注结果,采用半监督或弱监督的算法进行训练;
相似结果输出模块,根据相似性标准和训练结果,对新到病历在原始病历数据库中的相似病历簇依据相似性程度高低进行排序输出。
本发明相对于现有技术具有以下有益效果:
(1)本发明提供了一种新的分析方法,对应于病历文本的数据,提供了一套从输入到输出的完整流程。可以应用到临床电子病历文本***的设计当中。
(2)通常的电子病历***只会根据默认的参数和规则来判断病历文本的相似性。但是,具有不同医学知识专业、不同领域背景的专家对于两份病历文本之间的相似与否的关系会做出不同的判断。造成这种结果的原因是专家所具有的知识不同,分析看待事物的角度也不同,这样,在面对相同材料的时候,会有不同的评价标准。在本发明中,这种隐含的不同评价标准会显式的表现在对病历文本相似与否的标注上。
本发明旨在应用于对于不同的评价标准下,当给出不同的病历是否相似的标签时,经过本***的训练,对每一个新到病历文本都会从已有病历文本中找到不同的相似病历文本簇。在临床应用上,本发明可以为具有不同医学背景的医生会诊讨论病情提供帮助。
(3)本发明的另一大优势在于,本***的输入是病历的非结构化程度较高的自由文本,这种自由文本将涵盖更全面的病人信息,有助于探索更全面的描述病人的情况。
附图说明
通过结合下面附图对其实施例进行描述,本发明的上述特征和技术优点将会变得更加清楚和容易理解。
图1是表示本发明实施例的中文电子病历文本分析方法的流程示意图;
图2是表示本发明实施例的中文电子病历文本分析***的构成示意图。
具体实施方式
下面将参考附图来描述本发明所述的中文电子病历文本分析方法与***的实施例。本领域的普通技术人员可以认识到,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
本实施例的中文电子病历文本分析方法包括以下步骤:
步骤S10,将来自临床的病历文本(即真实病历文本)作为原始数据,得到待处理的病历数据集。优选地,根据病历文本所属的病历类型(如入院病历、住院病历、出院病历等)分别输入并存储。
步骤S30,对病历的每个段落,利用正则处理分离数值变量和文本信息。其中还包括以下步骤,
步骤S301,根据上下文表述确定数值信息的含义类别,从而构建对应的正则表达式,搜索并结构化保存不同类别的时间信息。具体说,在病历文本中,根据数字所表达的含义不同可以分为例如时间记录、化验检验结果记录、用药剂量等。依据上下文表述,进一步确定提取的数值信息表示的具体意义。
在病历文本中,通常有较为丰富的时间表达方式。例如,在病历文本中,“2年前”,2017.5.25表示时间点,“3月余”表示持续时间段,利用这种表达方式上的规律,可以构建正则表达式,用匹配的方式去搜索并结构化的保存病历文本中的时间信息。
而在病历文本中,出现的另一部分数字多用于表示药品剂量或化验检查结果。例如,120mmHg则表示血压值,38.5℃则表示温度。在搜索整个病历中的时间信息后,剩下的数值信息也可以利用正则处理得到保存。也就是说,可以根据各时间信息所表达的含义不同,分别设定不同的正则表达式,从而可以将时间信息、用药剂量信息、化验检验结果记录等分别结构化保存。
步骤S302,采用自然语言处理方法对病历文本进行分词,并对分词结果利用词性信息进行词性标注,结合医学实体识别做进一步的二次筛选,确定文本中医学关键词汇信息的位置及类型。具体说,经过自然语言处理(包括分词,词性标注等)方法对分词结果利用词性信息进行初次筛选后,得到的词并不都对病历文本相似度的判别过程起到作用,仍需结合医学实体识别做进一步的二次筛选。例如,在一段文本信息中,利用词性信息初次筛选出一些名词,而进一步利用医学实体识别进行二次筛选可以进一步筛选出具有一定医学意义的内容。比如一些药品名字、一些身体部位等,通过初次筛选和二次筛选有助于提高分析效果。
其中,优选地,利用条件随机场算法对分词后的病历文本做实体识别,即对病历中依次出现的词汇序列进行标注,将诸如“症状”、“检查”、“用药”或“其他”等自定义的具有一定医学信息的标签和文本中出现的词的映射关系标注出来。如前述得到的分词和词性结果都用于条件随机场算法中模板的设置。这样,确定文本中医学关键词汇信息的位置及类型,便于后续分析。
步骤S303,根据分词、词性标注和实体识别结果,分析得到筛选后的医学关键词汇和信息,即各分词、词性标注和实体识别的各信息形成对应的词表,通过获取词表的交集或并集等手段,得到新的词表。例如,一种取词表交集的方法,分词所分得的词表中有“眼睛”,词性标注的名词中有“眼睛”,而根据医学实体识别的词表中也有“眼睛”,则将“眼睛”一词筛选出来。如有对应时间记录的信息,可将其按照发生的时间顺序进行存储,便于查找阅读,例如,
手指 2017.5.25;
灰指甲 2017.5.28;
阑尾炎 2017.11.28。
步骤S50,将文本信息转化成计算机处理的数值向量。在自然语言处理中,有多种方法如one-hot编码或词嵌入等方式,通过将文本中出现的词汇表示成高维向量,从而对一段文本用数值向量化表示。这样文本信息就可以转化成计算机能够处理的数值向量,同时经过词性标注和实体识别等手段,在降噪的同时保留文本中的关键信息。
步骤S60,根据相似性标准不同对各病历文本添加相似性标签。
如前所述,具有不同知识背景和临床经验的医学专家对于相同的病历会给出不完全相同的判断。为后续度量学习算法输入要求,这一步骤会对部分病历文本之间的相似与否的关系给出标签,如1号病历与2号病历相似,1号病历与3号病历不相似等。给病历文本赋予相似标签这一工作可以采用两种方式,第一种是请医学专家阅读已有病历,并给出标签。相较于这种耗费人力成本较高的方式,在分析过程中,可以采用另一种方式,即通过人工相似的标准,编写程序由计算机判别并赋予相似标签,最后制定标准的专家对相似结果进行审阅,如果有需要可以对机器标注的标签进行修改。这种方式即有人工参与,同时也利用了计算机进行标注,这种半自动化的方式有利于节省人力。无论是完全经由人工标注或半自动化标注,当相似性标准不同时,对于相同的病历之间的关系而言会有不同的相似性标签,而这种标注的不同会导致输出结果的不同。例如某两个病历对应一个相似性标准可能相似性很高,而对应另一个相似性标准,则可能相似性降低。
步骤S70,结合相似性学习方法、距离度量学习方法,对数据的标注进行学习。这一步骤是以步骤S60中进行了相似性标注的病历文本数据作为训练数据,并根据病历文本之间标注的相似性关系,利用弱监督或半监督的度量学习算法进行训练。该模型力图将表示病历文本的高维向量映射到低维空间中,并保留其中的相似性关系。当对已有数据集进行少量且充分的相似关系标注后,训练基于弱监督的度量学习模型的目的在于通过迭代计算度量矩阵,完成从高维空间到低维空间的映射。同时,这一模型将利用度量矩阵,将未标注的高维向量表示同时进行映射变换,并据此得到未标注数据与已标注数据之间的关系。最终,利用该相似性学习算法和度量学习算法,得到能够潜在表示当前标注策略的度量矩阵并可利用该矩阵于后续步骤中计算新到病历和当前病历的相似关系。
步骤S80,根据标注和训练结果对新到的病历样本在原始数据集中计算筛选出相似病历的结果。
在一个可选实施例中,在步骤S10和步骤S30之间还包括步骤S20,对每个病历,针对病历中记载的医疗活动过程的不同来划分段落,例如划分出主诉、检查情况、诊断、治疗等不同记录格式类型的部分,后续的步骤均依据各部分中所记录的信息分段地进行处理。
在一个可选实施例中,在步骤S60中,需要将在病历的诊断部分(确定诊断或辅助诊断)中医生的结论进行特征提取,即提取结论的关键信息作为特征,如疾病种类及其并发症等、癌症的分期等,并参考这些特征评判病历之间的相似性程度,从而对各病历文本添加相似性标签。
特征提取方法除了如前所述的实体识别等手段外,还可采用机器学习方法对病历文本进行分类、聚类分析,验证所提取特征对于判断病历属性所起到的作用。
在一个可选实施例中,还可以将特征提取的医生的结论和步骤S30筛选的医学关键词汇和信息应用于生成仿真病历文本。
在一个可选实施例中,在步骤S60中,还对数值化的高维向量做维数压缩,将高维向量结果直接用于度量学习,可能会增加程序运行所耗费的硬件资源和时间。所以对表示病历文本的数值向量,如果有需要,也可做特征提取,这一部分主要指的是将高维向量用降维算法压缩维数,降低稀疏性。
在一个可选实施例中,步骤S70中,可以根据不同的相似性标准来训练模型,对应地,步骤S80中,也就可以筛选出对应该相似性标准的相似病历。
本发明还提供一种中文电子病历文本分析***,该***包括病历文本输入模块11、病历文本结构化模块12、关键信息筛选模块13、病历文本仿真模块14、特征提取模块15、相似性标注模块16、相似性训练模块17、相似结果输出模块18等。其中,病历文本输入模块从数据源得到病历文本,并经过输入、存储和格式变换得到待处理的病历数据集。病历结构化模块将输入的病历形成的病历数据集转化成结构化程度较高的格式,具体说,是对每个病历,针对病历中记载的医疗活动过程的不同来划分段落,例如划分出主诉、检查情况、诊断、治疗等不同记录格式类型的段落。不过如果输入病历已经为结构化数据,则可以省略此模块。关键信息筛选模块对经过结构化之后的病历文本进行医学语言处理,提取医学实体,时间信息,并将其转化成计算机可处理的数字量形式。特征提取模块采用机器学习方法对数据集进行分类、聚类分析,利用筛选的关键信息和提取的医学实体特征等信息生成仿真病历文本,其主要目的是对原始病历进行变换,起到去除隐私,保护病人权利的作用。生成的仿真病历文本用于训练模块进行数据训练。
相似性标注模块用于标注病历的相似性标签,该模块可以根据用户设定的不同的相似性标准,对病历数据集的不同部分进行不同的相似性标注。例如,对于病历数据集中的某两个病历,采用一个相似性标准,对其他病历,采用另一个相似性标准。相似性标注模块既用于训练模块,又用于对输出模块给出相似性标准。训练模块采用半监督方法或者弱监督的相似性学习方法,根据相似性标注模块的相似性标注结果,训练数据。输出模块根据相似性标准和训练结果,对新到病历的在原始病历数据库中的相似病历簇进行可视化输出。输出结果会受到不同的相似性标准影响而输出不同结果。而对于每一次输出结果,均依据算法计算得到的相似程度,排序输出结果。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种中文电子病历文本分析方法,其特征在于,包括以下步骤:
步骤S10,将真实病历文本作为原始数据,经过输入、格式变换并存储得到待处理的病历数据集;
步骤S30,利用正则处理分离数值变量和文本信息,其中,
步骤S301,构建数值变量所对应的正则表达式,并根据上下文表述确定数值信息的含义类别,搜索并结构化保存不同类别的时间信息;
步骤S302,采用自然语言处理方法对文本进行分词,并对分词结果进行词性标注,结合医学实体识别做进一步筛选,确定文本信息中医学关键词汇信息的位置及类型;
步骤S303,根据分词、词性标注和实体识别结果,分析得到筛选后的医学关键词汇和信息;
步骤S50,将文本信息转化成能够被计算机识别处理的数值向量;
步骤S60,对各病历文本之间添加相似性关系标签;
步骤S70,结合相似性学习方法、距离度量学习方法,对病历文本的标注进行学习;
步骤S80,根据标注和训练结果对新到的病历样本在病历数据集中筛选出具有相似性的病历。
2.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,
还包括步骤S20,根据真实病历文本所属的病历类型分类存储,形成病历数据集,并且,对每个病历,针对病历中记载的医疗活动过程的不同将每个病历文本划分成多个段落。
3.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,
在步骤S60中,将在病历的诊断部分中医生的结论进行特征提取,并参考这些特征评判病历之间的相似程度,从而对各病历文本添加相似性标签。
4.根据权利要求3所述的中文电子病历文本分析方法,其特征在于,采用机器学习方法对病历文本进行分类、聚类分析,验证所提取特征是否适于判断病历相似性。
5.根据权利要求3所述的中文电子病历文本分析方法,其特征在于,还将步骤S60中提取的医生的结论和步骤S30筛选的医学关键词汇和信息应用于生成仿真病历文本。
6.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,在步骤S60中,还对数值化的高维向量做维数压缩,将高维向量用降维算法压缩维数,降低稀疏性。
7.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,在步骤S70中,以步骤S60中进行了相似性标注的病历文本数据作为训练数据,针对不同的相似性标准,并根据病历文本之间标注的相似性关系,利用半监督或弱监督的度量学习算法进行训练;
在步骤S80中,根据不同的相似性标准,筛选出对应该相似性标准的相似病历。
8.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,数值信息的含义类别包括时间信息、用药剂量信息、化验检验结果记录信息。
9.根据权利要求1所述的中文电子病历文本分析方法,其特征在于,步骤S303中,筛选后的医学关键词汇和信息按照其发生的时间顺序进行存储。
10.一种中文电子病历文本分析***,其特征在于,包括:
病历文本输入模块,获取真实病历文本,并经过输入、存储和格式变换操作得到待处理的病历数据集;
关键信息筛选模块,对病历数据集进行医学语言处理,筛选医学关键词汇和信息,并将其转化成计算机可处理的数字量形式;
特征提取模块,对在病历的诊断部分中医生的结论进行特征提取;
病历文本仿真模块,将提取的医生的结论和筛选出的医学关键词汇信息应用于训练生成仿真病历文本及其段落;
相似性标注模块,根据相似性标准对病历数据集进行相似性标注;
相似性训练模块,训练模块根据相似性标注模块的相似性标注结果,采用半监督或弱监督的算法进行训练;
相似结果输出模块,根据相似性标准和训练结果,对新到病历在原始病历数据库中的相似病历簇依据相似性程度高低进行排序输出。
CN201810635258.7A 2018-06-20 2018-06-20 一种中文电子病历文本分析方法与*** Active CN108831559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810635258.7A CN108831559B (zh) 2018-06-20 2018-06-20 一种中文电子病历文本分析方法与***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810635258.7A CN108831559B (zh) 2018-06-20 2018-06-20 一种中文电子病历文本分析方法与***

Publications (2)

Publication Number Publication Date
CN108831559A true CN108831559A (zh) 2018-11-16
CN108831559B CN108831559B (zh) 2021-01-15

Family

ID=64142638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810635258.7A Active CN108831559B (zh) 2018-06-20 2018-06-20 一种中文电子病历文本分析方法与***

Country Status (1)

Country Link
CN (1) CN108831559B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584983A (zh) * 2018-12-07 2019-04-05 广东省人民医院(广东省医学科学院) 一种应用于医学的数据处理方法
CN109635112A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 异常透析数据筛选方法、装置、设备及存储介质
CN109830302A (zh) * 2019-01-28 2019-05-31 北京交通大学 用药模式挖掘方法、装置和电子设备
CN109935337A (zh) * 2019-02-25 2019-06-25 长沙学院 一种基于相似性度量的病案查找方法及***
CN110059185A (zh) * 2019-04-03 2019-07-26 天津科技大学 一种医学文档专业词汇自动化标注方法
CN110176311A (zh) * 2019-05-17 2019-08-27 北京印刷学院 一种基于对抗神经网络的自动医疗方案推荐方法和***
CN110335653A (zh) * 2019-06-30 2019-10-15 浙江大学 基于openEHR病历格式的非标准病历解析方法
CN110399544A (zh) * 2019-06-27 2019-11-01 迪安诊断技术集团股份有限公司 电子病历数字对象分类器生成方法以及最终分类器***
CN110428907A (zh) * 2019-07-31 2019-11-08 济南大学 一种基于非结构化电子病历的文本挖掘方法及***
CN110442683A (zh) * 2019-08-13 2019-11-12 北京明略软件***有限公司 文本信息的处理方法及装置、存储介质、电子装置
CN110457483A (zh) * 2019-06-21 2019-11-15 浙江大学 一种基于神经主题模型的长文本生成方法
CN110491519A (zh) * 2019-07-17 2019-11-22 上海明品医学数据科技有限公司 一种医学数据的检验方法
CN110675931A (zh) * 2019-08-28 2020-01-10 吉林金域医学检验所有限公司 检测报告的信息编码方法、装置、设备及存储介质
CN110781298A (zh) * 2019-09-18 2020-02-11 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN111180068A (zh) * 2019-12-19 2020-05-19 浙江大学 一种基于多任务学习模型的慢病预测***
CN111199050A (zh) * 2018-11-19 2020-05-26 零氪医疗智能科技(广州)有限公司 一种用于对病历进行自动脱敏的***及应用
CN111199801A (zh) * 2018-11-19 2020-05-26 零氪医疗智能科技(广州)有限公司 一种用于识别病历的疾病类型的模型的构建方法及应用
CN111581976A (zh) * 2020-03-27 2020-08-25 平安医疗健康管理股份有限公司 医学术语的标准化方法、装置、计算机设备及存储介质
CN111881979A (zh) * 2020-07-28 2020-11-03 复旦大学 多模态数据标注装置及包含程序的计算机可读存储介质
CN112069783A (zh) * 2020-09-10 2020-12-11 卫宁健康科技集团股份有限公司 一种病历输入法及其输入***
CN112133390A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知***
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN112597283A (zh) * 2021-03-04 2021-04-02 北京数业专攻科技有限公司 通知文本信息实体属性抽取方法、计算机设备及存储介质
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质
CN112802584A (zh) * 2021-01-26 2021-05-14 武汉大学 一种基于分类器的医疗超声检查数据分类方法及装置
CN113032469A (zh) * 2019-12-24 2021-06-25 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
CN113420116A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 医疗文档的分析方法、装置、设备及介质
CN113705226A (zh) * 2021-10-29 2021-11-26 上海柯林布瑞信息技术有限公司 医学文本实体标注方法和装置
CN114300083A (zh) * 2021-11-16 2022-04-08 北京左医科技有限公司 病历构建方法及***
CN115691742A (zh) * 2023-01-03 2023-02-03 江西曼荼罗软件有限公司 一种电子病历质控方法、***、存储介质及设备
CN116469503A (zh) * 2023-04-06 2023-07-21 海军军医大学第三附属医院东方肝胆外科医院 一种基于大数据的健康数据处理方法及服务器
CN117789907A (zh) * 2024-02-28 2024-03-29 山东金卫软件技术有限公司 基于多源数据融合的智慧医疗数据智能管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095913A (zh) * 2016-06-08 2016-11-09 广州同构医疗科技有限公司 一种电子病历文本结构化方法
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及***
CN107341264A (zh) * 2017-07-19 2017-11-10 东北大学 一种支持自定义实体的电子病历检索***及方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095913A (zh) * 2016-06-08 2016-11-09 广州同构医疗科技有限公司 一种电子病历文本结构化方法
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及***
CN107341264A (zh) * 2017-07-19 2017-11-10 东北大学 一种支持自定义实体的电子病历检索***及方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙健 等: "中文电子病历文本中的时间识别算法研究", 《山西大学学报(自然科学版)》 *
张雪松: "文本聚类及其在电子病历分析中的应用研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
李季 等: "基于电子病历数据挖掘的疾病危重度动态预测研究", 《信息资源管理学报》 *

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111199050B (zh) * 2018-11-19 2023-10-17 零氪医疗智能科技(广州)有限公司 一种用于对病历进行自动脱敏的***及应用
CN111199801A (zh) * 2018-11-19 2020-05-26 零氪医疗智能科技(广州)有限公司 一种用于识别病历的疾病类型的模型的构建方法及应用
CN111199050A (zh) * 2018-11-19 2020-05-26 零氪医疗智能科技(广州)有限公司 一种用于对病历进行自动脱敏的***及应用
CN111199801B (zh) * 2018-11-19 2023-08-08 零氪医疗智能科技(广州)有限公司 一种用于识别病历的疾病类型的模型的构建方法及应用
CN109584983A (zh) * 2018-12-07 2019-04-05 广东省人民医院(广东省医学科学院) 一种应用于医学的数据处理方法
CN109635112A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 异常透析数据筛选方法、装置、设备及存储介质
CN109830302A (zh) * 2019-01-28 2019-05-31 北京交通大学 用药模式挖掘方法、装置和电子设备
CN109935337A (zh) * 2019-02-25 2019-06-25 长沙学院 一种基于相似性度量的病案查找方法及***
CN109935337B (zh) * 2019-02-25 2021-01-15 长沙学院 一种基于相似性度量的病案查找方法及***
CN110059185A (zh) * 2019-04-03 2019-07-26 天津科技大学 一种医学文档专业词汇自动化标注方法
CN110059185B (zh) * 2019-04-03 2022-10-04 天津科技大学 一种医学文档专业词汇自动化标注方法
CN110176311A (zh) * 2019-05-17 2019-08-27 北京印刷学院 一种基于对抗神经网络的自动医疗方案推荐方法和***
CN110457483A (zh) * 2019-06-21 2019-11-15 浙江大学 一种基于神经主题模型的长文本生成方法
CN110399544A (zh) * 2019-06-27 2019-11-01 迪安诊断技术集团股份有限公司 电子病历数字对象分类器生成方法以及最终分类器***
CN110335653A (zh) * 2019-06-30 2019-10-15 浙江大学 基于openEHR病历格式的非标准病历解析方法
CN110491519A (zh) * 2019-07-17 2019-11-22 上海明品医学数据科技有限公司 一种医学数据的检验方法
CN110491519B (zh) * 2019-07-17 2024-01-02 上海明品医学数据科技有限公司 一种医学数据的检验方法
CN110428907A (zh) * 2019-07-31 2019-11-08 济南大学 一种基于非结构化电子病历的文本挖掘方法及***
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN112347776B (zh) * 2019-08-09 2024-05-24 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN110442683A (zh) * 2019-08-13 2019-11-12 北京明略软件***有限公司 文本信息的处理方法及装置、存储介质、电子装置
CN110675931A (zh) * 2019-08-28 2020-01-10 吉林金域医学检验所有限公司 检测报告的信息编码方法、装置、设备及存储介质
CN110781298A (zh) * 2019-09-18 2020-02-11 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN110781298B (zh) * 2019-09-18 2023-06-20 平安科技(深圳)有限公司 药品分类方法、装置、计算机设备及存储介质
CN111180068A (zh) * 2019-12-19 2020-05-19 浙江大学 一种基于多任务学习模型的慢病预测***
CN113032469B (zh) * 2019-12-24 2024-02-20 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
CN113032469A (zh) * 2019-12-24 2021-06-25 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
CN111581976B (zh) * 2020-03-27 2023-07-21 深圳平安医疗健康科技服务有限公司 医学术语的标准化方法、装置、计算机设备及存储介质
CN111581976A (zh) * 2020-03-27 2020-08-25 平安医疗健康管理股份有限公司 医学术语的标准化方法、装置、计算机设备及存储介质
CN111881979A (zh) * 2020-07-28 2020-11-03 复旦大学 多模态数据标注装置及包含程序的计算机可读存储介质
CN112069783A (zh) * 2020-09-10 2020-12-11 卫宁健康科技集团股份有限公司 一种病历输入法及其输入***
CN112133390B (zh) * 2020-09-17 2024-03-22 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知***
CN112133390A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知***
CN112699669B (zh) * 2020-12-29 2022-11-11 医渡云(北京)技术有限公司 流行病学调查报告的自然语言处理方法、装置及存储介质
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质
CN112802584A (zh) * 2021-01-26 2021-05-14 武汉大学 一种基于分类器的医疗超声检查数据分类方法及装置
CN112597283A (zh) * 2021-03-04 2021-04-02 北京数业专攻科技有限公司 通知文本信息实体属性抽取方法、计算机设备及存储介质
CN113420116A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 医疗文档的分析方法、装置、设备及介质
CN113705226A (zh) * 2021-10-29 2021-11-26 上海柯林布瑞信息技术有限公司 医学文本实体标注方法和装置
CN114300083B (zh) * 2021-11-16 2022-10-18 北京左医科技有限公司 病历构建方法及***
CN114300083A (zh) * 2021-11-16 2022-04-08 北京左医科技有限公司 病历构建方法及***
CN115691742B (zh) * 2023-01-03 2023-04-07 江西曼荼罗软件有限公司 一种电子病历质控方法、***、存储介质及设备
CN115691742A (zh) * 2023-01-03 2023-02-03 江西曼荼罗软件有限公司 一种电子病历质控方法、***、存储介质及设备
CN116469503A (zh) * 2023-04-06 2023-07-21 海军军医大学第三附属医院东方肝胆外科医院 一种基于大数据的健康数据处理方法及服务器
CN117789907A (zh) * 2024-02-28 2024-03-29 山东金卫软件技术有限公司 基于多源数据融合的智慧医疗数据智能管理方法
CN117789907B (zh) * 2024-02-28 2024-05-10 山东金卫软件技术有限公司 基于多源数据融合的智慧医疗数据智能管理方法

Also Published As

Publication number Publication date
CN108831559B (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN108831559A (zh) 一种中文电子病历文本分析方法与***
Pereira et al. COVID-19 identification in chest X-ray images on flat and hierarchical classification scenarios
Xiao et al. Opportunities and challenges in developing deep learning models using electronic health records data: a systematic review
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
US10929420B2 (en) Structured report data from a medical text report
CN111540468B (zh) 一种诊断原因可视化的icd自动编码方法与***
CN110705293A (zh) 基于预训练语言模型的电子病历文本命名实体识别方法
Liu et al. Medical-vlbert: Medical visual language bert for covid-19 ct report generation with alternate learning
CN109710670B (zh) 一种将病历文本从自然语言转换为结构化元数据的方法
CN108091397B (zh) 一种缺血性心脏病患者的出血事件预测方法
CN117744654A (zh) 基于机器学习的自然语言情境中数值数据的语义分类方法以及***
Carchiolo et al. Medical prescription classification: a NLP-based approach
CN112241457A (zh) 一种融合扩展特征的事理知识图谱事件检测方法
Kaswan et al. AI-based natural language processing for the generation of meaningful information electronic health record (EHR) data
CN115050442A (zh) 基于挖掘聚类算法的病种数据上报方法、装置及存储介质
Bayrak et al. Epilepsy Radiology Reports Classification Using Deep Learning Networks.
CN114191665A (zh) 机械通气过程中人机异步现象的分类方法和分类装置
Kulkarni Machine Learning Algorithms for Problem Solving in Computational Applications: Intelligent Techniques: Intelligent Techniques
Chen et al. Automatically structuring on Chinese ultrasound report of cerebrovascular diseases via natural language processing
CN116313141A (zh) 一种基于知识图谱的不明原因发热智能问诊方法
CN115083550B (zh) 基于多源信息的病人相似度分类方法
Ting et al. Data mining in biomedicine: Current applications and further directions for research
CN115862897A (zh) 一种基于临床数据的症候群监测方法及***
CN112614562B (zh) 基于电子病历的模型训练方法、装置、设备及存储介质
Kongburan et al. Enhancing predictive power of cluster-boosted regression with text-based indexing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant