CN112732900A - 一种电子病历文本摘要抽取方法 - Google Patents

一种电子病历文本摘要抽取方法 Download PDF

Info

Publication number
CN112732900A
CN112732900A CN202110010116.3A CN202110010116A CN112732900A CN 112732900 A CN112732900 A CN 112732900A CN 202110010116 A CN202110010116 A CN 202110010116A CN 112732900 A CN112732900 A CN 112732900A
Authority
CN
China
Prior art keywords
sentence
medical record
electronic medical
abstract
bert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110010116.3A
Other languages
English (en)
Other versions
CN112732900B (zh
Inventor
张述睿
吴军
樊昭磊
桑波
李福友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongyang Health Technology Group Co ltd
Original Assignee
Shandong Msunhealth Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Msunhealth Technology Group Co Ltd filed Critical Shandong Msunhealth Technology Group Co Ltd
Priority to CN202110010116.3A priority Critical patent/CN112732900B/zh
Publication of CN112732900A publication Critical patent/CN112732900A/zh
Application granted granted Critical
Publication of CN112732900B publication Critical patent/CN112732900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种电子病历文本摘要抽取方法,通过定义语义覆盖度损失函数,可以将以往医师总结出的抽象式摘要用作训练自动抽取式摘要模型,避免了数据标注。从原始电子病历文本中筛选出比较重要的句子作为候选集,缩小自动抽取式摘要的搜寻范围,再通过罗列候选集中句子的不同组合方式,找出对原始电子病历中语义覆盖度最高的句子组合作为抽取式摘要,在判定语义覆盖度时,结合候选集中所有句子的语义信息做出判断,降低了自动抽取式摘要中信息冗余和信息缺失的可能,提升了自动抽取式摘要的质量。

Description

一种电子病历文本摘要抽取方法
技术领域
本发明涉及医疗信息化技术领域,具体涉及一种电子病历文本摘要抽取方法。
背景技术
电子病历是病人在医院诊疗全过程的原始记录,也是为医师提供临床决策支持的重要***。虽然电子病历取代纸质病历,方便了相关数据的存储和查找,但是电子病历很多重要的信息仍然深深埋藏在大量的文本内容当中。医师在临床工作中如果需要全面阅读一个病人的电子病历,往往需要花费很长时间。所以,对电子病历进行摘要提取,对增加医师在临床中的工作效率有重要意义,尤其是在出院病历的录入当中,医师需要阅读病人该次入院以来所有的电子病历记录,然后总结病人该次入院的状况和治疗情况,并录入到出院病历当中,整个过程会花费医师很大的时间和精力,尤其是在出院病人众多的情况下,并且在电子病历的阅读和总结的过程中容易遗漏电子病历中的重要信息。
目前机器摘要抽取主要分为两种技术,分为自动抽象式摘要和自动抽取式摘要,抽象式摘要指的是对原文内容进行抽象总结,形成更简短的文本。但是自动抽象式摘要任务面临着很大的挑战,目前的技术瓶颈主要是生成的抽象式摘要与原文事实冲突和摘要生成的篇幅不可控,即使最领先的科研成果也无法避免该问题。医疗工作的容错率是很低的,自动抽象式摘要可能造成的与原文事实冲突,可能造成医疗后果,是无法接受的。所以使用自动抽取式摘要技术对电子病历的文本进行摘要生成是当前最稳妥的方法。
但是目前一般的抽取式摘要技术面临以下问题:1)目前常用的抽取式摘要技术一般以文本中的句子为抽取单位,依赖于文本相似度的判断,从而获取文本中比较重要的句子,即从原文的所有句子中抽取一个子集,但抽取的摘要中句子与句子之间语义上的联系较弱,所以抽取出的句子组合对原始文本的覆盖度不一定是最高的,仍然会产生信息冗余或关键信息缺失的情况。2)一般的无监督摘要抽取模型性能往往不理想,如果想获取高性能抽取式模型则需要数据标记,数据标记的目的是从原始电子病历中标记出重要的句子,医疗文本的数据标记是一项专业性强、成本高、费时、而且质量难以管理的工作。
发明内容
本发明为了克服以上技术的不足,提供了一种不需要数据标注、自监督、且可以从电子病历中抽取出高覆盖度摘要,且提升医师的工作效率,并可以控制抽取内容的多少的方法。
本发明克服其技术问题所采用的技术方案是:
一种电子病历文本摘要抽取方法,包括如下步骤:
a)获取整篇电子病历的文本内容,使用D表示一篇电子病历中除出院病历以外的文本内容,D∈{di=1,di=2,...,di=|D|},di为D中的一句话,|D|为D的总句数,使用S表示一篇电子病历出院病历,S∈{sj=1,sj=2,...,sj=|S|},sj为S中的一句话,|S|为S的总句数;
b)使用医学教科书语料训练BERT语言模型,训练完成后通过公式
Figure BDA0002881474200000021
使用该模型获取电子病历文本中di的向量表达
Figure BDA0002881474200000022
式中BERT(di)[CLS]为使用BERT模型对di进行建模并获取向量表达,得到向量化表达矩阵
Figure BDA0002881474200000023
c)通过公式
Figure BDA0002881474200000024
计算D中句子的相似度邻接矩阵A,h为BERT模型的维度,l为h所在的维度的索引,softmax(·)为softmax函数,T为向量或矩阵转置,初始化一个句子权重向量Q,其维度为
Figure BDA0002881474200000025
句子权重向量Q中的所有初始值均为
Figure BDA0002881474200000026
计算得到D中每个句子的得分
Figure BDA0002881474200000027
d)对得分
Figure BDA0002881474200000028
内的值按照从大到小进行排序,排序后取前|C|个最大的值对应的句子索引作为抽取式摘要的候选集并从向量化表达矩阵
Figure BDA0002881474200000029
取出这些句子索引所对应的向量,其中在模型训练阶段|C|=|S|×2,0<|C|<|D|,|C|为正整数,C为候选集,C={ci=1,ci=2,...,ci=|C|},ci为候选集中的一个句子的向量表达;
e)枚举所有从候选集C中取出|S|个向量的所有组合,通过公式
Figure BDA0002881474200000031
计算所有组合的数量|G|,!为阶乘计算,G={gn=1,gn=2,...,gn=|G|},gn为一种句向量的组合;
f)对BERT语言模型进行训练,定义损失函数为L,使用梯度下降法将L最小化,直至其收敛,得到BERT模型的参数,获取可以自动抽取式摘要的模型参数;
g)使用公式
Figure BDA0002881474200000032
计算得到最佳的句子组合
Figure BDA0002881474200000033
式中gn为最大的句子组合。
进一步的,步骤b)中BERT建模的步骤为:
b-1)将文本di按照字典中的索引将di中的每个文字转换成字典中的一个索引数字,完成di的索引化;
b-2)将BERT语言模型中的[CLS]和[SEP]添加到索引化的di中,将添加后的索引化的di输入到BERT模型中;
b-3)通过公式
Figure BDA0002881474200000034
得到电子病历文本中di的向量表达,该向量表达的维度为
Figure BDA0002881474200000035
Figure BDA0002881474200000036
为实数空间。
进一步的,步骤c)中计算D中每个句子的得分
Figure BDA0002881474200000037
的步骤为:
c-1)通过公式
Figure BDA0002881474200000038
计算得到D中每个句子的得分
Figure BDA0002881474200000039
c-2)用
Figure BDA00028814742000000310
的值替换Q中的值后重复步骤c-1)直到
Figure BDA00028814742000000311
与Q相等。
进一步的,步骤f)中,通过公式
Figure BDA00028814742000000312
计算损失函数为L,式中max函数表示求最大元素,
Figure BDA00028814742000000313
为S的向量表达,
Figure BDA00028814742000000314
Figure BDA00028814742000000315
的维度为
Figure BDA0002881474200000041
进一步的,λ=0.05。
本发明的有益效果是:通过定义语义覆盖度损失函数,可以将以往医师总结出的抽象式摘要用作训练自动抽取式摘要模型,避免了数据标注。从原始电子病历文本中筛选出比较重要的句子作为候选集,缩小自动抽取式摘要的搜寻范围,再通过罗列候选集中句子的不同组合方式,找出对原始电子病历中语义覆盖度最高的句子组合作为抽取式摘要,在判定语义覆盖度时,结合候选集中所有句子的语义信息做出判断,降低了自动抽取式摘要中信息冗余和信息缺失的可能,提升了自动抽取式摘要的质量。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一篇电子病历主要包含入院病历、病程记录、检查检验结果、手术记录和出院病历等。本方法中提出的模型是在从入院病历、病程记录、检查检验结果、手术记录等部分中抽取出最主要内容,过滤掉冗余信息,形成抽取式摘要,从而帮助医师高效率而又精确地完成出院病历的书写。为了训练模型,需要从以往的电子病历库中提取完整的电子病历作为训练语料。具体建模步骤为:
(1)获取整篇电子病历的文本内容,使用D表示一篇电子病历中除出院病历以外的文本内容,D∈{di=1,di=2,...,di=|D|},di为D中的一句话,|D|为D的总句数,使用S表示一篇电子病历出院病历,出院病历可看作是医师对病人该次住院疾病和治疗情况的抽象式总结,即抽象式摘要,因为出院病历的内容可能使用不同的表达方式来描述前面病历中的内容,S∈{sj=1,sj=2,...,sj=|S|},sj为S中的一句话,|S|为S的总句数。本方法使用出院病历中的抽象式摘要来训练抽取式摘要模型。
(2)使用医学教科书语料训练BERT语言模型,之后可以使用该模型获取电子病历文本的向量表达,训练完成后通过公式
Figure BDA0002881474200000042
使用该模型获取电子病历文本中di的向量表达
Figure BDA0002881474200000051
式中BERT(di)[CLS]为使用BERT模型对di进行建模并获取向量表达,得到向量化表达矩阵
Figure BDA0002881474200000052
(3)通过公式
Figure BDA0002881474200000053
计算D中句子的相似度邻接矩阵A,h为BERT模型的维度,l为h所在的维度的索引,softmax(·)为softmax函数,T为向量或矩阵转置,初始化一个句子权重向量Q,其维度为
Figure BDA0002881474200000054
句子权重向量Q中的所有初始值均为
Figure BDA0002881474200000055
计算得到D中每个句子的得分
Figure BDA0002881474200000056
(4)对得分
Figure BDA0002881474200000057
内的值按照从大到小进行排序,排序后取前|C|个最大的值对应的句子索引作为抽取式摘要的候选集并从向量化表达矩阵
Figure BDA0002881474200000058
取出这些句子索引所对应的向量,其中在模型训练阶段|C|=|S|×2,也就是说取相当于出院病历句数两倍的句数作为候选集,在使用模型进行摘要抽取时,医师可以根据实际需求认为指定|C|的值,人为指定|C|的取值范围为:0<|C|<|D|,|C|为正整数,C为候选集,C={ci=1,ci=2,...,ci=|C|},ci为候选集中的一个句子的向量表达。
(5)枚举所有从候选集C中取出|S|个向量的所有组合,通过公式
Figure BDA0002881474200000059
计算所有组合的数量|G|,!为阶乘计算,G={gn=1,gn=2,...,gn=|G|},gn为一种句向量的组合。
(6)对BERT语言模型进行训练,定义损失函数为L,使用梯度下降法将L最小化,直至其收敛,得到BERT模型的参数,获取可以自动抽取式摘要的模型参数。本步骤中损失函数的意义为,使用BERT模型提取原始文本和摘要候选集的隐含语义,以余弦相似度作为语义覆盖度的度量标准,以出院病历的抽象式摘要为金标准,从候选集G中选出对金标准语义覆盖度最高句子组合,本损失函数也可称之为“语义覆盖度损失”。使用梯度下降法将L最小化,直至其收敛,可以得到BERT模型的参数,从而获取可以自动抽取式摘要的模型参数。
(7)使用公式
Figure BDA0002881474200000061
计算得到最佳的句子组合
Figure BDA0002881474200000062
式中gn为最大的句子组合。使用BERT模型提取原始文本和摘要候选集的隐含语义,以余弦相似度作为语义覆盖度的度量标准,从候选集G中选出对原始电子病历文本语义覆盖度最高句子组合作为最终的抽取式摘要。针对高性能抽取式摘要模型需要数据标记的问题,使用以往电子病历中的出院病历部分作为金标准,虽然该金标准相当于抽象式摘要,但是通过定义语义覆盖度损失函数,可以将以往医师总结出的抽象式摘要用作训练自动抽取式摘要模型,避免了数据标注。
针对一般的抽取式摘要技术抽取的摘要中句子与句子之间语义上的联系较弱的问题,提出先从原始电子病历文本中筛选出比较重要的句子作为候选集,缩小自动抽取式摘要的搜寻范围,再通过罗列候选集中句子的不同组合方式,找出对原始电子病历中语义覆盖度最高的句子组合作为抽取式摘要,在判定语义覆盖度时,结合候选集中所有句子的语义信息做出判断,降低了自动抽取式摘要中信息冗余和信息缺失的可能,提升了自动抽取式摘要的质量。
下面通过一个摘要抽取实例对本发明进行进一步说明:
(1)电子病历原文(约5000字):
主诉:发现***口狭小10天。患者10天前因阴***部不适,检查发现***口狭小,不能上翻***显露阴***。在我院诊断为***,建议手术治疗。现来我院,为进一步治疗……。
(2)抽取式摘要,|S|=5,218字:
1)患者发现***口狭小10天入院。
2)查体:***大小正常,***过长,***口狭小,直径不足0.1cm,***不能上翻显露***,睾丸无明显异常.
3)完善相关检查,积极术前准备,于20XX-XX-XX日在静脉麻醉下行***环切术,术中证实为***明确,环切***后间断缝合,无菌敷料包扎固定,手术顺利。
4)出院诊断:***.
5)者无发热,无腰腹部疼痛,大小便正常,食欲及入眠可。查体:神志清,精神可。心肺腹无异常。***部切口敷料清洁,切口无红肿及渗出液,已换药。
进一步的,步骤(2)中BERT建模的步骤为:
(2-1)将文本di按照字典中的索引将di中的每个文字转换成字典中的一个索引数字,完成di的索引化。
(2-2)将BERT语言模型中的[CLS]和[SEP]添加到索引化的di中,将添加后的索引化的di输入到BERT模型中,所需形式为:[CLS]+索引化的di+[SEP],并输入到BERT模型内。
(2-3)BERT模型会在[CLS]这个特殊索引的位置输出一个向量,用来表示输入到BERT模型整段文本的隐含语义向量,通过公式
Figure BDA0002881474200000071
得到电子病历文本中di的向量表达,该向量表达的维度为
Figure BDA0002881474200000072
Figure BDA0002881474200000073
为实数空间。
进一步的,步骤(3)中计算D中每个句子的得分
Figure BDA0002881474200000074
的步骤为:
(3-1)通过公式
Figure BDA0002881474200000075
计算得到D中每个句子的得分
Figure BDA0002881474200000076
(3-2)用
Figure BDA0002881474200000077
的值替换Q中的值后重复步骤c-1)直到
Figure BDA0002881474200000078
与Q相等,也就是说
Figure BDA0002881474200000079
的值收敛了。
进一步的,步骤(6)中,通过公式
Figure BDA00028814742000000710
计算损失函数为L,式中max函数表示求最大元素,
Figure BDA00028814742000000711
为S的向量表达,
Figure BDA00028814742000000712
Figure BDA00028814742000000713
的维度为
Figure BDA00028814742000000714
BERT(gn)[CLS]为gn的向量表达,λ为超参数,λ=0.05。实施该步骤时,优化器选用Adam,学习率被设置为5e-5,通过40小时训练损失函数收敛并得到BERT模型的参数,获取到自动抽取式摘要的BERT模型参数。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种电子病历文本摘要抽取方法,其特征在于,包括如下步骤:
a)获取整篇电子病历的文本内容,使用D表示一篇电子病历中除出院病历以外的文本内容,D∈{di=1,di=2,...,di=|D|},di为D中的一句话,|D|为D的总句数,使用S表示一篇电子病历出院病历,S∈{sj=1,sj=2,...,sj=|S|},sj为S中的一句话,|S|为S的总句数;
b)使用医学教科书语料训练BERT语言模型,训练完成后通过公式
Figure FDA0002881474190000011
使用该模型获取电子病历文本中di的向量表达
Figure FDA0002881474190000012
式中BERT(di)[CLS]为使用BERT模型对di进行建模并获取向量表达,得到向量化表达矩阵
Figure FDA0002881474190000013
c)通过公式
Figure FDA0002881474190000014
计算D中句子的相似度邻接矩阵A,h为BERT模型的维度,l为h所在的维度的索引,softmax(·)为softmax函数,T为向量或矩阵转置,初始化一个句子权重向量Q,其维度为
Figure FDA0002881474190000015
句子权重向量Q中的所有初始值均为
Figure FDA0002881474190000016
计算得到D中每个句子的得分
Figure FDA0002881474190000017
d)对得分
Figure FDA0002881474190000018
内的值按照从大到小进行排序,排序后取前|C|个最大的值对应的句子索引作为抽取式摘要的候选集并从向量化表达矩阵D取出这些句子索引所对应的向量,其中在模型训练阶段|C|=|S|×2,0<|C|<|D|,|C|为正整数,C为候选集,C={ci=1,ci=2,...,ci=|C|},ci为候选集中的一个句子的向量表达;
e)枚举所有从候选集C中取出|S|个向量的所有组合,通过公式
Figure FDA0002881474190000019
计算所有组合的数量|G|,!为阶乘计算,G={gn=1,gn=2,...,gn=|G|},gn为一种句向量的组合;
f)对BERT语言模型进行训练,定义损失函数为L,使用梯度下降法将L最小化,直至其收敛,得到BERT模型的参数,获取可以自动抽取式摘要的模型参数;
g)使用公式
Figure FDA0002881474190000021
计算得到最佳的句子组合
Figure FDA0002881474190000022
式中gn为最大的句子组合。
2.根据权利要求1所述的电子病历文本摘要抽取方法,其特征在于,步骤b)中BERT建模的步骤为:
b-1)将文本di按照字典中的索引将di中的每个文字转换成字典中的一个索引数字,完成di的索引化;
b-2)将BERT语言模型中的[CLS]和[SEP]添加到索引化的di中,将添加后的索引化的di输入到BERT模型中;
b-3)通过公式
Figure FDA0002881474190000023
得到电子病历文本中di的向量表达,该向量表达的维度为
Figure FDA0002881474190000024
Figure FDA0002881474190000025
为实数空间。
3.根据权利要求1所述的电子病历文本摘要抽取方法,其特征在于,步骤c)中计算D中每个句子的得分
Figure FDA0002881474190000026
的步骤为:
c-1)通过公式
Figure FDA0002881474190000027
计算得到D中每个句子的得分
Figure FDA0002881474190000028
c-2)用
Figure FDA0002881474190000029
的值替换Q中的值后重复步骤c-1)直到
Figure FDA00028814741900000210
与Q相等。
4.根据权利要求1所述的电子病历文本摘要抽取方法,其特征在于:步骤f)中,通过公式
Figure FDA00028814741900000211
计算损失函数为L,式中max函数表示求最大元素,
Figure FDA00028814741900000212
为S的向量表达,
Figure FDA00028814741900000213
Figure FDA00028814741900000214
的维度为
Figure FDA00028814741900000215
BERT(gn)[CLS]为gn的向量表达,λ为超参数。
5.根据权利要求4所述的电子病历文本摘要抽取方法,其特征在于:λ=0.05。
CN202110010116.3A 2021-01-04 2021-01-04 一种电子病历文本摘要抽取方法 Active CN112732900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110010116.3A CN112732900B (zh) 2021-01-04 2021-01-04 一种电子病历文本摘要抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110010116.3A CN112732900B (zh) 2021-01-04 2021-01-04 一种电子病历文本摘要抽取方法

Publications (2)

Publication Number Publication Date
CN112732900A true CN112732900A (zh) 2021-04-30
CN112732900B CN112732900B (zh) 2022-07-29

Family

ID=75589848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110010116.3A Active CN112732900B (zh) 2021-01-04 2021-01-04 一种电子病历文本摘要抽取方法

Country Status (1)

Country Link
CN (1) CN112732900B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297380A (zh) * 2021-05-27 2021-08-24 长春工业大学 基于自注意力机制和卷积神经网络的文本分类算法
CN117932049A (zh) * 2024-03-20 2024-04-26 智慧眼科技股份有限公司 病历摘要生成方法、装置、计算机设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019133563A (ja) * 2018-02-02 2019-08-08 株式会社日立製作所 情報処理装置および情報処理システム
CN111027595A (zh) * 2019-11-19 2020-04-17 电子科技大学 双阶段语义词向量生成方法
CN111428024A (zh) * 2020-03-18 2020-07-17 北京明略软件***有限公司 实现文本摘要抽取的方法、装置、计算机存储介质及终端
US20200302023A1 (en) * 2019-03-22 2020-09-24 Fortia Financial Solutions Generation of natural language text from structured data using a fusion model
CN111859932A (zh) * 2020-07-29 2020-10-30 上海风秩科技有限公司 一种文本摘要的生成方法、装置、电子设备及存储介质
CN111858912A (zh) * 2020-07-03 2020-10-30 黑龙江阳光惠远知识产权运营有限公司 一种基于单篇长文本的摘要生成方法
CN112100365A (zh) * 2020-08-31 2020-12-18 电子科技大学 双阶段文本摘要方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019133563A (ja) * 2018-02-02 2019-08-08 株式会社日立製作所 情報処理装置および情報処理システム
US20200302023A1 (en) * 2019-03-22 2020-09-24 Fortia Financial Solutions Generation of natural language text from structured data using a fusion model
CN111027595A (zh) * 2019-11-19 2020-04-17 电子科技大学 双阶段语义词向量生成方法
CN111428024A (zh) * 2020-03-18 2020-07-17 北京明略软件***有限公司 实现文本摘要抽取的方法、装置、计算机存储介质及终端
CN111858912A (zh) * 2020-07-03 2020-10-30 黑龙江阳光惠远知识产权运营有限公司 一种基于单篇长文本的摘要生成方法
CN111859932A (zh) * 2020-07-29 2020-10-30 上海风秩科技有限公司 一种文本摘要的生成方法、装置、电子设备及存储介质
CN112100365A (zh) * 2020-08-31 2020-12-18 电子科技大学 双阶段文本摘要方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程艳芳: ""基于优化选择的抽取式自动文本摘要研究"", 《中国知网》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297380A (zh) * 2021-05-27 2021-08-24 长春工业大学 基于自注意力机制和卷积神经网络的文本分类算法
CN117932049A (zh) * 2024-03-20 2024-04-26 智慧眼科技股份有限公司 病历摘要生成方法、装置、计算机设备及介质

Also Published As

Publication number Publication date
CN112732900B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN109299239B (zh) 一种基于es的电子病历检索方法
Pestian et al. A shared task involving multi-label classification of clinical free text
Zeng-Treitler et al. Making texts in electronic health records comprehensible to consumers: a prototype translator
CN112732900B (zh) 一种电子病历文本摘要抽取方法
King et al. Cengage Learning at TREC 2011 Medical Track.
CN109192255A (zh) 病历结构化方法
CN111651991B (zh) 一种利用多模型融合策略的医疗命名实体识别方法
Yao et al. Traditional Chinese medicine clinical records classification using knowledge-powered document embedding
Li et al. MLEC-QA: A Chinese multi-choice biomedical question answering dataset
CN111292814A (zh) 一种医疗数据标准化的方法及装置
Lin et al. A free-text processing system to capture physical findings: Canonical Phrase Identification System (CAPIS).
Chen et al. Semantic analysis of free text and its application on automatically assigning ICD-9-CM codes to patient records
CN111128388A (zh) 一种值域数据匹配方法、装置及相关产品
Liu et al. Neural abstractive summarization for long text and multiple tables
Kang et al. Initial readability assessment of clinical trial eligibility criteria
CN113111660A (zh) 数据处理方法、装置、设备和存储介质
Sager et al. Automatic encoding of clinical narrative
Habert et al. Extending an existing specialized semantic lexicon.
Li et al. Automatic decision support for clinical diagnostic literature using link analysis in a weighted keyword network
Okubo et al. Natural language storage and retrieval of medical diagnostic information: experience at the UCLA Hospital and Clinics over a 10-year period
Landes et al. Hospital Discharge Summarization Data Provenance
CN117493642B (zh) 相似电子病历检索方法、装置、终端及存储介质
Yifan et al. Structured processing method of medical examination text reports based on tree model
Adams Generating Faithful and Complete Hospital-Course Summaries from the Electronic Health Record
Oliver A sublanguage based medical language processing system for German

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 12 / F, building 1, Aosheng building, 1166 Xinluo street, hi tech Zone, Jinan City, Shandong Province

Patentee after: Zhongyang Health Technology Group Co.,Ltd.

Address before: 12 / F, building 1, Aosheng building, 1166 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee before: SHANDONG MSUNHEALTH TECHNOLOGY GROUP Co.,Ltd.