CN112349367A - 一种生成仿真病历的方法、装置、电子设备及存储介质 - Google Patents

一种生成仿真病历的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112349367A
CN112349367A CN202011253477.2A CN202011253477A CN112349367A CN 112349367 A CN112349367 A CN 112349367A CN 202011253477 A CN202011253477 A CN 202011253477A CN 112349367 A CN112349367 A CN 112349367A
Authority
CN
China
Prior art keywords
diagnosis
treatment
target
medical record
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011253477.2A
Other languages
English (en)
Other versions
CN112349367B (zh
Inventor
张盼盼
任彩红
胡可云
陈联忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiahesen Health Technology Co ltd
Original Assignee
Beijing Jiahesen Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiahesen Health Technology Co ltd filed Critical Beijing Jiahesen Health Technology Co ltd
Priority to CN202011253477.2A priority Critical patent/CN112349367B/zh
Publication of CN112349367A publication Critical patent/CN112349367A/zh
Application granted granted Critical
Publication of CN112349367B publication Critical patent/CN112349367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请公开了一种生成仿真病历的方法、装置、电子设备及存储介质。该方法包括:获得参考病历;获得诊疗问题请求,该诊疗问题请求携带有目标科室和目标疾病的标识;获得与该目标科室和该目标疾病对应的目标诊疗问题集合,输出该目标诊疗问题集合,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;将目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案;将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。基于本申请公开的方案,能够快速地生成满足教学需求的仿真病历。

Description

一种生成仿真病历的方法、装置、电子设备及存储介质
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种生成仿真病历的方法、装置、电子设备及存储介质。
背景技术
医学是一门知识性和专业性很强的学科。如何提高教学对象(包括医学生和初级医生)的诊疗水平,是教学任务中的一个重要部分。目前,通常利用病历对教学对象进行教学。例如,针对某个科室下的某个疾病,构建优质的病历,根据该病历中的诊疗问题和对应的答案,对教学对象进行模拟问答,以达到提高教学对象的诊疗水平的目的。
目前,用于教学的病历是由经验丰富的医生基于真实的历史病历来编写,编写出的病历称为仿真病历或者模拟病历。但是,现在的生成仿真病历的方案存在效率低下、耗时较长的缺陷。
发明内容
有鉴于此,本申请的目的在于提供一种生成仿真病历的方法、装置、电子设备及存储介质,以便快速地生成满足教学需求的仿真病历。
为实现上述目的,本申请提供如下技术方案:
本申请提供一种生成仿真病历的方法,包括:
获得参考病历;
获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可选的,在上述方法中,预先构建诊疗问题集合的方案,包括:
获取历史诊疗数据;
对所述历史诊疗数据进行清洗;
对清洗后的历史诊疗数据进行分类,所述历史诊疗数据的类型包括问诊和查体;
对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据;
确定所述标准化历史诊疗数据在所述结构化病历中对应的字段,建立所述标准化历史诊疗数据中的诊疗问题与所述字段的映射关系;
确定所述标准化历史诊疗数据中的诊疗问题对应的科室和疾病;
将所述诊疗问题加入为对应的科室和疾病构建的诊疗问题集合。
可选的,在上述方法中,所述对所述历史诊疗数据进行清洗,包括:
对所述历史诊疗数据进行分词处理,得到第一分词结果;
如果所述第一分词结果中有至少一个分词属于医疗知识库、所述医疗知识库的同义词词典或者预设的高频医疗词汇,则保留所述历史诊疗数据,否则,删除所述历史诊疗数据。
可选的,在上述方法中,所述对清洗后的历史诊疗数据进行分类,包括:
如果所述清洗后的历史诊疗数据包括与症状本体对应的词汇或者问诊关键词,则确定所述清洗后的历史诊疗数据为问诊类型;
如果所述清洗后的历史诊疗数据包括与部位本体对应的词汇,则确定所述清洗后的历史诊疗数据为查体类型。
可选的,在上述方法中,所述对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据,包括:
确定所述清洗后的历史诊疗数据中属于同一类型的历史诊疗数据之间的相似度;
对相似度达到预设的相似度阈值的多条清洗后的历史诊疗数据进行归一处理,生成一条标准化历史诊疗数据。
可选的,在上述方法中,所述确定所述标准化历史诊疗数据在所述结构化病历中对应的字段,包括:
分别确定所述标准化历史诊疗数据与所述结构化病历中各字段之间的关联权重;
将关联权重最高的字段确定为所述标准化历史诊疗数据在所述结构化病历中对应的字段。
可选的,在上述方法中,所述确定所述标准化历史诊疗数据中的诊疗问题对应的科室和疾病,包括:
根据所述标准化历史诊疗数据在所述结构化病历中对应的字段,确定所述标准化历史诊疗数据中的诊疗问题对应的科室;
对所述标准化历史诊疗数据进行分词处理,得到第二分词结果,确定所述第二分词结果与所述科室下各个疾病的医疗关键词之间的相似度,将相似度最高的疾病确定为所述标准化历史诊疗数据中的诊疗问题对应的疾病。
本申请还提供一种生成仿真病历的装置,包括:
参考病历获取单元,用于获得参考病历;
请求获取单元,用于获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
目标诊疗问题集合获取单元,用于在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
目标诊疗问题获取单元,用于将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
诊疗答案获取单元,用于基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
数据处理单元,用于将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
本申请还提供一种电子设备,包括处理器、存储器和通信接口;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如以上任意一种生成仿真病历的方法的各个步骤。
本申请还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如以上任意一种生成仿真病历的方法的各个步骤。由此可见:
本申请公开的生成仿真病历的方法、装置、电子设备及存储介质,预先针对各个科室下的各个疾病构建诊疗问题集合,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;在获得携带有目标科室和目标疾病的标识的诊疗问题请求后,在预先构建的诊疗问题集合中获取与该目标科室和目标疾病对应的目标诊疗问题集合,输出该目标诊疗问题集合,之后将该诊疗问题集合中被选中的诊疗问题作为目标诊疗问题,基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案,将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可以看到,基于本申请公开的方案,用户只需要根据教学需求确定目标科室和目标疾病,并在与目标科室和目标疾病对应的目标诊疗问题集合中选择目标诊疗问题,电子设备就可以基于参考病历以及预先构建的诊疗问题与结构化病历中字段的映射关系,快速地生成满足教学需求的仿真模型。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请公开的一种生成仿真病历的方法的流程图;
图2为本申请公开的预先构建问题集合的方法的流程图;
图3为本申请公开的诊疗问题集合以及该诊疗问题集合中各诊疗问题与结构化病历中字段的映射关系的示意图;
图4-1为本申请公开的历史诊疗数据的示意图;
图4-2为图4-1所示的历史诊疗数据的分词结果的示意图;
图4-3为基于医疗知识库和医疗知识库的同义词词典对图4-1所示历史诊疗数据进行筛选的结果示意图;
图4-4为基于预设的高频医疗词汇对图4-1所示历史诊疗数据进行筛选的结果示意图;
图4-5为对图4-1所示历史诊疗数据进行清洗的结果示意图;
图5为本申请公开的部位本体的样例示意图;
图6为本申请公开的症状本体的样例示意图;
图7为对图4-5所示的清洗后的历史诊疗数据进行分类得到的部分分类结果的示意图;
图8为本申请公开的清洗后的问诊问题和答案、以及归一处理的结果的示意图;
图9为本申请公开的对清洗后的查体数据进行归一处理的结果的示意图;
图10为本申请公开的标准化历史诊疗数据中诊疗问题的分词结果、以及结构化字段的中文名称路径中的关键词的示意图;
图11为本申请公开的一种生成仿真病历的装置的结构示意图;
图12为本申请公开的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先对本申请中出现的技术术语进行说明。
医疗分类词库:在医疗领域常用的词库有疾病、症状、手术、药品、检验、检查等六大类。例如,疾病词库有冠状动脉粥样硬化性心脏病、高血压等,症状词库有发热、头疼等,手术词库有心脏介入手术、胸腔镜手术等,药品词库有阿司匹林、阿托伐他汀钙等,检验词库有红细胞、白细胞等,检查词库有心电图、超声等。
诊疗数据:在诊断疾病过程中,医生的问题和病人的答案(即病人的回答),又可以细分为问诊问题和对应的答案,以及查体问题与对应的答案。
自然语言处理:自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。也就是说让计算机理解我们日常所使用的语言。
结构化数据:目前数据分为结构化数据、半结构化数据、非结构化数据。结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。非结构化数据就是没有固定结构的数据,例如图片、文档等。半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。
文本相似度:一种考察两个文本是否相似,以及确定两个文本之间的相似程度的方法。
本申请公开一种生成仿真病历的方法,能够快速地根据教学需求生成诊疗问题和对应的答案,从而快速地生成满足教学需求的仿真病历。
本申请公开的生成仿真病历的方法应用于电子设备,其中,该电子设备可以为终端设备,如手机、个人计算机,也可以为提供生成仿真病历服务的服务器或者服务器集群。
参见图1,图1为本申请公开的一种生成仿真病历的方法的流程图。该方法包括:
步骤S101:获得参考病历。
参考病历为真实的历史病历,是用于生成仿真病历的参考数据。
实施中,确定要针对某个科室下某个疾病生成仿真病历后,获得该科室下该疾病的一份或者多份历史病历作为参考病历。例如,要针对心血管内科下的高血压病生成仿真病历,那么获取心血管内科下的一份或多份关于高血压病的历史病历作为参考病历。
步骤S102:获得诊疗问题请求。
其中,诊疗问题请求携带有目标科室和目标疾病的标识。
在一种可能的实现方式中,用户直接在图形界面输入诊疗问题请求,该诊疗问题请求携带有目标科室和目标疾病的标识。图形界面是能够进行人机交的前端页面。
在另一种可能的实现方式中,在图形界面显示科室以及各科室下的疾病,用户从中选择科室和该科室下的疾病,当点击确认控件时,生成诊疗问题请求,该诊疗问题请求携带有目标科室和目标疾病的标识。
步骤S103:在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与目标科室和目标疾病对应的目标诊疗问题集合,输出目标诊疗问题集合。其中,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系。
预先针对各个科室下的各个疾病预先构建诊疗问题集合,每个诊疗问题集合通常包括多个诊疗问题,并且,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系。
以心血管内科为例,针对高血压病和冠状动脉粥样硬化性心脏病分别预先构建诊疗问题集合。参见图3,图3示出了针对某科室下某疾病预先构建的诊疗问题集合,以及该诊疗问题集合中各诊疗问题与结构化病历中字段的映射关系。
在获得诊疗问题请求后,确定诊疗问题请求携带的目标科室和目标疾病的标识,在预先针对各个科室下的各个疾病预先构建诊疗问题集合中,获得与目标科室和目标疾病对应的目标诊疗问题集合。
需要说明的是,诊疗问题包括问诊问题和查体问题。
步骤S104:将目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题。
在获得目标诊疗问题集合后,显示该目标诊疗问题集合,用户选择目标诊疗问题集合中的一个或多个诊疗问题,将被选中的诊疗问题作为目标诊疗问题。也就是说,目标诊疗问题的数量可以为一个或多个。
步骤S105:基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案。
步骤S106:将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
目标诊疗问题与结构化病历中字段的映射关系是已知的,基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案。之后,将目标诊疗问题和对应的答案写入模板病历中的相应字段,从而得到仿真病历。
这里以图3所示的诊疗问题集合为例:
假如一个目标诊疗问题为“以前是否患其他疾病”,该目标诊疗问题与结构化病历中的“入院记录.既往史.疾病.疾病名称”字段存在映射关系。因此,获取参考病历中“入院记录.既往史.疾病.疾病名称”字段的数据,该数据包括诊疗问题和对应的答案,进一步获取该数据中的答案,该答案即为与目标诊疗问题对应的答案。将目标诊疗问题“以前是否患其他疾病”和对应的答案写入模板病历中的“入院记录.既往史.疾病.疾病名称”字段。
如果有多个目标诊疗问题,那么依次在参考病历中获取与各目标诊疗问题对应的答案,并将各个目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
需要说明的是,基于本申请公开的方法生成的仿真病历主要用于对教学对象进行问诊和查体方面的教学,因此,仿真病历中包含诊疗问题和对应的答案即可。
另外,考虑到一份真实的病历往往包括问诊数据、查体数据、检验数据、检查数据和诊断数据,可选的,在上述得到的仿真病历的基础上,还可以设置:获得检验数据、检查数据和诊断数据中的一项或多项,将获得的数据写入仿真病历。
实施中,可以获取参考病历中的检验数据、检查数据和诊断数据,将获取到的数据写入仿真病历。
本申请公开的生成仿真病历的方法,预先针对各个科室下的各个疾病构建诊疗问题集合,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;在获得携带有目标科室和目标疾病的标识的诊疗问题请求后,在预先构建的诊疗问题集合中获取与该目标科室和目标疾病对应的目标诊疗问题集合,输出该目标诊疗问题集合,之后将该诊疗问题集合中被选中的诊疗问题作为目标诊疗问题,基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案,将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可以看到,基于本申请公开的方法,用户只需要根据教学需求确定目标科室和目标疾病,并在与目标科室和目标疾病对应的目标诊疗问题集合中选择目标诊疗问题,电子设备就可以基于参考病历以及预先构建的诊疗问题与结构化病历中字段的映射关系,快速地生成满足教学需求的仿真模型。
在本申请上述公开的技术方案中,针对医院中多个科室下的多个疾病均预先构建有诊疗问题集合。下面对预先构建诊疗问题集合的方案进行说明。
参见图2,图2为本申请公开的预先构建问题集合的方法的流程图。该方法包括:
步骤S201:获取历史诊疗数据。
从现有的实际诊疗案例中获取医生在实际诊疗过程中产生的诊疗数据(即历史诊疗数据)。诊疗数据包括诊疗问题和相应的答案,另外,诊疗数据又可以划分为问诊类型和查体类型。
实施中,可以采用网络爬虫技术获取历史诊疗数据。参见图4-1,图4-1示出了部分历史诊疗数据。
步骤S202:对历史诊疗数据进行清洗。
在一种可能的实现方式中,对历史诊疗数据进行清洗,包括:
A1:对历史诊疗数据进行分词处理,得到第一分词结果;
A2:如果第一分词结果中有至少一个分词属于医疗知识库、医疗知识库的同义词词典或者预设的高频医疗词汇,则保留历史诊疗数据,否则,删除历史诊疗数据。
也就是说,针对全部的历史诊疗数据逐条进行清洗。其中,对一条历史诊疗数据进行分词处理,得到分词结果,为了便于描述,将其记为第一分词结果;之后,判断第一分词结果中是否有至少一个分词属于医疗知识库、医疗知识库的同义词词典或者预设的高频医疗词汇,如果第一分词结果中有一个或多个分词属于医疗知识库、医疗知识库的同义词词典或者预设的高频医疗词汇,那么保留该条历史诊疗数据,如果第一分词结果中的分词均不属于医疗知识库、医疗知识库的同义词词典或者预设的高频医疗词汇,则删除该条历史诊疗数据。
这里结合图4-1至图4-5进行说明。
获取的历史诊疗数据如图4-1所示。对图4-1所示的历史诊疗数据进行分词处理,得到的分词结果如图4-2所示。对图4-2所示的历史诊疗数据的分词结果与医疗知识库和医疗知识库的同义词词典进行比对,如果历史诊疗数据的分词结果中的任意一个或多个分词属于医疗知识库或医疗知识库的同义词词典,则保留该条历史诊疗数据,如图4-3所示。对图4-2所示的历史诊疗数据的分词结果与预设的高频医疗词汇进行比对,如果历史诊疗数据的分词结果中的任意一个或多个分词属于预设的高频医疗词汇,则保留该条历史诊疗数据。结合图4-3和图4-4得到对图4-1所示历史诊疗数据进行清洗的结果,如图4-5所示。
当然,也可以采用其他的方案对历史诊疗数据进行清洗,只要保证清洗后的历史诊疗数据均是与诊疗过程直接相关的即可。
步骤S203:对清洗后的历史诊疗数据进行分类。其中,历史诊疗数据的类型包括问诊和查体。
在一种可能的实现方式中,对清洗后的历史诊疗数据进行分类包括:
B1:如果清洗后的历史诊疗数据包括与症状本体对应的词汇或者问诊关键词,则确定清洗后的历史诊疗数据为问诊类型;
B2:如果清洗后的历史诊疗数据包括与部位本体对应的词汇,则确定清洗后的历史诊疗数据为查体类型。
请参见图5和图6,图5示出了部分部位本体的样例,图6示出了部分症状本体的样例。问诊关键词是通过对大量的问诊数据进行统计得到的、在问诊过程中使用频率较高的词汇。例如,问诊关键词包括但不限于:年龄、性别等。需要说明的是,如果诊疗问题没有对应的答案,那么该诊疗问题不属于问诊类型。对图4-5所示的清洗后的历史诊疗数据进行分类的部分结果如图7所示。
步骤S204:对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据。
清洗后的历史诊疗数据中可能存在相似的历史诊疗数据,如果相似的多条历史诊疗数据均保留,会造成数据冗余,因此,对清洗后的历史诊疗数据进行相似度归一处理,其目的是将相似的历史诊疗数据处理为一条标准化历史诊疗数据。
在前文中已经说明诊疗数据包括问诊类型和查体类型,相应的,清洗后的历史诊疗数据也包括问诊类型和查体类型。需要针对清洗后的历史诊疗数据中属于问诊类型的数据进行相似度归一处理,对清洗后的历史诊疗数据中属于查体类型的数据进行相似度归一处理。
在一种可能的实现方式中,对清洗后的历史诊疗数据进行相似度归一处理,包括:
C1:确定清洗后的历史诊疗数据中属于同一类型的历史诊疗数据之间的相似度。
实施中,对清洗后的历史诊疗数据中属于同一类型的多条历史诊疗数据,分别进行分词处理,得到每条历史诊疗数据的分词结果,确定各个分词结果中各分词的相似度特征值,之后基于余弦相似度原理、利用前述的各个分词结果中各分词的相似度特征值确定历史诊疗数据之间的相似度。
可选的,分词的相似度特征值为词频(TF)。某个词的TF为:该词在文档中出现的次数除以文档的总词数。或者,某个词的TF为:该词在文档中出现的次数除以在文档中出现次数最多的词的出现次数。
可选的,分词的相似度特征值为TF减去IDF。某个词在N个文档中出现,那么N的取值越大,该词的权重越小,相应的,N的取值越小,该词的权重越大。某个词的逆文档频率(IDF)=log(语料库的文档总数/包含该词的文档总数+1)。
C2:对相似度达到预设的相似度阈值的多条清洗后的历史诊疗数据进行归一处理,生成一条标准化历史诊疗数据。
如果多条清洗后的历史诊疗数据之间的相似度达到预设的相似度阈值(例如70%),那么需要对这多条历史诊疗数据进行归一处理,生成一条标准化历史诊疗数据。
实施中,如果待进行归一处理的多条清洗后的历史诊疗数据为问诊类型,那么对历史诊疗数据进行分词,再对分词结果进行同义词转换,使用副词词典以及同义词词典进行转换,得到标准化历史诊疗数据。参见图8,图8示出了清洗后的问诊问题和答案以及归一处理的结果。
如果待进行归一处理的多条清洗后的历史诊疗数据为查体类型,那么根据身体部位的同义词词典对历史诊疗数据进行转换,得到标准化历史诊疗数据。参见图9,图9示出了清洗后的查体数据归一处理的结果。
步骤S205:确定标准化历史诊疗数据在结构化病历中对应的字段,建立标准化历史诊疗数据中的诊疗问题与字段的映射关系。
在一种可能的实现方式中,确定标准化历史诊疗数据在结构化病历中对应的字段,包括:
D1:分别确定标准化历史诊疗数据与结构化病历中各字段之间的关联权重。
D2:将关联权重最高的字段确定为标准化历史诊疗数据在结构化病历中对应的字段。
标准化历史诊疗数据与结构化病历中各字段之间的关联权重表征:标准化历史诊疗数据与结构化病历中字段之间的关联性高低。针对每一个标准化历史诊疗数据,确定标准化历史诊疗数据与结构化病历中各字段之间的关联权重,之后,将关联权重最高的字段确定为该标准化历史诊疗数据在结构化病历中对应的字段。
需要说明的是,结构化病历中包括结构化字段和非结构化字段。
可选的,确定标准化历史诊疗数据与结构化病历中结构化字段之间的关联权重,采用如下方案:
提取该结构化字段的中文名称路径中的关键词;对标准化历史诊疗数据中的诊疗问题进行分词,得到分词结果;对前述关键词和分词结果进行匹配,得到匹配结果,根据匹配结果生成关联权重。
其中,前述关键词和前述分词结果中匹配的词的数量与关联权重的取值成正相关关系。也就是说,前述关键词和前述分词结果中匹配的词越多,该标准化历史诊疗数据与该结构化字段之间的关联权重越大。
请参见图10,图10示出了标准化历史诊疗数据中诊疗问题的分词结果以及结构化字段的中文名称路径中的关键词。
可选的,如果标准化历史诊疗数据为问诊类型,那么确定标准化历史诊疗数据与结构化病历中结构化字段之间的关联权重,采用如下方案:
提取该结构化字段的中文名称路径中的关键词;对标准化历史诊疗数据中的诊疗问题(具体为问诊问题)进行分词,得到分词结果;对前述关键词和分词结果进行匹配,得到第一匹配结果,根据第一匹配结果生成第一关联权重;
对结构化字段的值域进行统计,将其分布情况与标准化历史诊疗数据中的诊疗问题的分词结果的词分布情况进行匹配,得到第二匹配结果,根据第二匹配结果生成第二关联权重;
将第一关联权重和第二关联权重的和作为标准化历史诊疗数据与结构化病历中结构化字段之间的关联权重。
其中,第二匹配结果的匹配程度与第二关联权重的取值成正相关关系。也就是说,结构化字段的值域分布情况与诊疗问题的分词结果的词分布情况的匹配度越高,第二关联权重的取值越大。
可选的,确定标准化历史诊疗数据与结构化病历中非结构化字段之间的关联权重,采用如下方案:
对历史病历的入院记录中的一诉五史进行分词处理,再对分词结果进行归一处理,统计归一处理后的分词结果中高频词汇的分布情况;对标准化历史诊疗数据进行分词处理,统计分词结果的词的分布情况;对前述的两个分布情况进行匹配,得到匹配结果,根据匹配结果生成关联权重。其中,高频词汇的分布情况与分词结果的词的分布情况的匹配程度与关联权重成正相关关系。
步骤S206:确定标准化历史诊疗数据中的诊疗问题对应的科室和疾病。
在一种可能的实现方式中,确定标准化历史诊疗数据中的诊疗问题对应的科室和疾病,包括:
E1:根据标准化历史诊疗数据在结构化病历中对应的字段,确定标准化历史诊疗数据中的诊疗问题对应的科室。
其中,结构化病历中的字段与科室之间的对应关系是确定的,根据标准化历史诊疗数据在结构化病历中对应的字段以及前述的对应关系,就可以确定标准化历史诊疗数据中的诊疗问题对应的科室。
需要说明的是,结构化病历中的某些字段被设置为共有字段,如关于年龄、性别的字段被设置为共有字段。如果标准化历史诊疗数据对应于结构化病历中的共有字段,那么该标准化历史诊疗数据为各科室的共有数据,也就是说,该标准化历史诊疗数据中的诊疗问题对应于全部科室。
E2:对标准化历史诊疗数据进行分词处理,得到第二分词结果,确定第二分词结果与科室下各个疾病的医疗关键词之间的相似度,将相似度最高的疾病确定为标准化历史诊疗数据中的诊疗问题对应的疾病。
每个科室下设置有多个疾病,在确定标准化历史诊疗数据中的诊疗问题对应的科室之后,还需要进一步确定该诊疗问题对应的疾病。每种疾病都有各自的特点,其医疗关键词也会存在区别,因此,根据标准化历史诊疗数据的分词结果和该科室下多个疾病的医疗关键词的相似度,就可以确定该标准化历史诊疗数据中的诊疗问题对应于该科室下的哪种疾病。
步骤S207:将诊疗问题加入为对应的科室和疾病构建的诊疗问题集合。
在确定诊疗问题对应的科室和疾病后,将该诊疗问题加入该科室和疾病对应的诊疗问题集合即可。
本申请图2所示的方案,电子设备获取历史诊疗数据后对其进行清洗,对清洗后的历史诊疗数据进行分类,并对清洗后的历史诊疗数据进行相似性归一处理,从而将同一类别中相似的历史诊疗数据处理为标准化历史诊疗数据,之后确定标准化历史诊疗数据在结构化病历中对应的字段,并建立标准化历史诊疗数据中的诊疗问题与该字段的映射关系,确定标准化历史诊疗数据中的诊疗问题对应的科室和疾病,将诊疗问题加入为对应的科室和疾病构建的诊疗问题集合,从而完成各科室下各疾病对应的诊疗问题集合的构建,而且诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系。
本申请上述公开了一种生成仿真病历的方法,相应的,本申请还公开一种生成仿真病历的装置。说明书中关于两者的描述可以相互参考。
参见图11,图11为本申请公开的一种生成仿真病历的装置的结构示意图。该装置包括:
参考病历获取单元1101,用于获得参考病历。
请求获取单元1102,用于获得诊疗问题请求,诊疗问题请求携带有目标科室和目标疾病的标识。
目标诊疗问题集合获取单元1103,用于在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与目标科室和目标疾病对应的目标诊疗问题集合,输出目标诊疗问题集合。其中,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系。
目标诊疗问题获取单元1104,用于将目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题。
诊疗答案获取单元1105,用于基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案。
数据处理单元1106,用于将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
本申请公开的生成仿真病历的装置,预先针对各个科室下的各个疾病构建诊疗问题集合,诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;在获得携带有目标科室和目标疾病的标识的诊疗问题请求后,在预先构建的诊疗问题集合中获取与该目标科室和目标疾病对应的目标诊疗问题集合,输出该目标诊疗问题集合,之后将该诊疗问题集合中被选中的诊疗问题作为目标诊疗问题,基于目标诊疗问题与结构化病历中字段的映射关系,在参考病历中获取与目标诊疗问题对应的答案,将目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可以看到,基于本申请公开的生成仿真病历的装置,用户只需要根据教学需求确定目标科室和目标疾病,并在与目标科室和目标疾病对应的目标诊疗问题集合中选择目标诊疗问题,该装置就可以基于参考病历以及预先构建的诊疗问题与结构化病历中字段的映射关系,快速地生成满足教学需求的仿真模型。
在另一个实施例中,在图11所示装置的基础上,进一步设置预处理单元,该预处理单元用于针对各个科室下的各个疾病预先构建诊疗问题集合。
可选的,该预处理单元包括:
历史诊疗数据获取子单元,用于获取历史诊疗数据;
数据清洗子单元,用于对历史诊疗数据进行清洗;
诊疗数据分类子单元,用于对清洗后的历史诊疗数据进行分类,历史诊疗数据的类型包括问诊和查体;
归一处理子单元,用于对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据;
映射关系处理子单元,用于确定标准化历史诊疗数据在结构化病历中对应的字段,建立标准化历史诊疗数据中的诊疗问题与字段的映射关系;
科室及疾病确定子单元,用于确定标准化历史诊疗数据中的诊疗问题对应的科室和疾病;
诊疗问题处理子单元,用于将诊疗问题加入为对应的科室和疾病构建的诊疗问题集合。
可选的,数据清洗子单元对历史诊疗数据进行清洗,具体为:
对历史诊疗数据进行分词处理,得到第一分词结果;
如果第一分词结果中有至少一个分词属于医疗知识库、医疗知识库的同义词词典或者预设的高频医疗词汇,则保留历史诊疗数据,否则,删除历史诊疗数据。
可选的,诊疗数据分类子单元对清洗后的历史诊疗数据进行分类,具体为:
如果清洗后的历史诊疗数据包括与症状本体对应的词汇或者问诊关键词,则确定清洗后的历史诊疗数据为问诊类型;
如果清洗后的历史诊疗数据包括与部位本体对应的词汇,则确定清洗后的历史诊疗数据为查体类型。
可选的,归一处理子单元对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据,具体为:
确定清洗后的历史诊疗数据中属于同一类型的历史诊疗数据之间的相似度;
对相似度达到预设的相似度阈值的多条清洗后的历史诊疗数据进行归一处理,生成一条标准化历史诊疗数据。
可选的,映射关系处理子单元确定标准化历史诊疗数据在结构化病历中对应的字段,具体为:
分别确定标准化历史诊疗数据与结构化病历中各字段之间的关联权重;
将关联权重最高的字段确定为标准化历史诊疗数据在结构化病历中对应的字段。
可选的,科室及疾病确定子单元确定标准化历史诊疗数据中的诊疗问题对应的科室和疾病,具体为:
根据标准化历史诊疗数据在结构化病历中对应的字段,确定标准化历史诊疗数据中的诊疗问题对应的科室;
对标准化历史诊疗数据进行分词处理,得到第二分词结果,确定第二分词结果与科室下各个疾病的医疗关键词之间的相似度,将相似度最高的疾病确定为标准化历史诊疗数据中的诊疗问题对应的疾病。
本申请还提供一种电子设备。参见图12,图12示出了电子设备的硬件结构,该电子设备可以包括:至少一个处理器1201,至少一个通信接口1202,至少一个存储器1203和至少一个通信总线1204。
在本申请实施例中,处理器1201、通信接口1202、存储器1203、通信总线1204的数量为至少一个,且处理器1201、通信接口1202、存储器1203通过通信总线1204完成相互间的通信。
处理器1201可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等。
存储器1203可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器。
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获得参考病历;
获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获得参考病历;
获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、电子设备、服务器及存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种生成仿真病历的方法,其特征在于,包括:
获得参考病历;
获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
2.根据权利要求1所述的方法,其特征在于,预先构建诊疗问题集合的方案,包括:
获取历史诊疗数据;
对所述历史诊疗数据进行清洗;
对清洗后的历史诊疗数据进行分类,所述历史诊疗数据的类型包括问诊和查体;
对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据;
确定所述标准化历史诊疗数据在所述结构化病历中对应的字段,建立所述标准化历史诊疗数据中的诊疗问题与所述字段的映射关系;
确定所述标准化历史诊疗数据中的诊疗问题对应的科室和疾病;
将所述诊疗问题加入为对应的科室和疾病构建的诊疗问题集合。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史诊疗数据进行清洗,包括:
对所述历史诊疗数据进行分词处理,得到第一分词结果;
如果所述第一分词结果中有至少一个分词属于医疗知识库、所述医疗知识库的同义词词典或者预设的高频医疗词汇,则保留所述历史诊疗数据,否则,删除所述历史诊疗数据。
4.根据权利要求2所述的方法,其特征在于,所述对清洗后的历史诊疗数据进行分类,包括:
如果所述清洗后的历史诊疗数据包括与症状本体对应的词汇或者问诊关键词,则确定所述清洗后的历史诊疗数据为问诊类型;
如果所述清洗后的历史诊疗数据包括与部位本体对应的词汇,则确定所述清洗后的历史诊疗数据为查体类型。
5.根据权利要求2所述的方法,其特征在于,所述对清洗后的历史诊疗数据进行相似度归一处理,得到标准化历史诊疗数据,包括:
确定所述清洗后的历史诊疗数据中属于同一类型的历史诊疗数据之间的相似度;
对相似度达到预设的相似度阈值的多条清洗后的历史诊疗数据进行归一处理,生成一条标准化历史诊疗数据。
6.根据权利要求2所述的方法,其特征在于,所述确定所述标准化历史诊疗数据在所述结构化病历中对应的字段,包括:
分别确定所述标准化历史诊疗数据与所述结构化病历中各字段之间的关联权重;
将关联权重最高的字段确定为所述标准化历史诊疗数据在所述结构化病历中对应的字段。
7.根据权利要求2所述的方法,其特征在于,所述确定所述标准化历史诊疗数据中的诊疗问题对应的科室和疾病,包括:
根据所述标准化历史诊疗数据在所述结构化病历中对应的字段,确定所述标准化历史诊疗数据中的诊疗问题对应的科室;
对所述标准化历史诊疗数据进行分词处理,得到第二分词结果,确定所述第二分词结果与所述科室下各个疾病的医疗关键词之间的相似度,将相似度最高的疾病确定为所述标准化历史诊疗数据中的诊疗问题对应的疾病。
8.一种生成仿真病历的装置,其特征在于,包括:
参考病历获取单元,用于获得参考病历;
请求获取单元,用于获得诊疗问题请求,所述诊疗问题请求携带有目标科室和目标疾病的标识;
目标诊疗问题集合获取单元,用于在针对各个科室下各个疾病预先构建的诊疗问题集合中,获得与所述目标科室和所述目标疾病对应的目标诊疗问题集合,输出所述目标诊疗问题集合;其中,所述诊疗问题集合中的每个诊疗问题均预先构建有与结构化病历中字段的映射关系;
目标诊疗问题获取单元,用于将所述目标诊疗问题集合中被选中的诊疗问题作为目标诊疗问题;
诊疗答案获取单元,用于基于所述目标诊疗问题与所述结构化病历中字段的映射关系,在所述参考病历中获取与所述目标诊疗问题对应的答案;
数据处理单元,用于将所述目标诊疗问题和对应的答案写入模板病历中的相应字段,得到仿真病历。
9.一种电子设备,其特征在于,包括处理器、存储器和通信接口;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1至7中任一项所述的生成仿真病历的方法的各个步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的生成仿真病历的方法的各个步骤。
CN202011253477.2A 2020-11-11 2020-11-11 一种生成仿真病历的方法、装置、电子设备及存储介质 Active CN112349367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011253477.2A CN112349367B (zh) 2020-11-11 2020-11-11 一种生成仿真病历的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011253477.2A CN112349367B (zh) 2020-11-11 2020-11-11 一种生成仿真病历的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112349367A true CN112349367A (zh) 2021-02-09
CN112349367B CN112349367B (zh) 2023-08-08

Family

ID=74363332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011253477.2A Active CN112349367B (zh) 2020-11-11 2020-11-11 一种生成仿真病历的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112349367B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571167A (zh) * 2021-07-28 2021-10-29 重庆橡树信息科技有限公司 一种基于配置式评分知识模型的快捷分诊***
CN113792129A (zh) * 2021-09-16 2021-12-14 平安普惠企业管理有限公司 一种智能会话方法、装置、计算机设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070197882A1 (en) * 2006-02-17 2007-08-23 Medred, Llc Integrated method and system for diagnosis determination
CN101236579A (zh) * 2008-02-20 2008-08-06 杭州创业软件股份有限公司 一种动态结构化的电子病历
WO2016101351A1 (zh) * 2014-12-26 2016-06-30 深圳市前海安测信息技术有限公司 基于网络医院的全科医生辅助诊疗***及方法
CN109710670A (zh) * 2018-12-11 2019-05-03 河南通域医疗科技有限公司 一种将病历文本从自然语言转换为结构化元数据的方法
CN111292817A (zh) * 2018-12-07 2020-06-16 深圳坐标软件集团有限公司 电子病历的生成方法及装置
CN111429989A (zh) * 2020-04-21 2020-07-17 北京嘉和海森健康科技有限公司 一种生成诊前病历的方法及装置
CN111696640A (zh) * 2020-06-12 2020-09-22 上海联影医疗科技有限公司 自动获取病历模板的方法、装置和存储介质
CN111739599A (zh) * 2020-06-19 2020-10-02 北京嘉和海森健康科技有限公司 一种教学病历生成方法和装置
CN111755109A (zh) * 2020-05-14 2020-10-09 中山大学孙逸仙纪念医院 一种诊疗随访***
CN111833977A (zh) * 2020-07-17 2020-10-27 成都市妇女儿童中心医院 智慧医院数字化电子病历与科研教学集成***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070197882A1 (en) * 2006-02-17 2007-08-23 Medred, Llc Integrated method and system for diagnosis determination
CN101236579A (zh) * 2008-02-20 2008-08-06 杭州创业软件股份有限公司 一种动态结构化的电子病历
WO2016101351A1 (zh) * 2014-12-26 2016-06-30 深圳市前海安测信息技术有限公司 基于网络医院的全科医生辅助诊疗***及方法
CN111292817A (zh) * 2018-12-07 2020-06-16 深圳坐标软件集团有限公司 电子病历的生成方法及装置
CN109710670A (zh) * 2018-12-11 2019-05-03 河南通域医疗科技有限公司 一种将病历文本从自然语言转换为结构化元数据的方法
CN111429989A (zh) * 2020-04-21 2020-07-17 北京嘉和海森健康科技有限公司 一种生成诊前病历的方法及装置
CN111755109A (zh) * 2020-05-14 2020-10-09 中山大学孙逸仙纪念医院 一种诊疗随访***
CN111696640A (zh) * 2020-06-12 2020-09-22 上海联影医疗科技有限公司 自动获取病历模板的方法、装置和存储介质
CN111739599A (zh) * 2020-06-19 2020-10-02 北京嘉和海森健康科技有限公司 一种教学病历生成方法和装置
CN111833977A (zh) * 2020-07-17 2020-10-27 成都市妇女儿童中心医院 智慧医院数字化电子病历与科研教学集成***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAN QIANG 等: "Design and Application of Electronic Medical Record Template", 《CHINESE MEDICAL RECORD ENGLISH EDITION》, vol. 02, no. 02, pages 41 - 46 *
李昆: "基于电子病历的深度神经网络预测模型研究与应用", 《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》, no. 11, pages 053 - 34 *
杨琳: "医教协同下护理专业案例资源库的建设与研究", 《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》, no. 09, pages 054 - 12 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571167A (zh) * 2021-07-28 2021-10-29 重庆橡树信息科技有限公司 一种基于配置式评分知识模型的快捷分诊***
CN113571167B (zh) * 2021-07-28 2024-04-19 重庆橡树信息科技有限公司 一种基于配置式评分知识模型的快捷分诊***
CN113792129A (zh) * 2021-09-16 2021-12-14 平安普惠企业管理有限公司 一种智能会话方法、装置、计算机设备及介质
CN113792129B (zh) * 2021-09-16 2024-06-14 联通在线信息科技有限公司 一种智能会话方法、装置、计算机设备及介质

Also Published As

Publication number Publication date
CN112349367B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
Moradi et al. Deep contextualized embeddings for quantifying the informative content in biomedical text summarization
CN107391906B (zh) 基于神经网络和图谱结构的健康饮食知识网络构建方法
US20190252074A1 (en) Knowledge graph-based clinical diagnosis assistant
CN112786194A (zh) 基于人工智能的医学影像导诊导检***、方法及设备
US9477662B2 (en) Computer-assisted abstraction for reporting of quality measures
JP7357614B2 (ja) 機械支援対話システム、ならびに病状問診装置およびその方法
CN106874643A (zh) 基于词向量自动构建知识库实现辅助诊疗的方法和***
WO2009037615A1 (en) System and method for analyzing electronic data records
CN111429989B (zh) 一种生成诊前病历的方法及装置
US20130060793A1 (en) Extracting information from medical documents
CN113764112A (zh) 一种在线医疗问答方法
CN112349367B (zh) 一种生成仿真病历的方法、装置、电子设备及存储介质
Johnson et al. Medical provider embeddings for healthcare fraud detection
CN113409907A (zh) 一种基于互联网医院的智能预问诊方法及***
CN112201350A (zh) 一种智能分诊方法、装置及电子设备
CN110199354B (zh) 生物体系信息检索***以及方法
CN113343680A (zh) 一种基于多类型病历文本的结构化信息提取方法
Batool et al. Automatic extraction and mapping of discharge summary’s concepts into SNOMED CT
Ning et al. Evaluating semantic similarity between Chinese biomedical terms through multiple ontologies with score normalization: An initial study
Chung et al. Concept-value pair extraction from semi-structured clinical narrative: a case study using echocardiogram reports
CN113761899A (zh) 一种医疗文本生成方法、装置、设备及存储介质
CN113314236A (zh) 一种面向高血压的智能问答***
Pakhomov et al. Identification of Patients with Congestive Heart Failure using a binary classifier: a case study.
US11869674B2 (en) Translation of medical evidence into computational evidence and applications thereof
Wijesinghe et al. UMLS-Based Question-Answering Approach for Automatic Initial Frailty Assessment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant