CN112951353A - 一种医疗病历标注平台及其操作方法 - Google Patents

一种医疗病历标注平台及其操作方法 Download PDF

Info

Publication number
CN112951353A
CN112951353A CN201911171271.2A CN201911171271A CN112951353A CN 112951353 A CN112951353 A CN 112951353A CN 201911171271 A CN201911171271 A CN 201911171271A CN 112951353 A CN112951353 A CN 112951353A
Authority
CN
China
Prior art keywords
task
labeling
data
annotation
personnel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911171271.2A
Other languages
English (en)
Inventor
刘翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhihuiyun Technology Co ltd
Original Assignee
Guangzhou Zhihuiyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Zhihuiyun Technology Co ltd filed Critical Guangzhou Zhihuiyun Technology Co ltd
Priority to CN201911171271.2A priority Critical patent/CN112951353A/zh
Publication of CN112951353A publication Critical patent/CN112951353A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种医疗病历标注平台及其操作方法,具体涉及Web端文本标注领域,包括任务中心和管理中心;所述任务中心用于标注人员和管理员进行病历标注任务查看、人工标注、个人标注历史查看、重新标注和添加词性;所述管理中心用于标注任务的建立及发布、数据维护、标注人员管理和标注结果导出。本发明通过人工操作,对医疗类的非结构化原始数据进行结构化标注,可以有效改善目前病历文书等样本数据的缺失问题,提高样本数据的生产效率,为算法模型提供更准确、更可靠的数据支撑和学习的结构化样本数据。

Description

一种医疗病历标注平台及其操作方法
技术领域
本发明涉及Web端文本标注技术领域,更具体地说,本发明涉及一种医疗病历标注平台及其操作方法。
背景技术
目前,医院科研人员开展科研任务时,需要从病历文书、检验检查报告等医疗资料中提取大量的、有效的、准确的数据作支撑,但往往受限于医院医疗信息化水平不够、人工采集繁琐等原因,数据提取非常麻烦且就算提取出来后,也不一定是科研能够直接应用的数据,往往还需要进行结构化处理,这大大增加了科研人员在进行研究时的工作量。
而且医疗数据的体量通常都非常大,有限的人力资源难以进行采集和处理,必须依靠专业人员通过计算机语言建立算法来归类。因此,为了更好的进行数据处理,必须先对数据处理的前置条件——算法准确度进行提高,且需要根据不同的科研类型、不同的病种等为机器提供学习的样本数据,而现有技术中并未有一种有效处理方式已解决上述问题。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种医疗病历标注平台及其操作方法,本发明所要解决的技术问题是:机器学习所用医疗病历文书结构化样本数据的缺失问题。
为实现上述目的,本发明提供如下技术方案:一种医疗病历标注平台,包括任务中心和管理中心;
所述任务中心用于标注人员和管理员进行病历标注任务查看、人工标注、个人标注历史查看、重新标注和添加词性;
所述管理中心用于标注任务的建立及发布、数据维护、标注人员管理和标注结果导出。
在一个优选地实施方式中,所述医疗病历标注平台的对接权限分配;标注人员:查看及操作任务中心,进行任务标注;管理员:查看及操作任务中心和管理中心,进行任务创建和数据修改、导入。
在一个优选地实施方式中,所述管理中心中标注人员管理用于对不同权限人员的信息存储。
在一个优选地实施方式中,所述任务中心中人工标注包括数据项标注和词性标注,所述数据项标注均为***医学指标数值选择,所述词性标注方式包括***医学术语和自定义词汇,数据项标注时,标注人员不可自定义数据项,避免不规范数值导入造成数据失效。
本发明还包括医疗病历标注平台的操作方法,具体操作方式如下:
S1、创建标注任务:在标注前,需要先创建标注任务,具体包括输入名称、选择任务类别;
S2、任务维护:创建完任务后,需要对任务进行维护,包括标注人员的添加、由管理中心进行非结构化病历文本导入、医学术语/指标导入,管理员在新增某项指标/词性后,需人工提醒标注人员相关事项;
S3、发布任务:有关任务的基础数据、人员完成维护后,待数据上传完成后即可对外进行任务发布;
S4、人员标注:任务发布后,归属此任务下的标注人员即可看到,并开始进行病历文本的标注工作,期间可根据标注的要求,自定义添加指标或修改已标注的内容;
S5、结果查验:任务完成标注后,对该任务下所有的标注结果进行查阅核验,有误进行修改,无误即完成本次标注工作;
S6、导出结果:完成查验后,对本次标注任务的结果进行导出,导出后的结构化样本数据应用于后续机器学习。
在一个优选地实施方式中,所述步骤S1和S2需对管理员身份进行验证,管理员需使用账号登录进入管理中心操作。
在一个优选地实施方式中,所述步骤S4中标注人员为步骤S2中添加的人员,且需采用账号登录。
在一个优选地实施方式中,所述步骤S4和S5中标注人员自行添加的词性,只有标注人员能够在任务中心查看及修改,管理中心不收录,即管理员无法查看并改动,避免两者改动造成混乱。
本发明的技术效果和优点:
本发明通过人工操作,对医疗类的非结构化原始数据进行结构化标注,可以有效改善目前病历文书等样本数据的缺失问题,提高样本数据的生产效率,为算法模型提供更准确、更可靠的数据支撑和学习的结构化样本数据。
附图说明
图1为本发明的使用流程图。
图2为本发明的模块结构示意图。
附图标记为:1任务中心、2管理中心。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明提供了如图1-2所示的一种医疗病历标注平台,包括任务中心1和管理中心2;
所述任务中心1用于标注人员和管理员进行病历标注任务查看、人工标注、个人标注历史查看、重新标注和添加词性;
所述管理中心2用于标注任务的建立及发布、数据维护(标注指标及原文数据的导入)、标注人员管理和标注结果导出。
所述医疗病历标注平台的对接权限分配;标注人员:查看及操作任务中心1,进行任务标注;管理员:查看及操作任务中心1和管理中心2,进行任务创建和数据修改、导入。
所述管理中心2中标注人员管理用于对不同权限人员的信息存储;
所述任务中心1中人工标注包括数据项标注和词性标注,所述数据项标注均为***医学指标数值选择,所述词性标注方式包括***医学术语和自定义词汇,数据项标注时,标注人员不可自定义数据项,避免不规范数值导入造成数据失效,其具体功能见下表:
Figure BDA0002288781150000041
任务中心:
(1)标注人员登录***后可以看到任务中心1首页,标注人员可以在这里看到自己的工作任务,包括任务的名称、类型、任务状态、完成进展;
(2)进入任务标记界面,看到整个界面的三大块:标注指标区域、标注原文区域和标注结果区域;
(3)标注人员首先在标注原文区域,鼠标选中一块内容,然后再选中标注指标区域的指标,就可以看到在结果区域出现了一行标注数据,选择或输入指标的结果值即完成一个指标的标注,标记完成后,可点击下一篇继续进行标记;
(4)如果管理员端有进行指标的增加,则需提醒标注人员,重新在任务中心1进行增加指标项的标注;
管理中心:
(1)在此界面中进行新增标注任务、任务数据维护、发布任务、管理标注人员及导出标注结果功能;
(2)点击新增任务,输入任务名称,添加任务的标注成员,选择标注类型后点击确认即可完成任务新增;
(3)完成新增任务后,进入数据维护界面后开展指标/词性和标注原文的导入;
(4)数据维护(指标/词性和标注原文导入)完成后,即可返回管理中心2界面进行标注任务的人员编辑和任务的发布,标注人员在任务中心1首页即可看到跟自己有关的任务;
(5)任务建立且完成数据导入后,管理员可以再次进入数据维护的数据界面,对已添加的指标/词性进行修改、删除,同时也可以对导入的标注原文进行查看。
本发明还包括医疗病历标注平台的操作方法,具体操作方式如下:
S1、创建标注任务:在标注前,需要先创建标注任务,具体包括输入名称、选择任务类别,此步骤需对管理员身份进行验证,管理员需使用账号登录进入管理中心2操作;
S2、任务维护:创建完任务后,需要对任务进行维护,包括标注人员的添加、由管理中心2进行非结构化病历文本导入、医学术语/指标导入,管理员在新增某项指标/词性后,需人工提醒标注人员相关事项(删除和修改不影响之前的标注,添加则需要标注人员重新标记),此步骤需对管理员身份进行验证,管理员需使用账号登录进入管理中心2操作;
S3、发布任务:有关任务的基础数据、人员完成维护后,待数据上传完成后即可对外进行任务发布;
S4、人员标注:任务发布后,归属此任务下的标注人员即可看到,并开始进行病历文本的标注工作,期间可根据标注的要求,自定义添加指标或修改已标注的内容,本步骤中标注人员为步骤S2中添加的人员,且需采用账号登录;
S5、结果查验:任务完成标注后,对该任务下所有的标注结果进行查阅核验,有误进行修改,无误即完成本次标注工作,标注人员自行添加的词性,只有标注人员能够在任务中心1查看及修改,管理中心2不收录,即管理员无法查看并改动,避免两者改动造成混乱;
S6、导出结果:完成查验后,对本次标注任务的结果进行导出,导出后的结构化样本数据应用于后续机器学习;
实施方式具体为:
分词版:直接将病历原文中有医学意义的词汇提取出来,并赋予该医学词汇正确的词性,实在无法归类时,可新建词性。
实施例2:
本发明提供了如图1-2所示的一种医疗病历标注平台,包括任务中心1和管理中心2;
所述任务中心1用于标注人员和管理员进行病历标注任务查看、人工标注、个人标注历史查看、重新标注和添加词性;
所述管理中心2用于标注任务的建立及发布、数据维护(标注指标及原文数据的导入)、标注人员管理和标注结果导出。
所述医疗病历标注平台的对接权限分配;标注人员:查看及操作任务中心1,进行任务标注;管理员:查看及操作任务中心1和管理中心2,进行任务创建和数据修改、导入。
所述管理中心2中标注人员管理用于对不同权限人员的信息存储;
所述任务中心1中人工标注包括数据项标注和词性标注,所述数据项标注均为***医学指标数值选择,所述词性标注方式包括***医学术语和自定义词汇,数据项标注时,标注人员不可自定义数据项,避免不规范数值导入造成数据失效,其具体功能见下表:
Figure BDA0002288781150000071
Figure BDA0002288781150000081
任务中心:
(1)标注人员登录***后可以看到任务中心1首页,标注人员可以在这里看到自己的工作任务,包括任务的名称、类型、任务状态、完成进展;
(2)进入任务标记界面,看到整个界面的三大块:标注指标区域、标注原文区域和标注结果区域;
(3)标注人员首先在标注原文区域,鼠标选中一块内容,然后再选中标注指标区域的指标,就可以看到在结果区域出现了一行标注数据,选择或输入指标的结果值即完成一个指标的标注,标记完成后,可点击下一篇继续进行标记;
(4)如果管理员端有进行指标的增加,则需提醒标注人员,重新在任务中心1进行增加指标项的标注;
管理中心:
(1)在此界面中进行新增标注任务、任务数据维护、发布任务、管理标注人员及导出标注结果功能;
(2)点击新增任务,输入任务名称,添加任务的标注成员,选择标注类型后点击确认即可完成任务新增;
(3)完成新增任务后,进入数据维护界面后开展指标/词性和标注原文的导入;
(4)数据维护(指标/词性和标注原文导入)完成后,即可返回管理中心2界面进行标注任务的人员编辑和任务的发布,标注人员在任务中心1首页即可看到跟自己有关的任务;
(5)任务建立且完成数据导入后,管理员可以再次进入数据维护的数据界面,对已添加的指标/词性进行修改、删除,同时也可以对导入的标注原文进行查看。
本发明还包括医疗病历标注平台的操作方法,具体操作方式如下:
S1、创建标注任务:在标注前,需要先创建标注任务,具体包括输入名称、选择任务类别,此步骤需对管理员身份进行验证,管理员需使用账号登录进入管理中心2操作;
S2、任务维护:创建完任务后,需要对任务进行维护,包括标注人员的添加、由管理中心2进行非结构化病历文本导入、医学术语/指标导入,管理员在新增某项指标/词性后,需人工提醒标注人员相关事项(删除和修改不影响之前的标注,添加则需要标注人员重新标记),此步骤需对管理员身份进行验证,管理员需使用账号登录进入管理中心2操作;
S3、发布任务:有关任务的基础数据、人员完成维护后,待数据上传完成后即可对外进行任务发布;
S4、人员标注:任务发布后,归属此任务下的标注人员即可看到,并开始进行病历文本的标注工作,期间可根据标注的要求,自定义添加指标或修改已标注的内容,本步骤中标注人员为步骤S2中添加的人员,且需采用账号登录;
S5、结果查验:任务完成标注后,对该任务下所有的标注结果进行查阅核验,有误进行修改,无误即完成本次标注工作,标注人员自行添加的词性,只有标注人员能够在任务中心1查看及修改,管理中心2不收录,即管理员无法查看并改动,避免两者改动造成混乱;
S6、导出结果:完成查验后,对本次标注任务的结果进行导出,导出后的结构化样本数据应用于后续机器学习;
实施方式具体为:
数据项版:已定义的数据项(等同上述中的词性)比较复杂,需要依据病历原文,进一步判断,最后得出数据项对应的结果值,此处的数据项将根据不同病种定义,数据项以外的具有医学意义的词汇不必提取,用户不可自定义新增数据项。
综上所述:上述两实施例中的医疗病历标注平台,均适用于大规模的数据处理需求,通过定义符合医疗科研要求的数据项/词性,采用人工标注的方式,对原始病历文书、检验检查等源数据进行相应数据项/词性标注,转化为可用数据并导出提供给算法进行机器学习的产品。
最后应说明是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种医疗病历标注平台,其特征在于:包括任务中心(1)和管理中心(2);
所述任务中心(1)用于标注人员和管理员进行病历标注任务查看、人工标注、个人标注历史查看、重新标注和添加词性;
所述管理中心(2)用于标注任务的建立及发布、数据维护、标注人员管理和标注结果导出。
2.根据权利要求1所述的一种医疗病历标注平台,其特征在于:所述医疗病历标注平台的对接权限分配;标注人员:查看及操作任务中心(1),进行任务标注;管理员:查看及操作任务中心(1)和管理中心(2),进行任务创建和数据修改、导入。
3.根据权利要求1所述的一种医疗病历标注平台,其特征在于:所述管理中心(2)中标注人员管理用于对不同权限人员的信息存储。
4.根据权利要求1所述的一种医疗病历标注平台,其特征在于:所述任务中心(1)中人工标注包括数据项标注和词性标注,所述数据项标注均为***医学指标数值选择,所述词性标注方式包括***医学术语和自定义词汇。
5.根据权利要求1-4任意一项所述的一种医疗病历标注平台,其特征在于:还包括医疗病历标注平台的操作方法,具体操作方式如下:
S1、创建标注任务:在标注前,需要先创建标注任务,具体包括输入名称、选择任务类别;
S2、任务维护:创建完任务后,需要对任务进行维护,包括标注人员的添加、由管理中心(2)进行非结构化病历文本导入、医学术语/指标导入;
S3、发布任务:有关任务的基础数据、人员完成维护后,待数据上传完成后即可对外进行任务发布;
S4、人员标注:任务发布后,归属此任务下的标注人员即可看到,并开始进行病历文本的标注工作,期间可根据标注的要求,自定义添加指标或修改已标注的内容;
S5、结果查验:任务完成标注后,对该任务下所有的标注结果进行查阅核验,有误进行修改,无误即完成本次标注工作;
S6、导出结果:完成查验后,对本次标注任务的结果进行导出,导出后的结构化样本数据应用于后续机器学习。
6.根据权利要求5所述的一种医疗病历标注平台的操作方法,其特征在于:所述步骤S1和S2需对管理员身份进行验证,管理员需使用账号登录进入管理中心(2)操作。
7.根据权利要求5所述的一种医疗病历标注平台的操作方法,其特征在于:所述步骤S4中标注人员为步骤S2中添加的人员,且需采用账号登录。
8.根据权利要求5所述的一种医疗病历标注平台的操作方法,其特征在于:所述步骤S4和S5中标注人员自行添加的词性,只有标注人员能够在任务中心(1)查看及修改,管理中心(2)不收录。
CN201911171271.2A 2019-11-26 2019-11-26 一种医疗病历标注平台及其操作方法 Pending CN112951353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911171271.2A CN112951353A (zh) 2019-11-26 2019-11-26 一种医疗病历标注平台及其操作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911171271.2A CN112951353A (zh) 2019-11-26 2019-11-26 一种医疗病历标注平台及其操作方法

Publications (1)

Publication Number Publication Date
CN112951353A true CN112951353A (zh) 2021-06-11

Family

ID=76224810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911171271.2A Pending CN112951353A (zh) 2019-11-26 2019-11-26 一种医疗病历标注平台及其操作方法

Country Status (1)

Country Link
CN (1) CN112951353A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101142A1 (zh) * 2015-12-17 2017-06-22 安宁 一种医学图像标注方法及***
CN109684468A (zh) * 2018-12-13 2019-04-26 四川大学 针对循证医学的文献筛选标注平台
CN110096480A (zh) * 2019-03-28 2019-08-06 厦门快商通信息咨询有限公司 一种文本标注***、方法及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101142A1 (zh) * 2015-12-17 2017-06-22 安宁 一种医学图像标注方法及***
CN109684468A (zh) * 2018-12-13 2019-04-26 四川大学 针对循证医学的文献筛选标注平台
CN110096480A (zh) * 2019-03-28 2019-08-06 厦门快商通信息咨询有限公司 一种文本标注***、方法及存储介质

Similar Documents

Publication Publication Date Title
CN111708773B (zh) 一种多源科创资源数据融合方法
CN114616572A (zh) 跨文档智能写作和处理助手
US6356903B1 (en) Content management system
CN111916161B (zh) 用于临床试验过程中多数据源采集转换的方法及装置
US7802183B1 (en) Electronic record management system
US7492949B1 (en) Process and system for the semantic selection of document templates
CN104239073B (zh) 一种数据维护***快速原型开发***及方法
CN108564991A (zh) 基于icd的数据化编码病历错误识别***及其识别方法
CN106445536A (zh) 自动化业务设计管理***
US11880650B1 (en) Smart detection of and templates for contract edits in a workflow
CN112836018A (zh) 应急预案的处理方法及装置
CN113886606B (zh) 一种基于知识图谱的数据标注方法、装置、介质及设备
Cui et al. Introducing Explorer of Taxon Concepts with a case study on spider measurement matrix building
CN111739617A (zh) 医疗影像人工智能质控标注方法、装置、设备及存储介质
CN113241140A (zh) 保留电子病历编辑痕迹的处理方法
CN107895592A (zh) 医嘱流程配置方法及电子设备
CN112951353A (zh) 一种医疗病历标注平台及其操作方法
CN114861646A (zh) 一种面向医学垂直领域的数据标注平台
Sinha et al. Interactive software for generation and visualization of structured findings in radiology reports
Matsumura et al. A strategy for reusing the data of electronic medical record systems for clinical research
de Almeida Falbo et al. Semantic Documentation in Requirements Engineering.
CN113408290A (zh) 一种针对中文文本的智能标注方法及***
CN117332761B (zh) 一种pdf文档智能识别标注***
Iwashokun et al. Structural vetting of academic proposals
CN115757823B (zh) 数据处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611