CN111199050B - 一种用于对病历进行自动脱敏的***及应用 - Google Patents

一种用于对病历进行自动脱敏的***及应用 Download PDF

Info

Publication number
CN111199050B
CN111199050B CN201811378972.9A CN201811378972A CN111199050B CN 111199050 B CN111199050 B CN 111199050B CN 201811378972 A CN201811378972 A CN 201811378972A CN 111199050 B CN111199050 B CN 111199050B
Authority
CN
China
Prior art keywords
medical record
module
desensitized
sample
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811378972.9A
Other languages
English (en)
Other versions
CN111199050A (zh
Inventor
罗立刚
康悦
李津辰
罗翔凤
刘晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Original Assignee
Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zero Krypton Medical Intelligent Technology Guangzhou Co ltd filed Critical Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Priority to CN201811378972.9A priority Critical patent/CN111199050B/zh
Publication of CN111199050A publication Critical patent/CN111199050A/zh
Application granted granted Critical
Publication of CN111199050B publication Critical patent/CN111199050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种用于对病历进行自动脱敏的***及应用。所述***,包括:模板生成模块,用于将不同版面类型样本病历单进行分类,并按类型分别获取对应每一类型的敏感信息区域,以生成对应不同类型样本病历单的不同类型的病历模板;训练模块,用于将所述每一类病历模板对应的样本病历单输入至卷积神经网络中训练以获取用于对病历单进行分类的神经网络模型。脱敏模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板,并根据匹配的病历模板对所述待脱敏病历单进行待脱敏区域的标注以及脱敏处理,以获取脱敏处理后的病历。由上,本申请能够实现高效准确地对病历进行脱敏。

Description

一种用于对病历进行自动脱敏的***及应用
技术领域
本发明涉及模式识别、机器学习、卷积神经网络等技术领域,特别涉及一种用于对病历进行自动脱敏的***及应用。
背景技术
在处理病历及采集信息的过程中,为避免病人的隐私泄露,需要将一些敏感的私人信息模糊处理,如病人姓名,住址,联系方式等,以供其他非医疗人员(比如数据分析人员)学习调用信息。随着如今就医人数的增加及疾病种类的多样化,利用人工进行病历脱敏在效率与可靠性上都表现出了很大的局限性。由于不同医院及科室的病历单一般版面不同,缺乏统一出信息的结构标准。而如果直接利用现有的光标识别技术对病历全部内容进行识别进而进行脱敏处理,在识别相同的信息会被不断重复识别而造成不必要的耗时,且由于识别时比较粗略,识别的准确率有所欠缺。因此,现有技术不能够实现高效准确的对病历进行自动脱敏。
因此,目前亟需一种用于对病历进行自动脱敏的***,以实现高效准确的对病历进行自动脱敏。
发明内容
有鉴于此,本申请提供一种用于对病历进行自动脱敏的***,以实现高效准确的对病历进行脱敏。
本申请提供的用于对病历进行自动脱敏的***,包括:
模板生成模块,用于将不同版面类型样本病历单进行分类,并按类型分别获取对应每一类型的敏感信息区域,以生成对应不同类型样本病历单的不同类型的病历模板;
训练模块,用于将所述每一类病历模板对应的样本病历单输入至卷积神经网络中训练以获取用于对病历单进行分类的神经网络模型。
脱敏模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板,并根据匹配的病历模板对所述待脱敏病历单进行待脱敏区域的标注以及脱敏处理,以获取脱敏处理后的病历。
由上,本申请的自动脱敏***可以实现高效准确地对不同类型的病历进行自动脱敏,以避免病人的隐私泄露。既克服了现有技术中利用人工进行病历脱敏在效率与可靠性上的局限性的缺陷;又通过本申请的上述各个模块的功能,克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
优选地,所述模板生成模块,具体用于:
采集子模块,用于采集不同医院的不同版面类型的样本病历单;
标注子模块,用于标注出所述样本病历单中的敏感信息区域;
分类子模块,用于根据已标注的样本病历单中的不同版面结构及敏感信息区域所在位置将样本病历单分成不同类型的样本病历单;
记录子模块,用于记录每一类型样本病历单的被标注的敏感信息区域的坐标值;
模板生成子模块,用于对于每一类型样本病历单:根据每一类型样本病历单中的每个样本病历单的被标注的敏感信息区域的坐标值,将所含面积最大的敏感信息区域作为每一类型样本病历单的最终敏感信息区域,并将标注有所述最终敏感信息区域的样本病历单作为该类型样本病历单的病历模板。
由上,有利于生成对应不同类型样本病历单的不同类型的病历模板。其中,模板生成子模块,将所含面积最大的敏感信息区域作为每一类型病历模板的最终的敏感信息区域。有利于保证在对病历进行脱敏处理时,敏感信息能够充分包含在被脱敏的区域中。
优选地,所述模板生成模块,还包括:图像预处理子模块,用于对所述标注子模块标注后的样本病历单进行去噪与二值化处理。
由上,所述去噪处理能够去除与敏感信息无关的噪点,所述二值化处理有利于在对图像做进一步处理时,图像的集合性质只与像素值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。
优选地,所述模板生成模块,还包括:
样本扩充子模块,将所述记录子模块记录的每一类型的样本病历单进行仿射变换,以获取指定数量的样本病历单。
由上,有利于扩充用于训练的样本病历单的数量。
优选地,所述训练模块,具体用于:
将所述每一类型样本病历单及其所述类型输入至卷积神经网络的输入层;
所述卷积神经网络的卷积层提取所述样本病历单的特征图;
所述卷积神经网络的池化层对所述特征图进行压缩,以及用于提取主要特征;
所述卷积神经网络的全连接层用于对所述池化层提取的特征进行全连接或者全局平均处理,并进行分类处理以获取用于对病历单进行分类的神经网络模型。
由上,有利于生成用于针对不同版面类型病历单分类和初始待脱敏区域标注的神经网络模型。其中,将所含面积最大的敏感信息区域作为每一类型病历模板的最终的敏感信息区域。有利于保证在对病历进行脱敏处理时,敏感信息能够充分包含在被脱敏的区域中。
优选地,所述卷积神经网络的卷积层提取所述病历模板的特征图与所述样本病历单之间的映射关系式为:
xm=f(Σxm i*km ij+bm j)
其中,所述xm表示第m层的输出向量;所述xm i表示第m层第i个节点的输入向量;所述km ij表示第m层第i个节点需要训练的滤波器参数;所述bm j表示第m层第i个借口点需要训练的基;所述m表示当前层数;所述i表示当前节点;所述j表示当前层。
由上,有利于更好的提取所述病历模板的特征图。
优选地,所述卷积神经网络的全连接层的用于分类时的平方代价函数为:
EN=ΣNΣc(tk n-yk n)2
其中,所述N表示样本病历单的个数,所述EN表示输出的第N个样本医嘱单的类型;所述c表示病历模版的类型的数量,所述k表示所述样本病历单的版面类型及所述卷积神经网络的全连接层输出的病历模板类型上的维度。
由上,有利于获取最优的分类。
优选地,所述脱敏模块,具体包括:
匹配子模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板;
标注子模块,用于根据所述病历模板对所述带脱敏病历进行初始待脱敏区域的标注;
定位子模块,用于利用图像处理技术,对初始待脱敏区域进行精确定位;
脱敏子模块,用于对每个精确定位后的待脱敏区域进行单独的脱敏处理。
由上,本申请通过用于针对不同版面类型病历的特征提取的神经网络模型获取带脱敏的病历的初始待脱敏区域,并进一步精确定位及脱敏。克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
优选地,所述敏感信息至少包括但不限于以下其一:姓名、住址、联系方式。
由上,本申请敏感信息不限于上述信息,还包括其他的涉及个人隐私的信息。
基于上述***,本申请还提供一种对病历进行自动脱敏的方法,包括:
A、获取待脱敏的原始病历图片;
B、对所述待脱敏的原始病历图片进行图片质量判定,保留分辨率高于指定阈值的原始病历图片;
C、对所述原始病历图片进行去噪与二值化处理,以获取处理后的原始病历图片的二值图像;
D、根据所述原始病历图片的二值图像,通过所述用于对病历单进行分类的神经网络模型对所述原始病历图片进行分类以获取其所属的病历的类型;
E、根据所述病历的类型匹配对应的病历模板,并据此获取所述原始病历的初始待脱敏区域;
F、利用图像处理技术,对所述初始待脱敏区域进行精确定位,获取精确定位后的待脱敏区域;
G、对所述精确定位后的待脱敏区域进行脱敏处。
由上,本申请的上述方法可以实现高效准确地对不同类型的病历进行自动脱敏,以使得其它的非医务工作人员调用学习该病历信息时,避免病人的隐私泄露。既克服了现有技术中利用人工进行病历脱敏在效率与可靠性上的局限性的缺陷;同时,本申请还对原始病历进行分类以及对其进行初始待脱敏区域的定位,进一步的对其进行精确定位及脱敏处理,克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
综上所述,本申请提供的用于对病历进行自动脱敏的***及应用,可以实现高效准确地对不同类型的病历进行自动脱敏,以使得其它的非医务工作人员调用学习该病历信息时,避免病人的隐私泄露。既克服了现有技术中利用人工进行病历脱敏在效率与可靠性上的局限性的缺陷;又克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
附图说明
图1为本申请提供的一种用于对病历进行自动脱敏的***的结构示意图;
图2为本申请提供的一种用于对病历进行自动脱敏的***的模板生成模块和训练模块的原理示意图;
图3为本申请提供的一种对病历进行自动脱敏的方法的流程示意图;
图4为本申请提供的一种对病历进行自动脱敏的方法的流程示意图;
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步的详细说明。应当理解为此处所描述的具体实施例仅用以解释本发明,并不用于限制本发明的保护范围。
实施例一
如图1-2所示,本发明提供一种用于对病历进行自动脱敏的***,包括:
所述模板生成模块101,用于将不同版面类型样本病历单进行敏感信息区域标注生成对应不同类型样本病历单的不同类型的病历模板。其中所述图2中的A示出了模板生成模块101的原理图,具体地,所述模板生成模块具体包括:
采集子模块,用于采集不同医院的不同版面类型的样本病历单;
标注子模块,用于标注出所述样本病历单中的敏感信息区域;其中,所述敏感信息可以是:姓名、住址、联系方式,或者是其他的涉及个人隐私的信息。
分类子模块,用于根据已标注的样本病历单中的不同版面结构及敏感信息区域所在位置将样本病历单分成不同类型的样本病历单;
记录子模块,用于记录每一类型样本病历单的被标注的敏感信息区域的坐标值;
图像预处理子模块,用于对所述标注子模块标注后的样本病历单进行去噪与二值化处理,以获取处理后的样本病历单的二值图像。
模板生成子模块,用于对于每一类型样本病历单:根据每一类型样本病历单中的每个样本病历单的被标注的敏感信息区域的坐标值,将所含面积最大的敏感信息区域作为每一类型样本病历单的最终敏感信息区域,并将标注有所述最终敏感信息区域的样本病历单作为该类型样本病历单的病历模板。此处,将所含面积最大的敏感信息区域作为每一类型病历模板的最终的敏感信息区域。有利于保证在对病历进行脱敏处理时,敏感信息能够充分包含在被脱敏的区域中。
样本扩充子模块,将所述记录子模块记录的每一类型的样本病历单进行仿射变换,以获取指定数量的样本病历单。
训练模块102,用于将所述模板处理模块处理后的每一类病历模板分别输入至卷积神经网络中训练以获取用于针对不同版面类型病历的敏感信息提取的神经网络模型。其中所述图2中的B示出了训练模块102的原理图,具体地,所述训练模块,具体用于:
N1、将所述每一类型样本病历单及其所述类型输入至卷积神经网络的输入层;
N2、所述卷积神经网络的卷积层提取所述样本病历单的特征图;其中,所述卷积神经网络的卷积层提取所述病历模板的特征图与所述样本病历单之间的映射关系式为:
xm=f(Σxm i*km ij+bm j)
其中,所述xm表示第m层的输出向量;所述xm i表示第m层第i个节点的输入向量;所述km ij表示第m层第i个节点需要训练的滤波器参数;所述bm j表示第m层第i个借口点需要训练的基;所述m表示当前层数;所述i表示当前节点;所述j表示当前层。
N3、所述卷积神经网络的池化层对所述特征图进行压缩,以及用于提取主要特征;
N4、所述卷积神经网络的全连接层用于对所述池化层提取的特征进行全连接或者全局平均处理,并进行分类处理以获取用于对病历单进行分类的神经网络模型。
其中,所述卷积神经网络的全连接层的用于分类时的平方代价函数为:EN=ΣNΣc(tk n-yk n)2
其中,所述N表示样本病历单的个数,所述EN表示输出的第N个样本医嘱单的类型;所述c表示病历模版的类型的数量,所述k表示所述样本病历单的版面类型及所述卷积神经网络的全连接层输出的病历模板类型上的维度。
本申请的训练模块102采用有监督学习方法,通过反向传播算法对各层的初始参数进行训练,实现训练样本的特征提取。
脱敏模块103,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板,并根据匹配的病历模板对所述待脱敏病历单进行待脱敏区域的标注以及脱敏处理,以获取脱敏处理后的病历。具体包括:
匹配子模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板;
标注子模块,用于根据所述病历模板对所述带脱敏病历进行初始待脱敏区域的标注;
定位子模块,用于利用图像处理技术,对初始待脱敏区域进行精确定位;
脱敏子模块,用于对每个精确定位后的待脱敏区域进行单独的脱敏处理。
实施例二
基于实施例一中的用于对病历进行自动脱敏的***,本申请还提供一种对病历进行自动脱敏的方法,如图3-4所示,包括:
S301,获取待脱敏病历单;
S302,对所述待脱敏病历单进行图片质量判定,保留分辨率高于指定阈值的待脱敏病历单;
S303,对所述待脱敏病历单进行去噪与二值化处理;
S304,通过实施例一中训练模块102获取的用于对病历单进行分类的神经网络模型对S303中处理后的所述待脱敏病历单进行分类以获取其所属的病历单的类型;
S305,根据所述病历单的类型匹配其对应类型的病历模板,并据此获取所述原始病历的初始待脱敏区域;
S306,利用图像处理技术,对所述初始待脱敏区域进行精确定位,获取精确定位后的待脱敏区域;此处可以利用OCR识别技术进行进一步的精确定位。
S307,对所述精确定位后的待脱敏区域进行脱敏处理。此处可以使用加马赛克覆盖或者其它的方式将待脱敏区域进行隐藏或模糊处理,以实现对敏感隐私信息的脱敏处理,以避免病人的隐私泄露。
由上,本申请的上述方法可以实现高效准确地对不同类型的病历进行自动脱敏,以使得其它的非医务工作人员调用学习该病历信息时,避免病人的隐私泄露。既克服了现有技术中利用人工进行病历脱敏在效率与可靠性上的局限性的缺陷;同时,本申请还对原始病历进行分类以及对其进行初始待脱敏区域的定位,进一步的对其进行精确定位及脱敏处理,克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
综上所述,本申请提供的用于对病历进行自动脱敏的***及应用,可以实现高效准确地对不同类型的病历进行自动脱敏,以避免病人的隐私泄露。既克服了现有技术中利用人工进行病历脱敏在效率与可靠性上的局限性的缺陷;又克服了现有技术中的利用光标识别技术对进行病历脱敏时,由于需要对病历全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。
以上所述仅为本发明以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种用于对病历进行自动脱敏的***,其特征在于,包括:
模板生成模块,用于将不同版面类型样本病历单进行分类,并按类型分别获取对应每一类型的敏感信息区域,以生成对应不同类型样本病历单的不同类型的病历模板;
训练模块,用于将每一类所述病历模板对应的样本病历单输入至卷积神经网络中训练以获取用于对病历单进行分类的神经网络模型;
脱敏模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板,并根据匹配的病历模板对所述待脱敏病历单进行待脱敏区域的标注以及脱敏处理,以获取脱敏处理后的病历;
所述模板生成模块包括:
采集子模块,用于采集不同医院的不同版面类型的样本病历单;
标注子模块,用于标注出所述样本病历单中的敏感信息区域;
分类子模块,用于根据已标注的样本病历单中的不同版面结构及敏感信息区域所在位置将样本病历单分成不同类型的样本病历单;
记录子模块,用于记录每一类型样本病历单的被标注的敏感信息区域的坐标值;和
模板生成子模块,用于对于每一类型样本病历单:根据每一类型样本病历单中的每个样本病历单的被标注的敏感信息区域的坐标值,将能够覆盖当前类型的样本病历单的各个被标注的敏感信息区域的面积最大的敏感信息区域作为每一类型样本病历单的最终敏感信息区域,并将标注有所述最终敏感信息区域的样本病历单作为该类型样本病历单的病历模板;
所述脱敏模块包括:
匹配子模块,用于根据所述训练模块获取的神经网络模型获取的待脱敏病历单的类型匹配其对应的病历模板;
标注子模块,用于根据所述病历模板对所述待脱敏病历进行初始待脱敏区域的标注;
定位子模块,用于利用图像处理技术,对初始待脱敏区域进行精确定位;和
脱敏子模块,用于对每个精确定位后的待脱敏区域进行单独的脱敏处理。
2.根据权利要求1所述的***,其特征在于,所述模板生成模块,还包括:
图像预处理子模块,用于对所述标注子模块标注后的样本病历单进行去噪与二值化处理。
3.根据权利要求2所述的***,其特征在于,所述模板生成模块,还包括:
样本扩充子模块,将所述记录子模块记录的每一类型的样本病历单进行仿射变换,以获取指定数量的样本病历单。
4.根据权利要求3所述的***,其特征在于,所述训练模块包括输入子模块和一卷积神经网络:
所述输入子模块,用于将所述每一类型样本病历单及其所述类型输入至卷积神经网络的输入层;
所述卷积神经网络的卷积层用于提取所述样本病历单的特征图;
所述卷积神经网络的池化层用于对所述特征图进行压缩,以及用于提取主要特征;
所述卷积神经网络的全连接层用于对所述池化层提取的特征进行全连接或者全局平均处理,并进行分类处理以获取用于对病历单进行分类的神经网络模型。
5.根据权利要求1所述的***,其特征在于,所述敏感信息至少包括但不限于以下其一:姓名、住址、联系方式。
6.一种对病历进行自动脱敏的方法,基于权利要求1-5任一项所述的***,其特征在于,包括:
A、获取待脱敏病历单;
B、对所述待脱敏病历单进行图片质量判定,保留分辨率高于指定阈值的待脱敏病历单;
C、对所述待脱敏病历单进行去噪与二值化处理;
D、通过所述用于对病历单进行分类的神经网络模型对处理后的所述待脱敏病历单进行分类以获取其所属的病历单的类型;
E、根据所述病历单的类型匹配其对应类型的病历模板,并据此获取所述待脱敏病历单的初始待脱敏区域;
F、利用图像处理技术,对所述初始待脱敏区域进行精确定位,获取精确定位后的待脱敏区域;
G、对所述精确定位后的待脱敏区域进行脱敏处理。
CN201811378972.9A 2018-11-19 2018-11-19 一种用于对病历进行自动脱敏的***及应用 Active CN111199050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811378972.9A CN111199050B (zh) 2018-11-19 2018-11-19 一种用于对病历进行自动脱敏的***及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811378972.9A CN111199050B (zh) 2018-11-19 2018-11-19 一种用于对病历进行自动脱敏的***及应用

Publications (2)

Publication Number Publication Date
CN111199050A CN111199050A (zh) 2020-05-26
CN111199050B true CN111199050B (zh) 2023-10-17

Family

ID=70743973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811378972.9A Active CN111199050B (zh) 2018-11-19 2018-11-19 一种用于对病历进行自动脱敏的***及应用

Country Status (1)

Country Link
CN (1) CN111199050B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361254A (zh) * 2021-06-03 2021-09-07 重庆南鹏人工智能科技研究院有限公司 一种自动化电子病历解析方法与装置
CN116610659A (zh) * 2023-05-22 2023-08-18 南方医科大学南方医院 肝癌专病数据库构建方法、数据库、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239666A (zh) * 2017-06-09 2017-10-10 孟群 一种对医疗影像数据进行脱敏处理的方法及***
CN108831559A (zh) * 2018-06-20 2018-11-16 清华大学 一种中文电子病历文本分析方法与***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170039222A1 (en) * 2014-04-29 2017-02-09 Farrow Norris Pty Ltd Method and system for comparative data analysis
US10810317B2 (en) * 2017-02-13 2020-10-20 Protegrity Corporation Sensitive data classification
CN109920501B (zh) * 2019-01-24 2021-04-20 西安交通大学 基于卷积神经网络和主动学习的电子病历分类方法及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239666A (zh) * 2017-06-09 2017-10-10 孟群 一种对医疗影像数据进行脱敏处理的方法及***
CN108831559A (zh) * 2018-06-20 2018-11-16 清华大学 一种中文电子病历文本分析方法与***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
程健一 ; 关毅 ; 何彬 ; .基于SVM和CRF双层分类器的英文电子病历去隐私化.智能计算机与应用.2016,第6卷(第06期),17-24页. *
臧昊 ; 赵强 ; 卞水荣 ; .基于XML的电子病历隐私数据脱敏技术的研究与设计.信息技术与信息化.2017,(03),111-114页. *

Also Published As

Publication number Publication date
CN111199050A (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
CN109086756B (zh) 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109858555B (zh) 基于图像的数据处理方法、装置、设备及可读存储介质
CN110210413B (zh) 一种基于深度学习的多学科试卷内容检测与识别***及方法
CN111695392B (zh) 基于级联的深层卷积神经网络的人脸识别方法及***
CN112507934B (zh) 活体检测方法、装置、电子设备及存储介质
CN112861575A (zh) 一种行人结构化方法、装置、设备和存储介质
CN112862024B (zh) 一种文本识别方法及***
Chandran et al. Missing child identification system using deep learning and multiclass SVM
CN108986137B (zh) 人体跟踪方法、装置及设备
CN111008576A (zh) 行人检测及其模型训练、更新方法、设备及可读存储介质
CN111401322A (zh) 进出站识别方法、装置、终端及存储介质
CN111199050B (zh) 一种用于对病历进行自动脱敏的***及应用
CN113837151A (zh) 表格图像处理方法、装置、计算机设备及可读存储介质
CN113255557A (zh) 一种基于深度学习的视频人群情绪分析方法及***
CN110895661A (zh) 一种行为识别方法、装置及设备
CN110969173B (zh) 目标分类方法及装置
CN113076860B (zh) 一种野外场景下的鸟类检测***
CN112396060B (zh) 基于身份证分割模型的身份证识别方法及其相关设备
CN112417974A (zh) 一种公共卫生监控方法
CN115984968A (zh) 一种学生时空动作识别方法、装置、终端设备及介质
CN111209924B (zh) 一种用于对医嘱进行自动提取的***及应用
CN115311664A (zh) 图像中文本类别的识别方法、装置、介质及设备
CN111291758B (zh) 用于识别***文字的方法和装置
CN111062388B (zh) 基于深度学习的广告文字的识别方法、***、介质及设备
Bhatt et al. Text Extraction & Recognition from Visiting Cards

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant