CN109558398B - 基于大数据的数据清洗方法及相关装置 - Google Patents

基于大数据的数据清洗方法及相关装置 Download PDF

Info

Publication number
CN109558398B
CN109558398B CN201811287633.XA CN201811287633A CN109558398B CN 109558398 B CN109558398 B CN 109558398B CN 201811287633 A CN201811287633 A CN 201811287633A CN 109558398 B CN109558398 B CN 109558398B
Authority
CN
China
Prior art keywords
medical data
data set
medical
target
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811287633.XA
Other languages
English (en)
Other versions
CN109558398A (zh
Inventor
陈柏青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Shenzhen Ping An Medical Health Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ping An Medical Health Technology Service Co Ltd filed Critical Shenzhen Ping An Medical Health Technology Service Co Ltd
Priority to CN201811287633.XA priority Critical patent/CN109558398B/zh
Publication of CN109558398A publication Critical patent/CN109558398A/zh
Application granted granted Critical
Publication of CN109558398B publication Critical patent/CN109558398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种基于大数据的数据清洗方法及相关装置,该方法包括:从目标医疗机构的医疗数据库中获取预设时段内目标医疗机构的第一医疗数据集;对第一医疗数据集进行数据格式转换,得到第一医疗数据集对应的第二医疗数据集,第二医疗数据集中的医疗数据的数据格式相同;根据预先存储的分类策略对第二医疗数据集进行分类,得到第二医疗数据集对应的至少一个第三医疗数据集;对至少一个第三医疗数据集进行数据清洗,得到至少一个第三医疗数据集对应的至少一个目标医疗数据集。采用本申请实施例实现了对医疗数据集进行有效的清洗,在一定程度上提高了数据清洗的效率。

Description

基于大数据的数据清洗方法及相关装置
技术领域
本申请涉及大数据技术领域,具体涉及一种基于大数据的数据清洗方法及相关装置。
背景技术
目前,由于医疗机构的就医人数在持续增加,导致医疗机构存储的医疗数据也不断增加。为了得到需要的医疗数据,需要对医疗数据进行数据清洗。通常,对大量的医疗数据进行数据清洗时,由于大量的医疗数据对应多个数据格式,因此需要多套数据清洗算法对大量的医疗数据进行数据清洗,同时增加了服务器的处理压力。
发明内容
本申请实施例提供一种基于大数据的数据清洗方法及相关装置,用于对医疗数据集进行有效的清洗,在一定程度上提高了数据清洗的效率。
第一方面,本申请实施例提供一种基于大数据的数据清洗方法,所述方法包括:
从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;
根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
第二方面,本申请实施例提供一种基于大数据的数据清洗装置,所述装置包括:
获取单元,用于从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
转换单元,用于对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;
分类单元,用于根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
清洗单元,用于对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
第三方面,本申请实施例提供一种服务器,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面所述的方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质用于存储电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。
可以看出,在本申请实施例中,服务器首先从目标医疗机构的医疗数据库中获取预设时段内目标医疗机构的第一医疗数据集,然后对第一医疗数据集进行数据格式转换,得到第二医疗数据集,进而根据预先存储的分类策略对第二医疗数据集进行分类,得到至少一个第三医疗数据集,最后对至少一个第三医疗数据集进行数据清洗,得到至少一个目标医疗数据集。这样实现了对医疗数据集进行有效的清洗,由于第二医疗数据集中的医疗数据的数据格式相同,因此在一定程度上提高了数据清洗的效率。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1A是本申请实施例提供的第一种基于大数据的数据清洗方法的流程示意图;
图1B是本申请实施例提供的一种示意图;
图1C是本申请实施例提供的另一种示意图;
图2是本申请实施例提供的第二种基于大数据的数据清洗方法的流程示意图;
图3是本申请实施例提供的第三种基于大数据的数据清洗方法的流程示意图;
图4是本申请实施例提供的一种基于大数据的数据清洗装置的结构示意图;
图5是本申请实施例提供的一种服务器的流程示意图。
具体实现方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
以下分别进行详细说明。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
服务器,也称伺服器,是提供计算服务的设备。服务器的构成包括处理器、硬盘、内存、***总线等,和通用的计算机架构类似。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器,WEB服务器等。
下面对本申请实施例进行详细介绍。
请参阅图1A,图1A是本申请实施例提供的第一种基于大数据的数据清洗方法的流程示意图,该基于大数据的数据清洗方法包括:
步骤101:服务器从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集。
其中,预设时段的终止时刻可以是当前***时刻,预设时段的时长可以是3天、5天、7天、10天、15天或者是其他值。
其中,第一医疗数据集包括多个医疗数据,每个医疗数据对应一个标签,每个标签代表一个医疗项目,每个医疗项目对应至少一个清洗流程。
在一个可能的示例中,服务器从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集,包括:
服务器接收医疗数据清洗平台发送的指示信息,所述指示信息用于指示服务器获取预设时段内目标医疗机构的第一医疗数据集;
服务器向所述目标医疗机构的服务器发送请求信息,所述请求信息用于指示所述目标医疗机构的服务器反馈其医疗数据库中存储的所述预设时段内的多个医疗数据;
服务器接收所述目标医疗机构的服务器针对所述请求信息发送的所述多个医疗数据,以及将所述多个医疗数据组成的集合作为所述目标医疗机构的第一医疗数据集。
其中,医疗数据清洗平台与服务器具有连接关系,服务器与目标医疗机构的服务器具有连接关系。
进一步地,当医疗数据清洗平台的数据清洗功能处于开启状态时,医疗数据清洗平台在其显示界面显示时段选择框、医疗机构选择框和数据清洗按钮,时段选择框包括起始时段标识、起始时段输入框、终止时段标识和终止时段输入框,医疗机构选择框包括地区标识、地区输入框、医疗机构标识和医疗机构输入框,如图1B所示;医疗数据清洗平台检测到针对预设时段内目标医疗机构的数据清洗按钮的点击操作。
举例来说,如图1C所示,当检测到针对预设时段内目标医疗机构的数据清洗按钮的点击操作时,医疗数据清洗平台向服务器发送指示信息,指示信息用于指示服务器获取预设时段内目标医疗机构的第一医疗数据集,服务器接收指示信息,并向目标医疗机构的服务器发送请求信息,服务器接收目标医疗机构的服务器发送的预设时段内目标医疗机构的100个医疗数据。
步骤102:服务器对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同。
在一个可能的示例中,服务器对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,包括:
服务器识别所述第一医疗数据集包括的多个医疗数据中每个医疗数据的数据格式;
服务器将所述多个医疗数据中每个医疗数据的数据格式转换成目标数据格式,得到所述多个医疗数据对应的多个第一医疗数据;
服务器将所述多个第一医疗数据组成的集合作为第二医疗数据集。
具体地,服务器识别第一医疗数据集包括的多个医疗数据中每个医疗数据的数据格式的实施方式可以是:将第一医疗数据集包括的多个医疗数据中每个医疗数据输入数据格式模型;解析医疗数据,得到医疗数据对应的第一特征信息;将第一特征信息与数据格式模型所存储的特征信息库中所有特征信息进行比对;若第一特征信息与目标特征信息匹配,则确定目标特征信息对应的数据格式为医疗数据的数据格式。
其中,目标数据格式为JS对象简谱格式,也称为JSON格式。
具体地,服务器将多个医疗数据中每个医疗数据的数据格式转换成目标数据格式,得到多个医疗数据对应的多个第一医疗数据的实施方式可以是:
若医疗数据的数据格式为XML格式,则将医疗数据映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为JSON格式,则将医疗数据映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为MML格式,则将医疗数据映射成Map键值对,将Map键值对映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据。
步骤103:服务器根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集。
在一个可能的示例中,服务器根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,包括:
服务器解析所述第二医疗数据集包括的多个第一医疗数据中每个第一医疗数据,得到所述多个第一医疗数据中每个第一医疗数据的标签,所述标签用于表征第一医疗数据所属医疗项目;
服务器根据标签将所述第二医疗数据集包括的多个第一医疗数据进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,每个第三医疗数据集中的第一医疗数据的标签相同。
其中,医疗项目是指医生为参保人诊断时所作出的相应医嘱,例如开启药品、验血、做CT等。
步骤104:服务器对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
在一个可能的示例中,服务器对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集,包括:
服务器解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目;
服务器根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程;
服务器根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
其中,医疗项目与数据清洗流程的映射关系如表1所示:
表1
医疗项目 数据清洗流程
医疗项目1 清洗流程1、清洗流程2、清洗流程3
医疗项目2 清洗流程1、清洗流程3、清洗流程4
医疗项目3 清洗流程2、清洗流程3、清洗流程4
…… ……
其中,不同医疗项目各自对应的至少一个清洗流程中存在至少一个清洗流程是相同的。
在一个可能的示例中,服务器根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集,包括:
服务器解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间;
服务器将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列;
服务器依次采用每个所述第三医疗数据集对应的至少一个目标清洗流程中每个目标清洗流程对所述医疗数据队列进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
其中,服务器每次进行数据清洗均采用第三医疗数据集对应的至少一个目标清洗流程中的一个目标清洗流程对医疗数据队列包括的所有第一医疗数据进行数据清洗。
举例来说,假设第三医疗数据集对应医疗项目1,第三医疗数据集包括第一医疗数据1、第一医疗数据2和第一医疗数据3,第一医疗数据1对应8月12号,第一医疗数据2对应8月5号,第一医疗数据3对应8月23号,服务器根据表1可知医疗项目1对应清洗流程1、清洗流程2、清洗流程3,服务器按照就诊时间的先后确定医疗数据队列为第一医疗数据2、第一医疗数据1、第一医疗数据3,服务器采用清洗流程1对第一医疗数据2、第一医疗数据1、第一医疗数据3进行数据清洗,服务器采用清洗流程2对第一医疗数据2、第一医疗数据1、第一医疗数据3进行数据清洗,服务器采用清洗流程3对第一医疗数据2、第一医疗数据1、第一医疗数据3进行数据清洗,得到第三医疗数据集对应的目标医疗数据集。
在一个可能的示例中,服务器根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集,包括:
服务器解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间;
服务器将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列;
服务器采用每个所述第三医疗数据集对应的至少一个目标清洗流程依次对所述医疗数据队列中每个第一医疗数据进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
其中,服务器每次进行数据清洗均采用第三医疗数据集对应的至少一个目标清洗流程对医疗数据队列中的一个第一医疗数据进行数据清洗。
举例来说,假设第三医疗数据集对应医疗项目1,第三医疗数据集包括第一医疗数据1、第一医疗数据2和第一医疗数据3,第一医疗数据1对应8月12号,第一医疗数据2对应8月5号,第一医疗数据3对应8月23号,服务器根据表1可知医疗项目1对应清洗流程1、清洗流程2、清洗流程3,服务器按照就诊时间的先后确定医疗数据队列为第一医疗数据2、第一医疗数据1、第一医疗数据3,服务器采用清洗流程1、清洗流程2、清洗流程3对第一医疗数据2进行数据清洗,服务器采用清洗流程1、清洗流程2、清洗流程3对第一医疗数据1进行数据清洗,服务器采用清洗流程1、清洗流程2、清洗流程3对第一医疗数据3进行数据清洗,得到第三医疗数据集对应的目标医疗数据集。
可以看出,在本申请实施例中,服务器首先从目标医疗机构的医疗数据库中获取预设时段内目标医疗机构的第一医疗数据集,然后对第一医疗数据集进行数据格式转换,得到第二医疗数据集,进而根据预先存储的分类策略对第二医疗数据集进行分类,得到至少一个第三医疗数据集,最后对至少一个第三医疗数据集进行数据清洗,得到至少一个目标医疗数据集。这样实现了对医疗数据集进行有效的清洗,由于第二医疗数据集中的医疗数据的数据格式相同,因此在一定程度上提高了数据清洗的效率。
在一个可能的示例中,服务器对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集之后,所述方法还包括:
服务器将所述至少一个目标医疗数据集存储至预设存储区域。
其中,预设存储区域为服务器中用于存储执行过数据清洗操作的医疗数据。
在一个可能的示例中,服务器对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集之后,所述方法还包括:
服务器将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集;
服务器将所述第四医疗数据集发送至所述目标医疗数据的服务器。
具体地,服务器将至少一个目标医疗数据集进行数据整合,得到至少一个目标医疗数据集对应的第四医疗数据集的实施方式可以是:确定至少一个目标医疗数据集的数量为第一数量;将待发送医疗数据集划分存储区域,得到第二数量的存储区域,第二数量与第一数量相等;将至少一个目标医疗数据集存储至第二数量的存储区域,并显示至少一个目标医疗数据集中每个医疗数据集对应的标签;将待发送医疗数据集作为第四医疗数据集。
请参阅图2,图2是本申请实施例提供的第二种基于大数据的数据清洗方法的流程示意图,该基于大数据的数据清洗方法包括:
步骤201:服务器从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集。
步骤202:服务器识别所述第一医疗数据集包括的多个医疗数据中每个医疗数据的数据格式。
步骤203:服务器将所述多个医疗数据中每个医疗数据的数据格式转换成目标数据格式,得到所述多个医疗数据对应的多个第一医疗数据。
步骤204:服务器将所述多个第一医疗数据组成的集合作为第二医疗数据集。
步骤205:服务器解析所述第二医疗数据集包括的多个第一医疗数据中每个第一医疗数据,得到所述多个第一医疗数据中每个第一医疗数据的标签,所述标签用于表征第一医疗数据所属医疗项目。
步骤206:服务器根据标签将所述第二医疗数据集包括的多个第一医疗数据进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,每个第三医疗数据集中的第一医疗数据的标签相同。
步骤207:服务器解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目。
步骤208:服务器根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程。
步骤209:服务器根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
步骤210:服务器将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集。
步骤211:服务器将所述第四医疗数据集发送至所述目标医疗数据的服务器。
需要说明的是,图2所示的方法的各个步骤的具体实现过程可参见上述方法所述的具体实现过程,在此不再叙述。
请参阅图3,图3是本申请实施例提供的第三种基于大数据的数据清洗方法的流程示意图,该基于大数据的数据清洗方法包括:
步骤301:服务器从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集。
步骤302:服务器对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同。
步骤303:服务器根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集。
步骤304:服务器解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目。
步骤305:服务器根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程。
步骤306:服务器解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间。
步骤307:服务器将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列。
步骤308:服务器依次采用每个所述第三医疗数据集对应的至少一个目标清洗流程中每个目标清洗流程对所述医疗数据队列进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
步骤309:服务器将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集。
步骤310:服务器将所述第四医疗数据集发送至所述目标医疗数据的服务器。
需要说明的是,图3所示的方法的各个步骤的具体实现过程可参见上述方法所述的具体实现过程,在此不再叙述。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,基于大数据的数据清洗装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对基于大数据的数据清洗装置进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图4,图4是本申请实施例提供的一种基于大数据的数据清洗装置的结构示意图,该基于大数据的数据清洗装置400包括处理单元401、存储单元402和通信单元403,处理单元401包括获取单元、转换单元、分类单元和清洗单元,其中:
获取单元,用于从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
转换单元,用于对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;
分类单元,用于根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
清洗单元,用于对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
可见,在本申请示例中,首先从目标医疗机构的医疗数据库中获取预设时段内目标医疗机构的第一医疗数据集,然后对第一医疗数据集进行数据格式转换,得到第二医疗数据集,进而根据预先存储的分类策略对第二医疗数据集进行分类,得到至少一个第三医疗数据集,最后对至少一个第三医疗数据集进行数据清洗,得到至少一个目标医疗数据集。这样实现了对医疗数据集进行有效的清洗,由于第二医疗数据集中的医疗数据的数据格式相同,因此在一定程度上提高了数据清洗的效率。
在一个可能的示例中,在从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集方面,上述获取单元具体用于:
接收医疗数据清洗平台发送的指示信息,所述指示信息用于指示服务器获取预设时段内目标医疗机构的第一医疗数据集;
向所述目标医疗机构的服务器发送请求信息,所述请求信息用于指示所述目标医疗机构的服务器反馈其医疗数据库中存储的所述预设时段内的多个医疗数据;
接收所述目标医疗机构的服务器针对所述请求信息发送的所述多个医疗数据,以及将所述多个医疗数据组成的集合作为所述目标医疗机构的第一医疗数据集。
在一个可能的示例中,在对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集方面,上述转换单元具体用于:
识别所述第一医疗数据集包括的多个医疗数据中每个医疗数据的数据格式;
将所述多个医疗数据中每个医疗数据的数据格式转换成目标数据格式,得到所述多个医疗数据对应的多个第一医疗数据;
将所述多个第一医疗数据组成的集合作为第二医疗数据集。
在一个可能的示例中,在根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集方面,上述分类单元具体用于:
解析所述第二医疗数据集包括的多个第一医疗数据中每个第一医疗数据,得到所述多个第一医疗数据中每个第一医疗数据的标签,所述标签用于表征第一医疗数据所属医疗项目;
根据标签将所述第二医疗数据集包括的多个第一医疗数据进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,每个第三医疗数据集中的第一医疗数据的标签相同。
在一个可能的示例中,在对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集方面,上述清洗单元具体用于:
解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目;
根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程;
根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
在一个可能的示例中,在根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集方面,上述清洗单元具体用于:
解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间;
将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列;
依次采用每个所述第三医疗数据集对应的至少一个目标清洗流程中每个目标清洗流程对所述医疗数据队列进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
在一个可能的示例中,上述处理单元401还包括:
整合单元,用于将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集;
发送单元,用于将所述第四医疗数据集发送至所述目标医疗数据的服务器。
其中,处理单元401可以是处理器或控制器,(例如可以是中央处理器(CentralProcessing Unit,CPU),通用处理器,数字信号处理器(Digital Signal Processor,DSP),专用集成控制器(Application-Specific Integrated Circuit,ASIC),现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。存储单元402可以是存储器,通信单元403可以是收发器、收发控制器、射频芯片、通信接口等。
与上述图1A、图2和图3所示的实施例一致的,请参阅图5,图5是本申请实施例提供的一种服务器的结构示意图,该服务器包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:
从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;
根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
可见,在本示例中,服务器首先从目标医疗机构的医疗数据库中获取预设时段内目标医疗机构的第一医疗数据集,然后对第一医疗数据集进行数据格式转换,得到第二医疗数据集,进而根据预先存储的分类策略对第二医疗数据集进行分类,得到至少一个第三医疗数据集,最后对至少一个第三医疗数据集进行数据清洗,得到至少一个目标医疗数据集。这样实现了对医疗数据集进行有效的清洗,由于第二医疗数据集中的医疗数据的数据格式相同,因此在一定程度上提高了数据清洗的效率。
在一个可能的示例中,在从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集方面,上述程序包括具体用于执行以下步骤的指令:
接收医疗数据清洗平台发送的指示信息,所述指示信息用于指示服务器获取预设时段内目标医疗机构的第一医疗数据集;
向所述目标医疗机构的服务器发送请求信息,所述请求信息用于指示所述目标医疗机构的服务器反馈其医疗数据库中存储的所述预设时段内的多个医疗数据;
接收所述目标医疗机构的服务器针对所述请求信息发送的所述多个医疗数据,以及将所述多个医疗数据组成的集合作为所述目标医疗机构的第一医疗数据集。
在一个可能的示例中,在对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集方面,上述程序包括具体用于执行以下步骤的指令:
识别所述第一医疗数据集包括的多个医疗数据中每个医疗数据的数据格式;
将所述多个医疗数据中每个医疗数据的数据格式转换成目标数据格式,得到所述多个医疗数据对应的多个第一医疗数据;
将所述多个第一医疗数据组成的集合作为第二医疗数据集。
在一个可能的示例中,在根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集方面,上述程序包括具体用于执行以下步骤的指令:
解析所述第二医疗数据集包括的多个第一医疗数据中每个第一医疗数据,得到所述多个第一医疗数据中每个第一医疗数据的标签,所述标签用于表征第一医疗数据所属医疗项目;
根据标签将所述第二医疗数据集包括的多个第一医疗数据进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,每个第三医疗数据集中的第一医疗数据的标签相同。
在一个可能的示例中,在对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集方面,上述程序包括具体用于执行以下步骤的指令:
解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目;
根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程;
根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
在一个可能的示例中,在根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集方面,上述程序包括具体用于执行以下步骤的指令:
解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间;
将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列;
依次采用每个所述第三医疗数据集对应的至少一个目标清洗流程中每个目标清洗流程对所述医疗数据队列进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:
将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集;
将所述第四医疗数据集发送至所述目标医疗数据的服务器。
本申请实施例还提供一种计算机存储介质,该计算机存储介质用于存储电子数据交换的计算机程序,其中,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实现方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种基于大数据的数据清洗方法,其特征在于,所述方法包括:
从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;包括:
将第一医疗数据集包括的多个医疗数据中每个医疗数据输入数据格式模型;解析医疗数据,得到医疗数据对应的第一特征信息;将第一特征信息与数据格式模型所存储的特征信息库中所有特征信息进行比对;若第一特征信息与目标特征信息匹配,则确定目标特征信息对应的数据格式为医疗数据的数据格式;若医疗数据的数据格式为XML格式,则将医疗数据映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为JSON格式,则将医疗数据映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为MML格式,则将医疗数据映射成Map键值对,将Map键值对映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;将所述多个第一医疗数据组成的集合作为第二医疗数据集;
根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
2.根据权利要求1所述的方法,其特征在于,所述从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集,包括:
接收医疗数据清洗平台发送的指示信息,所述指示信息用于指示服务器获取预设时段内目标医疗机构的第一医疗数据集;
向所述目标医疗机构的服务器发送请求信息,所述请求信息用于指示所述目标医疗机构的服务器反馈其医疗数据库中存储的所述预设时段内的多个医疗数据;
接收所述目标医疗机构的服务器针对所述请求信息发送的所述多个医疗数据,以及将所述多个医疗数据组成的集合作为所述目标医疗机构的第一医疗数据集。
3.根据权利要求1所述方法,其特征在于,所述根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,包括:
解析所述第二医疗数据集包括的多个第一医疗数据中每个第一医疗数据,得到所述多个第一医疗数据中每个第一医疗数据的标签,所述标签用于表征第一医疗数据所属医疗项目;
根据标签将所述第二医疗数据集包括的多个第一医疗数据进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集,每个第三医疗数据集中的第一医疗数据的标签相同。
4.根据权利要求3所述的方法,其特征在于,所述对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集,包括:
解析所述至少一个第三医疗数据集中每个第三医疗数据集,得到所述至少一个第三医疗数据集中每个第三医疗数据集的对应的医疗项目;
根据医疗项目与数据清洗流程的映射关系确定所述至少一个第三医疗数据集中每个第三医疗数据集对应的至少一个目标清洗流程;
根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
5.根据权利要求4所述的方法,其特征在于,所述根据每个第三医疗数据集对应的至少一个目标清洗流程对每个所述第三医疗数据集进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集,包括:
解析每个所述第三医疗数据集,得到每个所述第三医疗数据集包括的至少一个第一医疗数据中每个第一医疗数据对应的就诊时间;
将所述至少一个第一医疗数据按照就诊时间的先后进行排序,得到所述至少一个第一医疗数据对应的医疗数据队列;
依次采用每个所述第三医疗数据集对应的至少一个目标清洗流程中每个目标清洗流程对所述医疗数据队列进行数据清洗,得到每个所述第三医疗数据集对应的目标医疗数据集。
6.根据权利要求5所述的方法,其特征在于,所述对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集之后,所述方法还包括:
将所述至少一个目标医疗数据集进行数据整合,得到所述至少一个目标医疗数据集对应的第四医疗数据集;
将所述第四医疗数据集发送至所述目标医疗数据的服务器。
7.一种基于大数据的数据清洗装置,其特征在于,所述装置包括:
获取单元,用于从目标医疗机构的医疗数据库中获取预设时段内所述目标医疗机构的第一医疗数据集;
转换单元,用于对所述第一医疗数据集进行数据格式转换,得到所述第一医疗数据集对应的第二医疗数据集,所述第二医疗数据集中的医疗数据的数据格式相同;包括:
将第一医疗数据集包括的多个医疗数据中每个医疗数据输入数据格式模型;解析医疗数据,得到医疗数据对应的第一特征信息;将第一特征信息与数据格式模型所存储的特征信息库中所有特征信息进行比对;若第一特征信息与目标特征信息匹配,则确定目标特征信息对应的数据格式为医疗数据的数据格式;若医疗数据的数据格式为XML格式,则将医疗数据映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为JSON格式,则将医疗数据映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;若医疗数据的数据格式为MML格式,则将医疗数据映射成Map键值对,将Map键值对映射成JSON字符串,将JSON字符串映射成JavaScript对象,形成JSON对象,得到医疗数据对应的第一医疗数据;将所述多个第一医疗数据组成的集合作为第二医疗数据集;
分类单元,用于根据预先存储的分类策略对所述第二医疗数据集进行分类,得到所述第二医疗数据集对应的至少一个第三医疗数据集;
清洗单元,用于对所述至少一个第三医疗数据集进行数据清洗,得到所述至少一个第三医疗数据集对应的至少一个目标医疗数据集。
8.一种服务器,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-6任一项所述的方法。
CN201811287633.XA 2018-10-31 2018-10-31 基于大数据的数据清洗方法及相关装置 Active CN109558398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811287633.XA CN109558398B (zh) 2018-10-31 2018-10-31 基于大数据的数据清洗方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811287633.XA CN109558398B (zh) 2018-10-31 2018-10-31 基于大数据的数据清洗方法及相关装置

Publications (2)

Publication Number Publication Date
CN109558398A CN109558398A (zh) 2019-04-02
CN109558398B true CN109558398B (zh) 2023-09-19

Family

ID=65865485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811287633.XA Active CN109558398B (zh) 2018-10-31 2018-10-31 基于大数据的数据清洗方法及相关装置

Country Status (1)

Country Link
CN (1) CN109558398B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916167B (zh) * 2019-05-09 2023-04-07 中国信息通信研究院 基于前置机***的医疗大数据处理方法和前置机***

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104717178A (zh) * 2013-12-13 2015-06-17 ***通信集团河南有限公司 一种信源数据的调用方法及装置
CN104766259A (zh) * 2015-03-31 2015-07-08 华据医疗评估信息技术(北京)有限公司 一种基于单病种模型的医疗临床质量监测与评价***
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理***及方法
CN105989052A (zh) * 2015-02-05 2016-10-05 海纳医信(北京)软件科技有限责任公司 医疗影像***及其数据处理方法和移动交换装置
CN106228270A (zh) * 2016-07-27 2016-12-14 广东工业大学 一种大数据驱动的挤压设备的能耗预测方法及其***
CN106874693A (zh) * 2017-03-15 2017-06-20 国信优易数据有限公司 一种医疗大数据分析处理***及方法
CN107103050A (zh) * 2017-03-31 2017-08-29 海通安恒(大连)大数据科技有限公司 一种大数据建模平台及方法
JP2017188000A (ja) * 2016-04-08 2017-10-12 国立大学法人 東京大学 医療情報検索システム、医療情報検索ゲートウェイ装置、医療情報検索方法及びプログラム
CN107368522A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种基于积分体系的大数据知识智库生成方法及***
CN107451416A (zh) * 2017-08-28 2017-12-08 昆明理工大学 一种sle的辅助诊断装置及方法
CN107832629A (zh) * 2017-11-03 2018-03-23 深圳市前海安测信息技术有限公司 区域医疗信息访问控制***及方法
CN108243236A (zh) * 2016-12-27 2018-07-03 四川智康科技有限责任公司 一种基于SignalR的中央监护***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090157630A1 (en) * 2007-10-26 2009-06-18 Max Yuan Method of extracting data and recommending and generating visual displays

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104717178A (zh) * 2013-12-13 2015-06-17 ***通信集团河南有限公司 一种信源数据的调用方法及装置
CN105989052A (zh) * 2015-02-05 2016-10-05 海纳医信(北京)软件科技有限责任公司 医疗影像***及其数据处理方法和移动交换装置
CN104766259A (zh) * 2015-03-31 2015-07-08 华据医疗评估信息技术(北京)有限公司 一种基于单病种模型的医疗临床质量监测与评价***
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理***及方法
JP2017188000A (ja) * 2016-04-08 2017-10-12 国立大学法人 東京大学 医療情報検索システム、医療情報検索ゲートウェイ装置、医療情報検索方法及びプログラム
CN106228270A (zh) * 2016-07-27 2016-12-14 广东工业大学 一种大数据驱动的挤压设备的能耗预测方法及其***
CN108243236A (zh) * 2016-12-27 2018-07-03 四川智康科技有限责任公司 一种基于SignalR的中央监护***
CN106874693A (zh) * 2017-03-15 2017-06-20 国信优易数据有限公司 一种医疗大数据分析处理***及方法
CN107103050A (zh) * 2017-03-31 2017-08-29 海通安恒(大连)大数据科技有限公司 一种大数据建模平台及方法
CN107368522A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种基于积分体系的大数据知识智库生成方法及***
CN107451416A (zh) * 2017-08-28 2017-12-08 昆明理工大学 一种sle的辅助诊断装置及方法
CN107832629A (zh) * 2017-11-03 2018-03-23 深圳市前海安测信息技术有限公司 区域医疗信息访问控制***及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
leveraging xml-based electronic medical records to extract experiential clinical knowledge:an automated approach to generate cases for medical case-based reasoning systems;Syed Sibte等;international journal of medical informatics;第68卷(第1-3期);187-203 *
医疗保险数据可视化***设计与实现;陈旭;杨鹤标;;软件导刊;第16卷(第06期);59-62 *
基于微博数据的应用研究综述;刘晓娟;尤斌;张爱芸;;情报杂志;第32卷(第09期);39-45 *

Also Published As

Publication number Publication date
CN109558398A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
CN109508218B (zh) App消息推送展示控制方法、装置、设备及存储介质
CN111933284B (zh) 一种并发症风险预测***、方法、装置、设备及介质
CN109492803A (zh) 基于人工智能的慢性病住院费用异常检测方法及相关装置
CN105095332B (zh) 信息处理装置和信息处理方法
CN114334169B (zh) 医疗对象的类别决策方法、装置、电子设备及存储介质
CN109598302B (zh) 就诊费用预测方法、装置、设备及计算机可读存储介质
CN109243592A (zh) 基于人工智能的医疗项目使用异常检测方法及相关装置
CN111986812A (zh) 一种基于互联网的妇产科疾病医疗诊治控制***
CN109558398B (zh) 基于大数据的数据清洗方法及相关装置
WO2020206586A1 (zh) 健康监测方法和***、打印终端、计算机可读存储介质
CN109544372B (zh) 基于人工智能的门诊慢性病资质监控方法及相关装置
US20170220525A1 (en) Method and apparatus for hierarchical data analysis based on mutual correlations
CN112017784A (zh) 一种基于多模态数据的冠心病风险预测方法及相关设备
CN108021941A (zh) 药物肝毒性预测方法及装置
CN111048165A (zh) 试验样本的确定方法及装置、计算机介质和电子设备
CN113780457B (zh) 中医资源消耗的异常检测方法、装置、设备及介质
CN111192643A (zh) 病历数据处理方法及相关设备
CN115966275A (zh) 检验检查结果互认方法、装置、存储介质以及电子设备
CN111128329A (zh) 个性化健康摘要的动态生成方法、装置、介质及电子设备
CN111161817B (zh) 医疗数据标准化处理方法、装置、介质及电子设备
CN114117080A (zh) 医嘱信息处理方法、装置、存储介质及电子装置
CN113780855A (zh) 医疗机构监管方法、装置、计算机设备及存储介质
CN110827979A (zh) 基于区块链的预测***及方法
CN114722977B (zh) 一种医疗对象分类方法、装置、电子设备及存储介质
CN109829829B (zh) 基于大数据的智能推荐方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220525

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant