CN110299208A - 疾病监测数据异常检测方法、***、设备及存储介质 - Google Patents

疾病监测数据异常检测方法、***、设备及存储介质 Download PDF

Info

Publication number
CN110299208A
CN110299208A CN201910430065.2A CN201910430065A CN110299208A CN 110299208 A CN110299208 A CN 110299208A CN 201910430065 A CN201910430065 A CN 201910430065A CN 110299208 A CN110299208 A CN 110299208A
Authority
CN
China
Prior art keywords
data
doubtful
abnormal
morbidity statistics
morbidity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910430065.2A
Other languages
English (en)
Inventor
李弦
阮晓雯
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910430065.2A priority Critical patent/CN110299208A/zh
Publication of CN110299208A publication Critical patent/CN110299208A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明适用计算机技术领域,提供了一种疾病监测数据异常检测方法、***、设备及存储介质,该方法包括:在获得在指定区间内离散分布的当前疾病统计数据后,利用疑似异常数据检测策略,从当前疾病统计数据中筛选得到疑似异常数据;再利用修正策略,从疑似异常数据中筛选得到非异常数据,以最终从当前疾病统计数据中筛选得到异常数据或正常数据。这样,可有效地区分正常数据和异常数据,使最终取用的数据可参考性得到大幅提升,从而正确引导后续防控等相关工作,保证防控效果。

Description

疾病监测数据异常检测方法、***、设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种疾病监测数据异常检测方法、***、设备及存储介质。
背景技术
目前,进行流感等疾病的流行形势的了解,通常是通过:在哨点医院或卫生防疫站等按周收集相应的流感样病例数据,然后进行统计分析,获得相应的流感流行形势数据。流感流行形势数据可提供给相关疾控专家或医生等进行参考,从而进行流感的防控,并指导哨点医院或卫生防疫站的数据收集工作。
但是,由于所采集的流感样病例数据可能会因为人为失误或偶然因素出现异常情况,从而使得流感样病例数据和/或流感流行形势数据的可参考性降低,并且由于数据中的异常情况通常是容易被关注或需要被重点关注的,因此,可能会对后期相关疾控专家或医生的防控措施或指导工作进行错误的引导,从而起不到相应的防控效果甚至会带来负面效果。
发明内容
本发明的目的在于提供一种疾病监测数据异常检测方法、***、设备及存储介质,旨在解决现有技术所存在的、因未排除异常数据而导致的数据可参考性不高的问题。
一方面,本发明提供了一种疾病监测数据异常检测方法,所述方法包括:
获得在指定区间内离散分布的当前疾病统计数据;
利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据;
利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据。
进一步的,利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据,具体包括:
根据所述当前疾病统计数据中指定范围内的当前部分疾病统计数据,得到用于反映在所述当前部分疾病统计数据中、一当前点疾病统计数据与相邻点疾病统计数据之间实际变化程度的当前变化程度指示数据;
当所述当前变化程度指示数据小于预设阈值时,以所述当前点疾病统计数据作为所述疑似异常数据。
进一步的,根据所述当前疾病统计数据中指定范围内的当前部分疾病统计数据,得到用于反映在所述当前部分疾病统计数据中、一当前点疾病统计数据与相邻点疾病统计数据之间实际变化程度的当前变化程度指示数据,具体包括:
对所述当前部分疾病统计数据求得第一方差以及第一平均值;
将所述第一方差与所述第一平均值的商作为所述当前变化程度指示数据。
进一步的,利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据,具体包括:
根据与所述指定区间相应的一对应区间内离散分布的历史疾病统计数据,得到用于判断所述当前疾病统计数据中当前点疾病统计数据是否过高或过低的第一门限数据;
当所述当前点疾病统计数据超过所述第一门限数据要求时,以所述当前点疾病统计数据作为所述疑似异常数据。
进一步的,根据与所述指定区间相应的一对应区间内离散分布的历史疾病统计数据,得到用于判断所述当前疾病统计数据中当前点疾病统计数据是否过高或过低的第一门限数据,具体包括:
对所述历史疾病统计数据中、与所述当前点疾病统计数据位置对应的第一历史部分疾病统计数据赋予相对高权重,对所述历史疾病统计数据中、远离所述第一历史部分疾病统计数据的第二历史部分疾病统计数据赋予相对低权重,得到中间数据;
计算所述中间数据的第二方差及第二平均值;
以所述第二平均值与第一浮动值的和作为所述第一门限数据,所述第一浮动值为所述第二方差的合理倍数。
进一步的,利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据,具体包括:
获得与所述指定区间相应的至少两个对应区间内离散分布的多个历史疾病统计数据中、与所述疑似异常数据中的当前点疑似异常数据位置对应的第一历史部分疾病统计数据;
计算多个所述历史疾病统计数据中的所述第一历史部分疾病统计数据的第三方差及第三平均值;
以所述第三平均值与第二浮动值的和作为第二门限数据,所述第二浮动值为所述第三方差的合理倍数;
当所述当前点疑似异常数据未超过所述第二门限数据要求时,以所述当前点疑似异常数据作为所述非异常数据。
进一步的,一所述当前疾病统计数据由一数据统计站统计所得,利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据,具体包括:
获得从同一区域内至少两个所述数据统计站统计所得的、至少两份所述当前疾病统计数据;
当由部分份或全部份所述当前疾病统计数据经由所述疾病数据异常检测方法所得结果相同或类似时,确认以所述疑似异常数据作为所述异常数据。
另一方面,本发明还提供了一种疾病监测数据异常检测***,所述***包括:
获取单元,用于获得在指定区间内离散分布的当前疾病统计数据;
第一筛选单元,用于利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据;以及,
第二筛选单元,用于利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据。
另一方面,本发明还提供了一种计算设备,包括存储器及处理器,所述处理器执行所述存储器中存储的计算机程序时实现如上述方法中的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中的步骤。
本发明在获得在指定区间内离散分布的当前疾病统计数据后,利用疑似异常数据检测策略,从当前疾病统计数据中筛选得到疑似异常数据;再利用修正策略,从疑似异常数据中筛选得到非异常数据,以最终从当前疾病统计数据中筛选得到异常数据或正常数据。这样,可有效地区分正常数据和异常数据,使最终取用的数据可参考性得到大幅提升,从而正确引导后续防控等相关工作,保证防控效果。
附图说明
图1是本发明实施例一提供的疾病监测数据异常检测方法的实现流程图;
图2是本发明实施例二中步骤S102的细化流程图;
图3是本发明实施例二中当前变化程度指示数据的一获取方式示意图;
图4是本发明实施例二中当前变化程度指示数据的另一获取方式示意图;
图5是本发明实施例三中步骤S102的细化流程图;
图6是本发明实施例三中步骤S501的细化流程图;
图7是本发明实施例四中步骤S103的细化流程图;
图8是本发明实施例五中步骤S103的细化流程图;
图9是本发明实施例六提供的疾病监测数据异常监测***的结构示意图;
图10是本发明实施例七提供的计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
本申请所涉及的疾病监测数据异常检测方法,主要可先从疾病统计数据中识别出疑似异常数据,再对疑似异常数据进行修正,排除疑似异常数据中所确认的非异常数据,最终从当前疾病统计数据中筛选得到异常数据或正常数据,从而有效地区分正常数据和异常数据,使最终取用的数据可参考性得到大幅提升,从而正确引导后续防控等相关工作,保证防控效果。
实施例一:
如图1所示,本实施例的疾病监测数据异常检测方法主要可由一数据处理***实现,主要包括:
步骤S101,获得在指定区间内离散分布的当前疾病统计数据。
具体的,哨点医院或卫生防疫站等数据统计站采集得到疾病统计数据后,可将疾病统计数据录入到数据处理***中进行处理。
疾病统计数据为在指定区间离散分布的数据,例如:可为日粒度数据或周粒度数据等。指定区间可以是包含当前时间点的、一定周期内的数据,也可以是包含某一历史时间点的、一定周期内的数据,当前时间点通常是指当下进行数据处理的时间点,当前疾病统计数据通常是指当下数据处理所针对的疾病统计数据。例如:指定区间可以是当前时间点往前一年内的数据、当前时间点前后6个月内的数据、历史时间点往前半年内的数据或历史时间点到当前时间点之间的数据等。
疾病统计数据通常可为某一哨点医院或卫生防疫站等采集得到的疾病样病例数量数据、疾病样病例百分比数据、疾病病毒阳性检测率数据等。本方法针对流感等流行性疾病有更为明显的效果。
步骤S102,利用疑似异常数据检测策略,从当前疾病统计数据中筛选得到疑似异常数据。
具体的,步骤S102主要是根据一预先设定的数据处理策略,从当前疾病统计数据中对疑似异常数据或正常数据进行筛选,从而从当前疾病统计数据中区分正常数据以及疑似异常数据。是否是正常数据或疑似异常数据,是由数据处理***通过处理能够自行区分的。
在本申请中,正常数据与疑似异常数据是相对的并且确定的概念,数据处理***筛选出的正常数据能够基本或完全反映出该些数据并未出现人为失误或偶然因素等所造成的异常情况,而数据处理***筛选出的疑似异常数据能够基本或者完全反映出该些数据疑似由人为失误或偶然因素等造成了异常。
正常数据通常可表现为:在某一选定周期(区间)内,连续采集的数据存在一定的波动而不会异常的平稳,相应的,疑似异常数据通常可表现为:相对于正常数据而言,出现了异常平稳的情况;或者,正常数据通常可表现为:所采集的数据一般不会出现超过正常范围的异常极值,相应的,疑似异常数据通常可表现为:相对于正常数据而言,出现了异常极值。其他正常、异常情况同样可同理理解,并类似适用本申请实施例的数据处理方案。正因如此,数据处理***就能确定相应的数据处理策略,进行较为精准的数据筛选。
步骤S103,利用修正策略,从疑似异常数据中筛选得到非异常数据,以最终从当前疾病统计数据中筛选得到异常数据或正常数据。
具体的,步骤S103主要根据另一预先设定的数据处理策略,从疑似异常数据中对非异常数据或真正的异常数据进行筛选,从而从疑似异常数据中进一步区分非异常数据以及真正的异常数据。是否是非异常数据或真正的异常数据,同样是由数据处理***通过处理能够自行区分的。
在本申请中,非异常数据与真正的异常数据是相对的并且确定的概念,数据处理***筛选出的非异常数据能够基本或完全反映出该些数据虽然表现出疑似异常地特征但并未真正出现人为失误或偶然因素等所造成的异常情况,而数据处理***筛选出的真正的异常数据能够基本或者完全反映出该些数据确认是由人为失误或偶然因素等造成了异常。
相对于疑似异常数据中真正的异常数据而言,其中的非异常数据通常还表现出:对于多个选定周期(区间)(一般是历史同期),数据存在周期性突变情况,也即在每一选定周期均会发生类似的突变情况(例如:流感周期性爆发或春节期间就诊人数周期性偏低),从而出现超过正常范围的异常极值,但这些突变情况是真实发生的,相应产生的异常极值应当被从疑似异常数据中排除而应当被认为是非异常数据,相应的,其他剩下的、非周期性突变情况所对应的疑似异常数据则相应可被认为是真正的异常数据;或者,相对于疑似异常数据中真正的异常数据而言,其中的非异常数据通常还表现出:对于同一区域内多个数据统计站统计得到同期的疾病统计数据而言,如果每个数据统计站统计所得数据均存在基本同时发生的、类似的突变情况,而出现超过正常范围的异常极值,但由于这些突变情况是真实发生的,相应产生的异常极值应当被从疑似异常数据中排除而应当被认为是非异常数据,相应的,其他剩下的、不能得到其他数据统计站统计所得对应数据证明并非异常数据的疑似异常数据则相应可被认为是真正的异常数据。同样,正因如此,数据处理***就能确定相应的数据处理策略,进行较为精准的数据筛选。
实施本实施例,利用数据处理***,可对当前疾病统计数据进行疑似异常数据的识别,再对疑似异常数据进行修正,排除疑似异常数据中所确认的非异常数据,最终从当前疾病统计数据中筛选得到异常数据或正常数据,从而有效地区分正常数据和异常数据,使最终取用的数据可参考性得到大幅提升,从而正确引导后续防控等相关工作,保证防控效果。
实施例二:
本实施例在实施例一基础上,进一步提供了如下内容:
如图2所示,步骤S102具体包括:
步骤S201,根据当前疾病统计数据中指定范围内的当前部分疾病统计数据,得到用于反映在当前部分疾病统计数据中、一当前点疾病统计数据与相邻点疾病统计数据之间实际变化程度的当前变化程度指示数据。
具体的,当需要在当前疾病统计数据中,对每一点疾病统计数据是否为疑似异常数据进行判断,则可相应获得包含该点疾病统计数据的部分疾病统计数据,部分疾病统计数据占据指定区间内的指定范围(例如:包含当前时间点在内的前5周)。部分疾病统计数据中存在当前点疾病统计数据(即当前需要判断是否为疑似异常数据的点疾病统计数据)以及与当前点疾病统计数据相邻的相邻点疾病统计数据。相邻点疾病统计数据可以是与当前点疾病统计数据最为接近的一点疾病统计数据或一组点疾病统计数据。如果疾病统计数据为日粒度数据,那么,点疾病统计数据是指某一日疾病统计数据,相应的,部分疾病统计数据包含了多个日疾病统计数据;如果疾病统计数据为周粒度数据,那么,点疾病统计数据是指某一周疾病统计数据,相应的,部分疾病统计数据包含了多个周疾病统计数据。
当前变化程度指示数据能反映当前点疾病统计数据与与之相邻的相邻点疾病统计数据之间实际变化程度。例如:如图3所示,可通过计算指定范围内、每两个相邻的点疾病统计数据之间连线斜率k1,k2,...,kn,n为指定范围内连线数量,并得到指定范围内所有连线斜率绝对值的平均值作为当前变化程度指示数据,连线斜率平均值
当前变化程度指示数据还可以通过如下方式获得,如图4所示,步骤S201具体包括:
步骤S401,对指定范围内的当前部分疾病统计数据a1,a2,...,am求得第一方差σ1以及第一平均值其中,m为指定范围内的点疾病统计数据数量:
步骤S402,将第一方差σ1与第一平均值的商作为当前变化程度指示数据A:
步骤S202,当当前变化程度指示数据小于预设阈值时,以当前点疾病统计数据作为疑似异常数据。
具体的,预设阈值反映了正常情况下,某一部分疾病统计数据中、一点疾病统计数据与与之相邻的相邻点疾病统计数据之间变化程度的门限,通常可为一经验值。那么,当得到上述当前变化程度指示数据后,若当前变化程度指示数据小于预设阈值,那么反映出当前点疾病统计数据的特征符合异常平稳的界定标准,从而使得该当前点疾病统计数据被数据处理***判定为疑似异常数据。
实施本实施例,可从当前疾病统计数据中识别出异常平稳的疑似异常数据,从而可提供有效的参考数据。
实施例三:
本实施例在实施例一或二基础上,进一步提供了如下内容:
如图5所示,步骤S102还可以包括:
步骤S501,根据与指定区间相应的一对应区间内离散分布的历史疾病统计数据,得到用于判断当前疾病统计数据中当前点疾病统计数据是否过高或过低的第一门限数据。
具体的,历史疾病统计数据一般可为当前疾病统计数据的历史同期数据,那么对应区间则为相应的历史同期,例如:当前疾病统计数据的指定区间为2018年1月1日-12月31日,那么历史同期数据的对应区间可为:2017年1月1日-12月31日,或,历史同期数据的对应区间可包括:2017年1月1日-12月31日以及2016年1月1日-12月31日等。
第一门限数据能用于与当前点疾病统计数据进行比较,从而判断当前点疾病统计数据是否为疑似异常数据。例如:可以获得历史疾病统计数据中最高值及最低值,对该最高值或最低值赋予相应的、与人口增长率相对应的权重,进而得到第一门限数据。
第一门限数据还可以通过如下方式获得,如图6所示,步骤S501具体包括:
步骤S601,对历史疾病统计数据中、与当前点疾病统计数据位置对应的第一历史部分疾病统计数据赋予相对高权重,对历史疾病统计数据中、远离第一历史部分疾病统计数据的第二历史部分疾病统计数据赋予相对低权重,得到中间数据。
具体的,以一年的历史同期数据为例,该历史同期数据包含第一历史部分疾病统计数据x1,x2,...,xp,以及第二历史部分疾病统计数据y1,y2,...,yq,其中,p为第一历史部分疾病统计数据中点疾病统计数据数量,q为第二历史部分疾病统计数据中点疾病统计数据数量,p的值可以根据经验划定,历史同期数据中剩余的点疾病统计数据数量即为q。可对第一历史部分疾病统计数据中各点疾病统计数据分别赋予相对高权重α12,...,αp,对第二历史部分疾病统计数据中各点疾病统计数据赋予相对低权重β12,...,βp,得到中间数据b,即x1α1,x2α2,...xpαp,y1β1,y2β2,...,yqβq。其中,权重的高低是相对的,在本实施例中,权重α相对于权重β高,而权重α12,...,αp及β12,...,βp中,越靠近与当前点疾病统计数据对应位置所赋予的权重越高,越远离与当前点疾病统计数据对应位置所赋予的权重越低,权重α、β的分布可采用高斯分布。这样,可使得历史同期数据中,与当前点疾病统计数据对应位置所对应的若干历史点疾病统计数据,在计算第一门限数据时,其重要性相对更高,更具参考价值,从而进一步强化本申请的技术效果。
步骤S602,计算中间数据b的第二方差σ2及第二平均值
步骤S603,以第二平均值与第一浮动值ε1的和作为第一门限数据B,第一浮动值ε1为第二方差σ2的合理倍数。
例如:ε1=5σ2或ε1=-5σ2,那么,第一门限数据B可以为:或者,时,第一门限数据B对应为上门限,当时,第一门限数据B对应为下门限。
当然,在其他实施例中,合理倍数还可以采用其他倍数值。
步骤S502,当当前点疾病统计数据超过第一门限数据要求时,以当前点疾病统计数据作为疑似异常数据。
具体的,第一门限数据反映了正常的、历史数据所对应的数据极限情况,从而可用于判断当前疾病统计数据中当前点疾病统计数据是否过高或过低。那么,当得到上述第一门限数据后,若当前点疾病统计数据高于上门限或低于下门限时,那么反映出当前点疾病统计数据的特征符合异常过高或过低的界定标准,从而使得该当前点疾病统计数据被数据处理***判定为疑似异常数据。
实施本实施例,可从当前疾病统计数据中识别出异常过高或过低的疑似异常数据,从而可提供有效的参考数据。
实施例四:
本实施例在实施例三基础上,进一步提供了如下内容:
如图7所示,步骤S103具体包括:
步骤S701,获得与指定区间相应的至少两个对应区间内离散分布的多个历史疾病统计数据中、与疑似异常数据中的当前点疑似异常数据位置对应的第一历史部分疾病统计数据。
具体的,需要取多个历史同期数据(例如:前三年历史同期数据),从而从每个历史同期数据中截取得到其中的部分疾病统计数据(例如:含当前时间点在内的前后5周所对应数据),作为第一历史部分疾病统计数据,截取时需要满足:历史部分疾病统计数据在相应整个历史疾病统计数据中的位置,与当前点疑似异常数据在疑似异常数据中的位置对应。当前点疑似异常数据通常是指当下数据处理所针对的点疑似异常数据。
步骤S702,计算多个历史疾病统计数据中的第一历史部分疾病统计数据z1,z2,...,zr的第三方差σ3及第三平均值其中,r为第一历史部分疾病统计数据中的点疾病统计数据数量:
步骤S703,以第三平均值与第二浮动值ε2的和作为第二门限数据C,第二浮动值ε2为第三方差σ3的合理倍数。
例如:ε2=2σ3或ε2=-2σ3,那么,第二门限数据C可以为:或者,时,第二门限数据C对应为上门限,当时,第二门限数据C对应为下门限。
当然,在其他实施例中,合理倍数还可以采用其他倍数值。
第二门限数据C与上述第一门限数据B之间通常需要满足相应的关系,例如:第二门限数据的上门限高于第一门限数据的上门限,第二门限数据的下门限低于第一门限数据的下门限。
步骤S704,当当前点疑似异常数据未超过第二门限数据要求时,以当前点疑似异常数据作为非异常数据。
例如:当前点疑似异常数据高于第一门限数据的上门限但未高于第二门限数据的上门限,则当前点疑似异常数据作为非异常数据;当前点疑似异常数据低于第一门限数据的下门限但未低于第二门限数据的下门限,则当前点疑似异常数据也作为非异常数据。
实施本实施例,可从疑似异常数据中识别出周期性突变并非真正异常的非异常数据,从而可提供有效的参考数据。
实施例五:
本实施例在实施例三或四基础上,进一步提供了如下内容:
一当前疾病统计数据由一数据统计站统计所得。
如图8所示,步骤S103具体还包括:
步骤S801,获得从同一区域内至少两个数据统计站统计所得的、至少两份当前疾病统计数据。
步骤S802,当由部分份或全部份当前疾病统计数据经由疾病监测数据异常检测方法所得结果相同或类似时,确认以疑似异常数据作为异常数据。
具体的,本实施例中,对于同一区域内多个数据统计站统计得到同期的疾病统计数据而言,如果每个数据统计站统计所得数据均存在基本同时发生的、类似的突变情况,而出现超过正常范围的异常极值,但由于这些突变情况是真实发生的,相应产生的异常极值应当被从疑似异常数据中排除而应当被认为是非异常数据,相应的,其他剩下的、不能得到其他数据统计站统计所得对应数据证明并非异常数据的疑似异常数据则相应可被认为是真正的异常数据。
实施本实施例,可从疑似异常数据中识别出反映一区域内不同数据统计站同时统计到的类似突变情况并非真正异常的非异常数据,从而可提供有效的参考数据。
实施例六:
图9示出了本发明实施例六提供的疾病监测数据异常检测***的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
上述***包括:
获取单元901,用于获得在指定区间内离散分布的当前疾病统计数据。
第一筛选单元902,用于利用疑似异常数据检测策略,从当前疾病统计数据中筛选得到疑似异常数据。以及,
第二筛选单元903,用于利用修正策略,从疑似异常数据中筛选得到非异常数据,以最终从当前疾病统计数据中筛选得到异常数据或正常数据。
在本实施例中,疾病监测数据异常检测***中各单元所实现的功能与上述各方法实施例中对应部分内容一致,此处不再赘述。
在本实施例中,疾病监测数据异常检测***的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例七:
图10示出了本发明实施例七提供的计算设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算设备包括处理器1001及存储器1002,处理器1001执行存储器1002中存储的计算机程序1003时,实现上述各个方法实施例中的步骤,例如图1所示的步骤S101至S103。或者,处理器801执行计算机程序803时,实现上述各装置实施例中各单元的功能,例如图9所示单元901至903的功能。
本发明实施例的计算设备可以为具有人机交互模块的机器人实体。人机交互模块可以包含触摸屏、麦克风、扬声器等。在该设备中,还可以相应配置其他功能模块,例如:网络模块等。该设备中处理器1001执行计算机程序1003时,实现上述各方法时实现的步骤可参考前述方法实施例的描述,在此不再赘述。
实施例八:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时,实现上述各方法实施例中的步骤,例如,图1所示的步骤S101至S103。
通过硬件组件来实现图9或10中示出的执行,这里针对图1至图8描述的操作的设备、单元、模块、装置和其他组件。硬件组件的示例包括控制器、传感器、生成器、驱动器、存储器、比较器、算术逻辑单元、加法器、减法器、乘法器、除法器、集成器、处理器以及本领域普通技术人员所知的被配置为执行本申请中描述的操作的任意其他电子组件。在一个示例中,通过一个或多个处理器或计算机来实现硬件组件。通过一个或多个处理元件(诸如,逻辑门的阵列、控制器和算术逻辑单元、数字信号处理器、微型计算机、可编程逻辑控制器、现场可编程门阵列、可编程逻辑阵列、微处理器或本领域普通技术人员所知的能够以限定的方式响应并执行指令以获得期望结果的任意其他装置或装置的组合)来实现处理器或计算机。
在一个示例中,处理器或计算机包括或连接到存储由处理器或计算机执行的指令或软件的一个或多个存储器。通过处理器或计算机实现的硬件组件执行指令或软件(诸如,操作***OS和在OS上运行的一个或多个软件应用),以执行这里针对图1至图8描述的操作。硬件组件还响应于指令或软件的执行而访问、操控、处理、创建和存储数据。为了简明,单数术语“处理器”或“计算机”可用于这里描述的示例的描述,但在其他示例中,多个处理器或计算机被使用,或者处理器或计算机包括多个处理元件或多种类型的处理元件或二者。在一个示例中,硬件组件包括多个处理器,在另一示例中,硬件组件包括处理器和控制器。硬件组件具有任意一个或多个不同的处理配置,其示例包括单个处理器、独立处理器、并行处理器、单指令单数据SISD多处理、单指令多数据SIMD多处理、多指令单数据MISD多处理和多指令多数据MIMD多处理。
通过被实现为如上所述的执行指令或软件以执行本申请中描述的由方法执行的操作的计算硬件(例如,通过一个或多个处理器或计算机)来执行在图1至图8中示出的执行本申请中描述的操作的方法。例如,可通过单个处理器、或者两个或更多个处理器、或者处理器和控制器来执行单个操作或者两个或更多个操作。可通过一个或多个处理器、或者处理器和控制器来执行一个或多个操作,可通过一个或多个其他处理器、或者另一处理器和另一控制器来执行一个或多个其他操作。一个或多个处理器、或者处理器和控制器可执行单个操作或者两个或更多个操作。用于控制处理器或计算机实现硬件组件并且执行如上面描述的方法的指令或软件可被写为计算机程序、代码段、指令或它们的任何组合,以单独地或共同地指示或配置处理器或计算机作为用于执行由硬件组件执行的操作和如上所述的方法的机器或专用计算机进行操作。在一个示例中,指令或软件包括直接由处理器或计算机执行的机器代码,诸如,由编译器产生的机器代码。在另一示例中,指令或软件包括由处理器或计算机使用解释器执行的更高级代码。本领域普通编程人员可基于公开了用于执行由硬件组件执行的操作和如上所述的方法的算法的附图中示出的框图和流程图以及说明书中的相应描述,容易地编写指令或软件。
用于控制处理器或计算机实现硬件组件并且执行如上所述的方法的指令或软件以及任何相关联的数据、数据文件以及数据结构可被记录、存储或固定在一个或多个非暂时性计算机可读存储介质中,或被记录、存储或固定在一个或多个非暂时性计算机可读存储介质上。非暂时性计算机可读存储介质的示例包括:只读存储器ROM、随机存取存储器RAM、闪存、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘和本领域普通技术人员所知的任意装置,所述任意装置能够以非暂时性的方式存储指令或软件以及任何相关联的数据、数据文件和数据结构,并将指令或软件以及任何相关联的数据、数据文件以及数据结构提供给处理器或计算机,以便处理器或计算机能执行指令。在一个示例中,指令或软件以及任何相关联的数据、数据文件以及数据结构被分布在联网的计算机***上,使得指令和软件以及任何相关联的数据、数据文件以及数据结构通过处理器或计算机以分布式的方式被存储、访问和执行。
虽然本公开包括特定示例,但是本领域普通技术人员在获得本主题申请的公开的全面理解之后将清楚的是:在不脱离权利要求和它们的等同物的精神和范围的情况下,可对这些示例进行形式和细节上的各种改变。在此描述的示例应仅在描述意义上考虑,而非为了限制的目的。在每个示例中的特征或方面的描述将被视为可应用于其他示例中的相似特征或方面。如果以不同的顺序执行描述的技术,和/或如果描述的***、架构、装置或电路中的组件以不同方式被组合和/或被其他组件或其等同物替代或补充,则可实现合适的结果。因此,本公开的范围并非由具体实施方式限定,而是由权利要求和它们的等同物所限定,并且在权利要求和它们的等同物的范围内的所有变化将被解释为包括在本公开中。

Claims (10)

1.一种疾病监测数据异常检测方法,其特征在于,所述方法包括:
获得在指定区间内离散分布的当前疾病统计数据;
利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据;
利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据。
2.如权利要求1所述的方法,其特征在于,利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据,具体包括:
根据所述当前疾病统计数据中指定范围内的当前部分疾病统计数据,得到用于反映在所述当前部分疾病统计数据中、一当前点疾病统计数据与相邻点疾病统计数据之间实际变化程度的当前变化程度指示数据;
当所述当前变化程度指示数据小于预设阈值时,以所述当前点疾病统计数据作为所述疑似异常数据。
3.如权利要求2所述的方法,其特征在于,根据所述当前疾病统计数据中指定范围内的当前部分疾病统计数据,得到用于反映在所述当前部分疾病统计数据中、一当前点疾病统计数据与相邻点疾病统计数据之间实际变化程度的当前变化程度指示数据,具体包括:
对所述当前部分疾病统计数据求得第一方差以及第一平均值;
将所述第一方差与所述第一平均值的商作为所述当前变化程度指示数据。
4.如权利要求1或2所述的方法,其特征在于,利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据,具体包括:
根据与所述指定区间相应的一对应区间内离散分布的历史疾病统计数据,得到用于判断所述当前疾病统计数据中当前点疾病统计数据是否过高或过低的第一门限数据;
当所述当前点疾病统计数据超过所述第一门限数据要求时,以所述当前点疾病统计数据作为所述疑似异常数据。
5.如权利要求4所述的方法,其特征在于,根据与所述指定区间相应的一对应区间内离散分布的历史疾病统计数据,得到用于判断所述当前疾病统计数据中当前点疾病统计数据是否过高或过低的第一门限数据,具体包括:
对所述历史疾病统计数据中、与所述当前点疾病统计数据位置对应的第一历史部分疾病统计数据赋予相对高权重,对所述历史疾病统计数据中、远离所述第一历史部分疾病统计数据的第二历史部分疾病统计数据赋予相对低权重,得到中间数据;
计算所述中间数据的第二方差及第二平均值;
以所述第二平均值与第一浮动值的和作为所述第一门限数据,所述第一浮动值为所述第二方差的合理倍数。
6.如权利要求4所述的方法,其特征在于,利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据,具体包括:
获得与所述指定区间相应的至少两个对应区间内离散分布的多个历史疾病统计数据中、与所述疑似异常数据中的当前点疑似异常数据位置对应的第一历史部分疾病统计数据;
计算多个所述历史疾病统计数据中的所述第一历史部分疾病统计数据的第三方差及第三平均值;
以所述第三平均值与第二浮动值的和作为第二门限数据,所述第二浮动值为所述第三方差的合理倍数;
当所述当前点疑似异常数据未超过所述第二门限数据要求时,以所述当前点疑似异常数据作为所述非异常数据。
7.如权利要求4所述的方法,其特征在于,一所述当前疾病统计数据由一数据统计站统计所得,利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据,具体包括:
获得从同一区域内至少两个所述数据统计站统计所得的、至少两份所述当前疾病统计数据;
当由部分份或全部份所述当前疾病统计数据经由所述疾病数据异常检测方法所得结果相同或类似时,确认以所述疑似异常数据作为所述异常数据。
8.一种疾病监测数据异常检测***,其特征在于,所述***包括:
获取单元,用于获得在指定区间内离散分布的当前疾病统计数据;
第一筛选单元,用于利用疑似异常数据检测策略,从所述当前疾病统计数据中筛选得到疑似异常数据;以及,
第二筛选单元,用于利用修正策略,从所述疑似异常数据中筛选得到非异常数据,以最终从所述当前疾病统计数据中筛选得到异常数据或正常数据。
9.一种计算设备,包括存储器及处理器,其特征在于,所述处理器执行所述存储器中存储的计算机程序时实现如权利要求1至7任一项所述方法中的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法中的步骤。
CN201910430065.2A 2019-05-22 2019-05-22 疾病监测数据异常检测方法、***、设备及存储介质 Pending CN110299208A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910430065.2A CN110299208A (zh) 2019-05-22 2019-05-22 疾病监测数据异常检测方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910430065.2A CN110299208A (zh) 2019-05-22 2019-05-22 疾病监测数据异常检测方法、***、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110299208A true CN110299208A (zh) 2019-10-01

Family

ID=68027082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910430065.2A Pending CN110299208A (zh) 2019-05-22 2019-05-22 疾病监测数据异常检测方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110299208A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652212A (zh) * 2020-05-21 2020-09-11 哈尔滨市科佳通用机电股份有限公司 基于深度学习的交叉杆端部紧固螺栓丢失故障检测方法
CN114304033A (zh) * 2022-01-25 2022-04-12 海南大学 一种河流生态***中鱼类功能指示物种的筛选方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856366A (zh) * 2012-12-06 2014-06-11 腾讯科技(深圳)有限公司 一种平台数据监控方法及***
CN107871190A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 一种业务指标监控方法及装置
CN108491875A (zh) * 2018-03-19 2018-09-04 深圳乐信软件技术有限公司 一种数据异常检测方法、装置、设备及介质
CN108597616A (zh) * 2018-04-11 2018-09-28 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
CN108647249A (zh) * 2018-04-18 2018-10-12 平安科技(深圳)有限公司 舆情数据预测方法、装置、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856366A (zh) * 2012-12-06 2014-06-11 腾讯科技(深圳)有限公司 一种平台数据监控方法及***
CN107871190A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 一种业务指标监控方法及装置
CN108491875A (zh) * 2018-03-19 2018-09-04 深圳乐信软件技术有限公司 一种数据异常检测方法、装置、设备及介质
CN108597616A (zh) * 2018-04-11 2018-09-28 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
CN108647249A (zh) * 2018-04-18 2018-10-12 平安科技(深圳)有限公司 舆情数据预测方法、装置、终端及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652212A (zh) * 2020-05-21 2020-09-11 哈尔滨市科佳通用机电股份有限公司 基于深度学习的交叉杆端部紧固螺栓丢失故障检测方法
CN114304033A (zh) * 2022-01-25 2022-04-12 海南大学 一种河流生态***中鱼类功能指示物种的筛选方法

Similar Documents

Publication Publication Date Title
Kleinman et al. A model-adjusted space–time scan statistic with an application to syndromic surveillance
Jackson et al. A simulation study comparing aberration detection algorithms for syndromic surveillance
CN110753971B (zh) 用于动态监测患者状况和预测不良事件的***和方法
CN107871190A (zh) 一种业务指标监控方法及装置
WO2014078563A1 (en) Method and apparatus for remote site monitoring
WO2021126243A1 (en) Systems and methods for detecting and responding to anomalous traffic conditions
CN110299208A (zh) 疾病监测数据异常检测方法、***、设备及存储介质
US20210383926A1 (en) Mental health assessment system and method
Aghsami et al. A meta-heuristic optimization for a novel mathematical model for minimizing costs and maximizing donor satisfaction in blood supply chains with finite capacity queueing systems
Barnum et al. Improving the efficiency of distributive and clinical services in hospital pharmacy
JP2020520024A (ja) 臨床試験施設の実績を視覚化するためのシステム及び方法
JPWO2012029500A1 (ja) 運用管理装置、運用管理方法、及びプログラム
Lobo et al. Using claims data linked with electronic health records to monitor and improve adherence to medication
CN115409380A (zh) 医院医保绩效评价方法、装置、电子设备及其存储介质
Mancini et al. Marked point process models for the admissions of heart failure patients
CN111260142A (zh) 商品指标数据预测方法、装置、存储介质及电子设备
Deng et al. Hospital crowdedness evaluation and in-hospital resource allocation based on image recognition technology
US20190051411A1 (en) Decision making platform
Murphy et al. Recombinant temporal aberration detection algorithms for enhanced biosurveillance
CN117827593A (zh) 一种基于异常识别结果确定异常原因的方法和***
Fu et al. Utilizing timestamps of longitudinal electronic health record data to classify clinical deterioration events
Cheng et al. Structural models used in real-time biosurveillance outbreak detection and outbreak curve isolation from noisy background morbidity levels
JP6018024B2 (ja) 変化検知装置、変化検知システム、変化検知方法及びプログラム
CN114663232A (zh) 异常交易行为的监测方法、装置及计算机程序产品
US20200219622A1 (en) System and methods for enhanced risk adjustment factor prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191001

RJ01 Rejection of invention patent application after publication