CN114202009A - 基于pu学习的医疗设备性能指标异常检测方法和装置 - Google Patents

基于pu学习的医疗设备性能指标异常检测方法和装置 Download PDF

Info

Publication number
CN114202009A
CN114202009A CN202111136341.8A CN202111136341A CN114202009A CN 114202009 A CN114202009 A CN 114202009A CN 202111136341 A CN202111136341 A CN 202111136341A CN 114202009 A CN114202009 A CN 114202009A
Authority
CN
China
Prior art keywords
data
abnormal
kpi
cluster
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111136341.8A
Other languages
English (en)
Inventor
李姗姗
孙新国
赵晨宇
张圣林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN202111136341.8A priority Critical patent/CN114202009A/zh
Publication of CN114202009A publication Critical patent/CN114202009A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/40ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management of medical equipment or devices, e.g. scheduling maintenance or upgrades

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出了一种基于PU学习的医疗设备性能指标异常检测方法和装置,该方法包括:以历史关键性能指标KPI流为训练数据,将训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;基于第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取每个簇的质心曲线的异常标签和正常标签;获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练待检测的KPI流对应的异常检测模型,并通过异常检测模型检测待检测的KPI流。该方法在最大限度地减少标注工作量的同时,提升了医疗设备性能指标异常检测的准确性。

Description

基于PU学习的医疗设备性能指标异常检测方法和装置
技术领域
本申请涉及数据检测技术领域,尤其涉及一种基于PU学习的医疗设备性能指标异常检测方法和装置。
背景技术
目前,为保证医疗设备的可靠性,医疗领域的专业人员需要不断采集和监控大量的医疗设备的关键性能指标(Key Performance Indicator,简称KPI)数据流,以便在医疗设备有异常发生,可以及时修理设备,因此,KPI异常检测对于医疗设备管理至关重要。
相关技术中,在医疗领域,KPI流异常检测技术通常包含有监督算法、半监督算法和无监督算法。其中,有监督算法需要人工标注训练集的所有样本,将KPI流的特征和标签作为输入,利用机器学习算法完成时间序列异常检测;无监督算法不需要标注,将KPI流处理后输入深度学习模型,进而可得到异常检测结果;半监督算法整合了以上两种算法的优点,即只需要部分标注数据,同时利用有标注的数据点和无标注的数据点设计异常检测算法。
然而,申请人发现,上述算法中,有监督算法需要大量的标注数据,但是由于在实际情况下,KPI流往往是大规模和多样性的,这种标记工作需要大量的时间和精力成本,往往难以实现;无监督算法精度较低,且需要大量的训练数据,实际场景中,KPI流的模式是经常发生动态变化的,因此这种算法实际适用性较差;半监督算法虽然相较于有监督算法减少了标注成本,相较于无监督算法也提升了模型的检测准确性,但是仍然需要工作人员准确标注较多的KPI流中某一个时间段的全部异常,反复地确认一段KPI是否存在异常仍带来较大的工作量。因此,相关技术中的检测方法,无论是有监督学习方法、半监督学习方法、还是无监督学习方法,都无法以很少的标记工作实现对大规模、多样化、动态变化的KPI流准确的异常检测。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于PU学习的医疗设备性能指标异常检测方法,该方法基于PU学习的方法,实现仅需要少量标签即可进行准确的KPI异常检测,通过集成聚类、PU学习和半监督学习,在最大限度地减少标注工作量的同时,提升了异常检测的准确性。
本发明的第二个目的在于提出一种基于PU学习的医疗设备性能指标异常检测装置。
本发明的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种基于PU学习的医疗设备性能指标异常检测方法,包括以下步骤:
以历史关键性能指标KPI流为训练数据,将所述训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;
基于所述第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;
获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练所述待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测所述待检测的KPI流。
可选地,在本申请的一个实施例中,对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据,包括:人工在所述每个簇的质心曲线上标记异常段,以所述异常段中的标注数据为所述第一异常标注数据,并以质心曲线上除所述异常段之外的数据为所述第一无标注数据。
可选地,在本申请的一个实施例中,获取所述每个簇的质心曲线的异常标签和正常标签,包括:通过所述二进制分类器在所述第一无标注数据中确定出第一正常标注数据;通过主动学习方法对所述第一无标注数据进行多次迭代标记,在所述第一无标注数据中确定出第二正常标注数据和第二异常标注数据;以第一异常标注数据和第二异常标注数据为所述异常标签,并以所述第一正常标注数据和所述第二正常标注数据为所述正常标签。
可选地,在本申请的一个实施例中,获取待检测的KPI流对应的簇的质心曲线上的标签,包括:通过计算所述待检测的KPI流与所述每个簇的质心曲线的形状相似性确定所述待检测的KPI流对应的簇;读取所述待检测的KPI流对应的簇的质心曲线上的异常标签和正常标签。
可选地,在本申请的一个实施例中,通过半监督学习训练所述待检测的KPI流对应的异常检测模型,包括:从所述待检测的KPI流中选取预设数量的数据为第二无标注数据;基于所述待检测的KPI流对应的簇的质心曲线上的异常标签、正常标签和所述第二无标注数据,训练所述待检测的KPI流对应的异常检测模型。
为达上述目的,本申请第二方面实施例提出一种基于PU学习的医疗设备性能指标异常检测装置,包括以下模块:
聚类模块,用于以历史关键性能指标KPI流为训练数据,将所述训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;
获取模块,用于基于所述第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;
训练模块,用于获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练所述待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测所述待检测的KPI流。
可选地,在本申请的一个实施例中,聚类模块,具体用于:基于人工在所述每个簇的质心曲线上标记异常段,以所述异常段中的标注数据为所述第一异常标注数据,并以质心曲线上除所述异常段之外的数据为第一无标注数据。
可选地,在本申请的一个实施例中,获取模块,具体用于:通过所述二进制分类器在所述无标注数据中确定出第一正常标注数据;通过主动学习方法对所述第一无标注数据进行多次迭代标记,在所述第一无标注数据中确定出第二正常标注数据和第二异常标注数据;以第一异常标注数据和第二异常标注数据为所述异常标签,并以所述第一正常标注数据和所述第二正常标注数据为所述正常标签。
可选地,在本申请的一个实施例中,训练模块,具体用于:通过计算所述待检测的KPI流与所述每个簇的质心曲线的形状相似性确定所述待检测的KPI流对应的簇;读取所述待检测的KPI流对应的簇的质心曲线上的异常标签和正常标签。
可选地,在本申请的一个实施例中,训练模块,还用于:从所述待检测的KPI流中选取预设数量的数据为第二无标注数据;基于所述待检测的KPI流对应的簇的质心曲线上的异常标签、正常标签和所述第二无标注数据,训练所述待检测的KPI流对应的异常检测模型。
本申请具有以下技术效果:本申请以历史关键性能指标KPI流为训练数据,将训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;基于第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测待检测的KPI流。本申请基于PU学习的方法,实现仅需要少量标签即可进行准确的KPI异常检测,通过集成聚类、PU学习和半监督学习,在最大限度地减少标注工作量的同时,提升了异常检测的准确性。
为达上述目的,本申请第三方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请第一方面实施例所述的基于PU学习的医疗设备性能指标异常检测方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提供的一种基于PU学习的医疗设备性能指标异常检测方法的流程图;
图2是本申请一个实施例提供的一种具体的基于PU学习的医疗设备性能指标异常检测方法的流程示意图;
图3是本申请一个实施例提供的一种基于PU学习的医疗设备性能指标异常检测装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,对于一个医疗设备,在工作过程中所产生的KPI流的数量众多且模式多样。一方面,如果为每个KPI流训练一个PU学习模型,则整体标注的工作量非常大,另一方面,如果为所有KPI流训练一个PU学习模型,由于不同的KPI流具有不同的模式,不同的KPI流最合适的异常检测器和参数可能会显着不同,因此模型将遭受低精度的影响,为了解决上述技术问题,本申请提出了基于PU学习的医疗设备性能指标异常检测方法和装置。
下面参考附图描述本申请实施例的基于PU学习的医疗设备性能指标异常检测方法和装置。
图1是本申请一个实施例提供的一种基于PU学习的医疗设备性能指标异常检测方法的流程图,如图1所示,该方法包括以下步骤:
步骤S101:以历史关键性能指标KPI流为训练数据,将训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据。
其中,关键性能指标(Key Performance Indicator,简称KPI)流是监控医疗设备时获取的反映医疗设备运行性能的关键指标的数据流,比如,KPI流可以包括医疗设备的响应延迟或网络吞吐量的数据流等,KPI流通常为时间序列。
具体的,在本申请中可以通过不同的方式,获取预先存储的历史KPI流作为本申请的KPI流异常检测模型的训练集。然后,将训练数据按照相似程度进行聚类,通过聚类将训练数据分为不同的簇,并确定每个簇的质心。
需要说明的是,由于本申针对的是对时间序列的KPI流进行聚类,即KPI流以线的形式表示,因此在本申请一个实施例中,可以采用对各个离散曲线进行聚类的方法,根据曲线的相似程度将训练数据进行聚类,进而获得聚类后每个簇的质心曲线。
进一步的,对每个簇的质心曲线进行标注,获得每个质心曲线中的异常数据和无标注数据。在本申请一个实施例中,可以通过人工标注的方式,使工作人员手动在每个簇的质心曲线上标记出一些异常段,标记的异常段的数量可以根据实际需要设置,并以异常段中的标注数据为第一异常标注数据,以每个质心曲线上除已标注的异常段之外的数据为第一无标注数据。
还需说明的是,由于聚类后,每个簇对应一个质心曲线,而簇的数量远远少于训练集中时间序列曲线的数量,因此,在本申请中工作人员进行人工标记的工作量可以被最小化。
步骤S102:基于第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取每个簇的质心曲线的异常标签和正常标签。
其中,二进制分类器是用于在无标注的数据中标记出异常数据和正常数据的分类器,异常标签和正常标签是可靠程度更高的异常标注的样本和正常标注的样本。
在本申请一个实施例中,先基于人工标注出得第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,通过二进制分类器在第一无标注数据中确定出第一正常标注数据。然后,通过主动学习的方式继续在无标注数据中标注出正常数据和异常数据,并基于上一轮标注的结果,重复执行标注步骤,对无标注数据进行多次迭代标记,从而通过主动学习的方式在无标注的数据中选取有可能为异常的样本进行标记,确定出数量更多且可靠性更高的第二正常标注数据和第二异常标注数据。最后,将每个质心曲线对应的第一异常标注数据和第二异常标注数据为该质心曲线的异常标签,并以每个质心曲线第一正常标注数据和第二正常标注数据为该质心曲线的正常标签。
由此,获得每个聚类的质心曲线的异常标签和正常标签。
步骤S103:获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练待检测的KPI流对应的异常检测模型,并通过异常检测模型检测待检测的KPI流。
在本申请一个实施例中,对于任意一个新获取的需要进行异常检测的KPI流,可以先通过计算该待检测的KPI流与分类后确定的每个簇的质心曲线的形状相似性,确定待检测的KPI流对应的簇,即可以将该待检测的KPI分配到一个已存在的聚类中。然后,由于步骤S102已确定了每个聚类的质心曲线的异常标签和正常标签,因此,可以直接读取该待检测的KPI流对应的簇(即所属的聚类)的质心曲线上的异常标签和正常标签。
进一步的,基于获取的该KPI流对应的簇的质心曲线上的标签,以及该KPI流本身的数据,通过半监督学习训练该待检测的KPI流对应的异常检测模型。作为一种示例,通过半监督学习训练待检测的KPI流对应的异常检测模型包括,先从待检测的KPI流中选取预设数量的数据为第二无标注数据,其中,选取的数据的可以根据实际需要进行设置,比如,从该待检测的KPI流中选取前20%的数据等。即从待检测的KPI流中选取预设数量的数据作为无标注数据参与模型训练。然后,基于待检测的KPI流对应的簇的质心曲线上的异常标签、正常标签和第二无标注数据,通过相关技术中的半监督算法训练待检测的KPI流对应的异常检测模型。
更进一步的,通过训练完成异常检测模型检测待检测的KPI流。在本申请实施例中,通过待检测的KPI流对应的训练完成异常检测模型,检测待检测的KPI流中剩余的数据,继续参照上述示例,若从该待检测的KPI流中选取前20%的数据为无标注数据进行模型训练,则可以通过训练完成异常检测模型对该待检测的KPI流后80%或60%的数据进行异常检测。
需要说明的是,在本申请另一些实施例中,还可以把从待检测的KPI流中选取预设数量的第二无标注数据返回至PU学习中,即将第一无标注数据和第二无标注数据合并后作为无标注数据,在通过PU学习构建二进制分类器主动学习后,获取每个簇的质心曲线的异常标签和正常标签,即从待检测的KPI流中选取预设数量的数据作为无标注数据参与PU学习和主动学习,以确定该待检测的KPI流对应的簇的质心曲线的异常标签和正常标签,再结合确定的异常标签、正常标签和第二无标注数据,训练该待检测的KPI流对应的异常检测模型。
由此,本申请的基于PU学习的医疗设备性能指标异常检测方法,在减少标注工作量的同时,提升了异常检测的准确性,提高了在实际应用中的实用性。
综上所述,本申请实施例的基于PU学习的医疗设备性能指标异常检测方法,以历史关键性能指标KPI流为训练数据,将训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;基于第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测待检测的KPI流。该方法基于PU学习的方法,实现仅需要少量标签即可进行准确的KPI异常检测,通过集成聚类、PU学习和半监督学习,在最大限度地减少标注工作量的同时,提升了异常检测的准确性。
为了更加清楚地说明本申请的基于PU学习的医疗设备性能指标异常检测方法,以下结合图2以一个具体的示例进行说明。
如图2所示,该基于PU学习的异常检测框架PUAD包括离线训练过程和在线检测过程,具体包括三个步骤,第一,进行聚类:将训练集的时间序列按照其相似程度进行聚类,对于每个聚类,工作人员会手动为其质心曲线标记一些异常段,因为聚类的数量比时间序列曲线的数量要小得多,所以工作人员的标记工作可以被最小化。此外,一个新出现的KPI流可以通过计算其与每个簇质心的形状相似性被分配到一个已存在的聚类中。第二,进行PU学习:对于每个聚类质心,PUAD应用PU学习利用已有的异常标注和无标注的样本构建一个二进制分类器。然后采用主动学习方法,在多次迭代中获得可靠的异常样本。这样就可以得到包含有可靠的异常和正常标签的聚类质心。第三,进行半监督学习:对于每一条KPI流,将根据其聚类质心上的标签,训练一个异常检测模型。需要说明的是,由图2可知,在进行第二步PU学习前,还可以对质心曲线和KPI流进行特征提取,以提取的特征进行异常检测。
如图3所示,为达上述目的,本申请第二方面实施例提出本申请的一种基于PU学习的医疗设备性能指标异常检测装置,包括:聚类模块100、获取模块200和训练模块300。
其中,聚类模块100,用于以历史关键性能指标KPI流为训练数据,将训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据。
获取模块200,用于基于第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签。
训练模块300,用于获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练待检测的KPI流对应的异常检测模型,并通过异常检测模型检测所述待检测的KPI流。
可选地,在本申请的一个实施例中,聚类模块100,具体用于基于人工在每个簇的质心曲线上标记异常段,以异常段中的标注数据为第一异常标注数据,并以质心曲线上除异常段之外的数据为第一无标注数据。
可选地,在本申请的一个实施例中,获取模块200,具体用于:通过二进制分类器在无标注数据中确定出第一正常标注数据;通过主动学习方法对第一无标注数据进行多次迭代标记,在第一无标注数据中确定出第二正常标注数据和第二异常标注数据;以第一异常标注数据和第二异常标注数据为异常标签,并以第一正常标注数据和第二正常标注数据为正常标签。
可选地,在本申请的一个实施例中,训练模块300,具体用于:通过计算待检测的KPI流与每个簇的质心曲线的形状相似性确定待检测的KPI流对应的簇;读取待检测的KPI流对应的簇的质心曲线上的异常标签和正常标签。
可选地,在本申请的一个实施例中,训练模块300,还用于:从待检测的KPI流中选取预设数量的数据为第二无标注数据;基于待检测的KPI流对应的簇的质心曲线上的异常标签、正常标签和第二无标注数据,训练待检测的KPI流对应的异常检测模型。
需要说明的是,前述对基于PU学习的医疗设备性能指标异常检测方法的实施例的说明,也适用于装置的实施例,实现原理相同,此处不在赘述。
综上所述,本申请实施例的基于PU学习的医疗设备性能指标异常检测装置,基于PU学习的方法,实现仅需要少量标签即可进行准确的KPI异常检测,通过集成聚类、PU学习和半监督学习,在最大限度地减少标注工作量的同时,提升了异常检测的准确性。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请第一方面实施例所述的一种基于PU学习的医疗设备性能指标异常检测方法。
尽管参考附图详地公开了本申请,但应理解的是,这些描述仅仅是示例性的,并非用来限制本申请的应用。本申请的保护范围由附加权利要求限定,并可包括在不脱离本申请保护范围和精神的情况下针对发明所作的各种变型、改型及等效方案。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于PU学习的医疗设备性能指标异常检测方法,其特征在于,包括以下步骤:
以历史关键性能指标KPI流为训练数据,将所述训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;
基于所述第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;
获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练所述待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测所述待检测的KPI流。
2.根据权利要求1所述的方法,其特征在于,所述对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据,包括:
人工在所述每个簇的质心曲线上标记异常段,以所述异常段中的标注数据为所述第一异常标注数据,并以质心曲线上除所述异常段之外的数据为所述第一无标注数据。
3.根据权利要求1或2所述的方法,其特征在于,所述获取所述每个簇的质心曲线的异常标签和正常标签,包括:
通过所述二进制分类器在所述第一无标注数据中确定出第一正常标注数据;
通过主动学习方法对所述第一无标注数据进行多次迭代标记,在所述第一无标注数据中确定出第二正常标注数据和第二异常标注数据;
以第一异常标注数据和第二异常标注数据为所述异常标签,并以所述第一正常标注数据和所述第二正常标注数据为所述正常标签。
4.根据权利要求1所述的方法,其特征在于,所述获取待检测的KPI流对应的簇的质心曲线上的标签,包括:
通过计算所述待检测的KPI流与所述每个簇的质心曲线的形状相似性确定所述待检测的KPI流对应的簇;
读取所述待检测的KPI流对应的簇的质心曲线上的异常标签和正常标签。
5.根据权利要求4所述的方法,其特征在于,所述通过半监督学习训练所述待检测的KPI流对应的异常检测模型,包括:
从所述待检测的KPI流中选取预设数量的数据为第二无标注数据;
基于所述待检测的KPI流对应的簇的质心曲线上的异常标签、正常标签和所述第二无标注数据,训练所述待检测的KPI流对应的异常检测模型。
6.一种基于PU学习的医疗设备性能指标异常检测装置,其特征在于,包括:
聚类模块,用于以历史关键性能指标KPI流为训练数据,将所述训练数据按照相似程度进行聚类,获取每个簇的质心曲线,并对所述每个簇的质心曲线进行标注,获取第一异常标注数据和第一无标注数据;
获取模块,用于基于所述第一异常标注数据和第一无标注数据,通过正例未标PU学习构建二进制分类器,并结合主动学习获取所述每个簇的质心曲线的异常标签和正常标签;
训练模块,用于获取待检测的KPI流对应的簇的质心曲线上的标签,通过半监督学习训练所述待检测的KPI流对应的异常检测模型,并通过所述异常检测模型检测所述待检测的KPI流。
7.根据权利要求6所述的检测装置,其特征在于,所述聚类模块,具体用于:基于人工在所述每个簇的质心曲线上标记异常段,以所述异常段中的标注数据为所述第一异常标注数据,并以质心曲线上除所述异常段之外的数据为第一无标注数据。
8.根据权利要求6或7所述的检测装置,其特征在于,所述获取模块,具体用于:
通过所述二进制分类器在所述无标注数据中确定出第一正常标注数据;
通过主动学习方法对所述第一无标注数据进行多次迭代标记,在所述第一无标注数据中确定出第二正常标注数据和第二异常标注数据;
以第一异常标注数据和第二异常标注数据为所述异常标签,并以所述第一正常标注数据和所述第二正常标注数据为所述正常标签。
9.根据权利要求6所述的检测装置,其特征在于,所述训练模块,具体用于:
通过计算所述待检测的KPI流与所述每个簇的质心曲线的形状相似性确定所述待检测的KPI流对应的簇;
读取所述待检测的KPI流对应的簇的质心曲线上的异常标签和正常标签。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的基于PU学习的医疗设备性能指标异常检测方法。
CN202111136341.8A 2021-09-27 2021-09-27 基于pu学习的医疗设备性能指标异常检测方法和装置 Pending CN114202009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111136341.8A CN114202009A (zh) 2021-09-27 2021-09-27 基于pu学习的医疗设备性能指标异常检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111136341.8A CN114202009A (zh) 2021-09-27 2021-09-27 基于pu学习的医疗设备性能指标异常检测方法和装置

Publications (1)

Publication Number Publication Date
CN114202009A true CN114202009A (zh) 2022-03-18

Family

ID=80646089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111136341.8A Pending CN114202009A (zh) 2021-09-27 2021-09-27 基于pu学习的医疗设备性能指标异常检测方法和装置

Country Status (1)

Country Link
CN (1) CN114202009A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398898A (zh) * 2022-03-24 2022-04-26 三峡智控科技有限公司 基于日志事件关系生成kpi曲线并标记波段特征的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398898A (zh) * 2022-03-24 2022-04-26 三峡智控科技有限公司 基于日志事件关系生成kpi曲线并标记波段特征的方法
CN114398898B (zh) * 2022-03-24 2022-06-24 三峡智控科技有限公司 基于日志事件关系生成kpi曲线并标记波段特征的方法

Similar Documents

Publication Publication Date Title
CN114065613B (zh) 基于深度迁移学习的多工况流程工业故障检测诊断方法
CN109978379B (zh) 时序数据异常检测方法、装置、计算机设备和存储介质
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
KR101948604B1 (ko) 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치
JP6121425B2 (ja) ラスタ画像のエッジ検出によるベルト摩耗の測定
US20160132373A1 (en) System analysis device, system analysis method and system analysis program
CN110413703B (zh) 基于人工智能的监控指标数据的分类方法及相关设备
JP6521096B2 (ja) 表示方法、表示装置、および、プログラム
CN112581719B (zh) 基于时序生成对抗网络的半导体封装过程预警方法和装置
CN112911627B (zh) 无线网络性能检测方法、装置以及存储介质
JP6183449B2 (ja) システム分析装置、及び、システム分析方法
US12007745B2 (en) Apparatus for predicting equipment damage
JP2009217382A (ja) 障害分析システム、障害分析方法、障害分析サーバおよび障害分析プログラム
CN111949429A (zh) 基于密度聚类算法的服务器故障监测方法及***
CN113516174A (zh) 调用链异常检测方法、计算机设备以及可读存储介质
CN112506763A (zh) 数据库***故障根因自动定位方法和装置
CN111897705A (zh) 服务状态处理、模型训练方法、装置、设备和存储介质
CN113705726A (zh) 流量的分类方法、装置、电子设备及计算机可读介质
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
CN114202009A (zh) 基于pu学习的医疗设备性能指标异常检测方法和装置
KR20180020626A (ko) 다중 프로파일 모니터링 방법 및 장치
JP6135192B2 (ja) 時系列データの異常監視装置、異常監視方法及びプログラム
JP6898607B2 (ja) 異常予兆検出システムおよび異常予兆検出方法
KR101883277B1 (ko) Dtwep 기반 제조공정의 이상탐지 방법 및 장치
JP2019113970A (ja) プロセスの状態診断方法及び状態診断装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination