WO2019012654A1 - 分析システム、分析方法及び記憶媒体 - Google Patents

分析システム、分析方法及び記憶媒体 Download PDF

Info

Publication number
WO2019012654A1
WO2019012654A1 PCT/JP2017/025560 JP2017025560W WO2019012654A1 WO 2019012654 A1 WO2019012654 A1 WO 2019012654A1 JP 2017025560 W JP2017025560 W JP 2017025560W WO 2019012654 A1 WO2019012654 A1 WO 2019012654A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
series data
event
event type
input
Prior art date
Application number
PCT/JP2017/025560
Other languages
English (en)
French (fr)
Inventor
昌尚 棗田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to PCT/JP2017/025560 priority Critical patent/WO2019012654A1/ja
Priority to JP2019529395A priority patent/JP6922983B2/ja
Priority to US16/628,827 priority patent/US11755004B2/en
Publication of WO2019012654A1 publication Critical patent/WO2019012654A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing

Definitions

  • the present invention relates to an analysis system, an analysis method, and a storage medium.
  • the event analysis device of Patent Document 1 includes a Bayesian network generation unit that generates a Bayesian network based on an event log including occurrence date and time, a device identifier, and an event type identifier.
  • the event analysis apparatus can analyze a device event using a Bayesian network, and can grasp the causal relationship of the event.
  • the plant monitoring device of Patent Document 2 has an inspection execution signal input unit that inputs from the plant an inspection execution signal that identifies an attribute of the inspection operation when the inspection operation is performed. Depending on the presence or absence of the input of the inspection execution signal, when an abnormality in the process signal is detected, it can be determined whether or not the abnormality is caused by the inspection, and the workload of the abnormality analysis can be reduced.
  • Patent Document 1 there may be a large amount of work required to associate data with an event, and a large management burden.
  • the present invention has been made in view of the above-described problems, and an object of the present invention is to provide an analysis system, an analysis method, and a storage medium capable of reducing management burden.
  • an association between an analysis unit including a classifier that classifies an event type on input time-series data and an event type in the time-series data is not yet determined.
  • First time-series data, the first time-series data classified as being a first event type corresponding to a state in which a target event is generated by the classifier; and the first event type For displaying the second time-series data associated with the second event type data associated with the second event type corresponding to the state in which the target event has not occurred.
  • An analysis system comprising: a display information generation unit that generates first display information; and an input unit that receives a first input regarding association of an event type with the first time-series data.
  • FIG. 1 is a schematic block diagram showing the entire configuration of a plant 1 and an analysis system 2 according to the present embodiment.
  • an analysis system 2 that analyzes the state of the plant 1 is communicably connected to the plant 1 by wire or wirelessly.
  • the plant 1 may be, for example, a chemical plant, a power plant, a pharmaceutical plant, an assembly plant, and the like.
  • the analysis system 2 may be, for example, a monitoring device of the plant 1.
  • the plant 1 is provided with a plurality of sensors 11 and a time acquisition unit 12 for monitoring the state of an apparatus installed in the plant 1, the state of fluid flowing through piping, and the like.
  • the sensor 11 may be, for example, a temperature sensor, a humidity sensor, a pressure sensor, a flow sensor, or the like. Although three sensors 11 are illustrated in FIG. 1, this is an example, and the number of sensors 11 is arbitrary.
  • the time acquisition unit 12 acquires the current time used to set output data of the plurality of sensors 11 as time series data associated with the data output time.
  • the time acquisition unit 12 may be, for example, a real time clock provided in a control device of the plurality of sensors 11. With such a configuration, the plant 1 supplies the analysis system 2 with time-series data based on the outputs of the plurality of sensors 11.
  • the time-series data is, for example, time-series data of measured values such as temperature and humidity in an apparatus provided in the plant 1, time series of measured values such as pressure and flow rate in a pipe provided in the plant 1. It may be data etc.
  • one time acquisition unit 12 may be provided for a plurality of sensors 11 as shown in FIG. 1, a plurality of time acquisition units 12 respectively corresponding to a plurality of sensors 11 may be provided. It may be.
  • the time acquisition unit 12 may be provided on the analysis system 2 side.
  • the analysis system 2 includes a learning unit 21, an analysis unit 22, a storage unit 23, and an event type input unit 24.
  • the storage unit 23 stores time-series data output from the plant 1 as data indicating the state of the plant 1.
  • the event type input unit 24 is an input interface that associates the type of event generated in the plant 1 with each period of time series data divided into predetermined periods. The association of the event types is input by the administrator of the analysis system 2. Thereby, the storage unit 23 stores time-series data in a state in which the event type is associated.
  • an "event” means the state of the plant 1 in each time.
  • a state in which an inspection worker inspects equipment, piping, and the like in the plant 1 and a state in which a worker manually works the equipment are types of “events”. Moreover, as described later, the normal operation state and the abnormal operation state are also included in the "event”.
  • the learning unit 21 converts the time-series data stored in the storage unit 23 into feature amounts, and uses the feature amounts and the event types associated with the feature amounts as training data to perform machine learning of a plurality of classifiers. Do. In the present specification, machine learning may be simply referred to as learning.
  • the plurality of learned classifiers are stored, for example, in the storage unit 23.
  • the analysis unit 22 converts time-series data stored in the storage unit 23 into feature amounts, and classifies an event corresponding to the feature amounts using a plurality of classifiers obtained by learning in the learning unit 21. , Determine the event that occurred in the plant 1.
  • the analysis system 2 of the present embodiment can automatically discriminate the type of event (for example, normal operation, check work, abnormal operation, etc.) occurring in the plant 1, and can perform abnormality detection of the plant 1, etc. .
  • the configuration shown in FIG. 1 is an example, and the configuration can be appropriately changed as long as analysis of time-series data obtained in the plant 1 is possible.
  • the analysis system 2 may be provided inside the plant 1, or the learning unit 21 may be provided outside the analysis system 2 as a learning system.
  • FIG. 2 is a block diagram showing an example of the hardware configuration of the analysis system 2 according to the second embodiment.
  • the analysis system 2 may be configured by a single device, or may be configured by two or more physically separated devices communicably connected in a wired or wireless manner.
  • the analysis system 2 includes, as shown in FIG. 2, a central processing unit (CPU) 2002, a read only memory (ROM) 2004, a random access memory (RAM) 2006, and a hard disk drive (HDD) 2008. ing.
  • the analysis system 2 also includes a communication interface (I / F (Interface)) 2010.
  • the analysis system 2 also includes a display controller 2012 and a display 2014. Furthermore, the analysis system 2 includes an input device 2016.
  • the CPU 2002, the ROM 2004, the RAM 2006, the HDD 2008, the communication I / F 2010, the display controller 2012, and the input device 2016 are connected to a common bus line 2018.
  • the CPU 2002 performs overall control and arithmetic processing of the analysis system 2.
  • the CPU 2002 implements the functions of the respective units in the analysis system 2 by loading a program stored in the HDD 2008 or the like into the RAM 2006 and executing the program.
  • the ROM 2004 stores programs such as a boot program.
  • a RAM 2006 is used as a working area when the CPU 2002 executes a program.
  • the HDD 2008 also stores programs executed by the CPU 2002.
  • the HDD 2008 is a storage device that implements the storage function of the analysis system 2 such as the storage unit 23.
  • the storage device used in the analysis system 2 is not limited to the HDD 2008 as long as it is nonvolatile, and may be, for example, a flash memory or the like.
  • Communication I / F 2010 controls communication of data with plant 1 via the network.
  • the display controller 2012 is connected to a display 2014 that provides a function as a display unit.
  • the display controller 2012 functions as an output unit that outputs data related to an image to be displayed together with the CPU 2002, and an image based on the output data is displayed on the display 2014.
  • the input device 2016 is hardware such as a keyboard and a mouse for the user to input to the event type input unit 24.
  • the input device 2016 may be a touch panel incorporated in the display 2014.
  • the administrator of the analysis system 2 can input an event type to the analysis system 2, input an execution instruction of processing, and the like through the input device 2016.
  • the hardware configuration of the analysis system 2 is not limited to the above-described configuration, and can be various configurations.
  • FIG. 3 is a block diagram showing functional configurations of the storage unit 23 and the event type input unit 24 according to the present embodiment.
  • the storage unit 23 includes a time-series data storage unit 231, an event type storage unit 232, a feature amount storage unit 233, a teacher data storage unit 234, and a classifier storage unit 235.
  • the event type input unit 24 includes a display information generation unit 241 and an input unit 242.
  • the time-series data storage unit 231 stores time-series data output from the plurality of sensors 11.
  • An example of time-series data will be described with reference to FIG.
  • FIG. 4 is a graph showing an example of time-series data according to the present embodiment.
  • the vertical axis of the graph of FIG. 4 is the measurement value of the sensor 11, and the unit is arbitrary.
  • the horizontal axis of the graph of FIG. 4 is the time acquired by the time acquisition unit 12.
  • the time series data is divided into N predetermined periods (T1, T2, T3,..., TN).
  • time-series data storage unit 231 when the measurement value by the sensor 11 is stored in the time-series data storage unit 231, conversion to digital data is performed so as to be suitable for conversion of a feature amount described later. Specifically, processing such as sampling and quantization is performed on time series data of measurement values measured by the sensor 11 by an analog-to-digital converter (not shown), and converted to digital data.
  • the event type storage unit 232 stores an event type corresponding to each period, which is input to the event type input unit 24 by the administrator of the analysis system 2.
  • the input of the event type can be performed, for example, by the administrator inputting the event (target event) to be classified and the occurrence time thereof in the event type input unit 24.
  • target event A and target event B may be treated as occurrences of a target event C different from the target event A. it can. Details of this event type input will be described later.
  • the feature amount storage unit 233 stores one or more feature amounts calculated from time-series data stored in the time-series data storage unit 231.
  • the feature amount include the variance of the measurement value measured by the sensor 11 in the corresponding period (for example, in the period T1), the standard deviation, the difference between the maximum value and the minimum value (range), the statistic such as the slope and the average.
  • K is an integer of 1 or more
  • the number of feature quantities calculated is M ⁇ K for each of N periods, that is, the total It is NxMxK piece.
  • the event types are three types of the target event A, the target event B, and the non-target event X.
  • the target event may be called a first event type
  • the non-target event may be called a second event type.
  • the teacher data storage unit 234 stores teacher data for causing the classifier included in the learning unit 21 to perform supervised machine learning.
  • the teacher data is generated by associating the feature amount stored in the feature amount storage unit 233 with the event type stored in the event type storage unit 232 based on each time or period.
  • the classifier storage unit 235 stores a classifier obtained by performing supervised machine learning using the teacher data stored in the teacher data storage unit 234.
  • the feature amount of the teacher data is used as data necessary for estimation of classification, and the event type is used as the correct solution (teacher) to be estimated based on the feature amount.
  • methods used for supervised machine learning include support vector machines, random forests, and neural networks.
  • the display information generation unit 241 generates display information for causing the display 2014 to display data for causing an administrator of the analysis system 2 to input an event type and a GUI (Graphical User Interface).
  • the input unit 242 receives an input of association of an event type to a GUI displayed on the display 2014. The association of the input event type is stored in the event type storage unit 232.
  • time-series data when some of the time-series data is already associated with the event type and a learned classifier is generated using this as training data, another time may be generated. It relates to the situation of adding the correspondence of the event type to the series data.
  • the performance of the classifier can be improved by adding the correspondence of the event types, enriching the teacher data, and re-learning the classifier. Therefore, correspondence of an event type to a part of time series data, learning of a classifier, etc. shall be performed beforehand, and the method in particular is not limited.
  • FIG. 5 is a flowchart showing an outline of the event type input according to the present embodiment. An outline of the event type input according to the present embodiment will be described with reference to FIG. Note that the flowchart of FIG. 5 is merely an outline for simplification of the description, and processing, addition of branches and the like, change of order, and the like may be appropriately performed.
  • step S31 the classifier of the analysis unit 22 acquires, from the feature storage unit 233, the feature amount of time-series data whose association with the event type has not been determined, and classifies the event type.
  • this time series data may be referred to as first time series data.
  • step S32 the display information generation unit 241 generates display information.
  • the display information displays time-series data classified by the classifier as a certain target event, time-series data correlated with the target event, and time-series data correlated with the non-target data. It is information to be displayed on 2014. This display information may be referred to as first display information.
  • time series data associated with the target event may be referred to as second time series data
  • time series data associated with non-target data may be referred to as third time series data. There is.
  • step S33 the input unit 242 receives an input regarding association of event types. This input content may be referred to as a first input. If the administrator has made an input to correct the event type, the process proceeds to step S34 (YES in step S33). If the administrator determines without correcting the event type classified by the classifier, there is no problem in classification by the classifier, and the process ends (NO in step S33). The first time-series data and the corrected event type associated with the first time-series data are added to the teacher data storage unit 234 as teacher data.
  • step S34 the learning unit 21 retrains the classifier using teacher data including the first time-series data for which the correction input of the event type has been performed. Thereafter, the process proceeds to step S31 again, and the same process is repeated.
  • 6 to 12 are screen examples for inputting an event type according to the present embodiment, and correspond to a GUI for performing the process of FIG. 5.
  • a screen example for data display and event type input displayed on the display 2014 based on the display information generated by the display information generation unit 241 will be described with reference to these drawings.
  • the screen example described below is a screen for adding the association of event types of time series data.
  • An event type is associated in advance with some of the time-series data, and it is assumed that a learned classifier with this as teacher data is generated. That is, the screen is an input screen that assumes a situation where retraining of the classifier is performed by increasing the number of teacher data for learning in a situation where the number of time series data associated with the event type is small. It is assumed that association of an event type to part of time series data, learning of a classifier, and the like have already been executed by another GUI.
  • FIG. 6 shows a display example of the setting screen.
  • the tabs 301, 302, 303, 304, 305, and 306 are displayed at the top of the screen, and when the administrator of the analysis system 2 presses each tab using a pointing device or the like, the display content of the main window 320 is displayed on each tab. Transition to the displayed one.
  • a setting screen is displayed on the main window 320 by pressing the tab 301 described as “setting”.
  • a sub-window 310 is displayed at the left of the main window 320.
  • the sub-window 310 lists identifiers added to time-series data to be checked.
  • a progress bar 331 and a button 322 are displayed below the sub window 310 and the main window 320.
  • the progress bar 331 displays the progress of the process.
  • the display of the main window 320 can be transitioned to the evaluation screen of the classification of the event by pressing the button 322 described as “final evaluation”.
  • a text box labeled “classification threshold (%)”, “number of confirmations (numbers)”, “number of displayed sensor data (numbers)”, and “number of displayed feature amount data (numbers)” in the main window 320 Is displayed.
  • the text box “Sensor data display number (piece)” receives the setting of the number of data displayed on the sensor data display screen and the sensor data (long-term) display screen.
  • the text box “feature amount data display number (number)” receives the setting of the number of data displayed on the feature amount data display screen.
  • the text box "classification threshold (%)" receives an input of a classification threshold which is a parameter for determining an event in the analysis unit 22.
  • FIG. 7 shows a display example of the setting screen after inputting a numerical value in the text box of "classification threshold (%)".
  • the confirmation target is displayed in the subwindow 310, and the data to be confirmed in the text box of "number of confirmations (cases)” Indicates that the total number of "10" is displayed.
  • the classification threshold is one of the parameters for determining the condition for determining the event type from the classification result by the classifier.
  • the plurality of classifiers may output different classification results.
  • the event type may be determined by majority logic adopting the result outputted by the largest number of classifiers, but certainty may not be secured if the classification results of a plurality of classifiers differ. is there. Therefore, the analysis unit 22 adopts the number of classifiers classified into each event type only when the classifier having a ratio larger than the classification threshold (80% in this example) outputs the same classification result. Reject the result if the maximum value of is less than or equal to a predetermined threshold. By doing this, the determination result with low certainty can be rejected, and the determination performance of the event can be enhanced.
  • identifiers of data to be confirmed are listed.
  • feature quantities are calculated with one unit of time-series data as one unit, and the date when the data was measured by the sensor 11 is an identifier. Therefore, in FIG. 7, dates are listed vertically, such as "10/01/15" (showing January 15, 2010).
  • dates are listed vertically, such as "10/01/15" (showing January 15, 2010).
  • one unit is a shorter period such as one hour unit or one minute unit, it is desirable to include not only the date but also the time in the identifier.
  • the identifier of the data displayed in the sub window 310 can be pressed, and when pressed, the corresponding data is displayed by transitioning to a sensor data display screen described later.
  • FIG. 8 shows a display example of the sensor data display screen.
  • a plurality of sensor data (time series data) as shown in FIG. 8 is displayed in the main window 320 .
  • the display of the main window 320 is a display corresponding to step S 32 in FIG. 5 and is based on the first display information generated by the display information generation unit 241.
  • those for which the association of event types (described as a label in this display screen) has already been completed are displayed by hatching, and those displayed in the main window 320 Is displayed in reverse black and white.
  • time series data are arranged in a matrix.
  • first direction time series data to be confirmed
  • time series data of a target event time series data of a correct event
  • time series data of a non-target event are arranged.
  • second direction a plurality of time series data are arranged in order of importance.
  • the time-series data to be confirmed is time-series data whose association with the event type has not been determined, and the first time-series data classified as a certain target event by the classifier in step S31. It is data and time series data to be checked by the administrator. In this example, it is assumed that the target event is classified by the classifier as the “A test”. By arranging time series data in this manner, the administrator can determine at a glance whether the time series data to be confirmed is more similar to the time series data of the correct event or the time series data of the non-target event. it can.
  • the time series data of the target event is the second time series data already associated with the same target event (that is, the A test) as the classification result by the classifier.
  • the time-series data of the correct event will be described later.
  • the time series data of the non-target event is the third time series data already associated with the non-target event.
  • the degree of importance is the degree of contribution of a plurality of pieces of time-series data when they are associated and used for learning. For example, when a random forest is adopted as a machine learning algorithm, a Gini coefficient can be used as a measure of importance.
  • the pull-down menu 333 is a menu for causing the administrator to select or input an event type.
  • the pull-down menu 333 is configured to select one of the items “A test”, “B test”, “not subject”, and “new”.
  • the pull-down menu 333 displays the same “A test” as the classification result of the classifier. For example, when the administrator determines that the time-series data to be confirmed is "B test” which is an event type different from "A test”, selecting "B test” Setting is possible.
  • “Not applicable” is an item selected when the administrator determines that the time series data to be confirmed is data not to be classified
  • “New” is “A test” and “B test”. Is an item to be selected when it is determined that it should be distinguished as another event type.
  • a window, a text box, etc. may be displayed to allow the administrator to enter an item name.
  • the button 334 described as “label confirmation” When the button 334 described as “label confirmation” is pressed, the setting of the event type selected in the pull-down menu 333 is fixed, and the teacher data is updated. Further, time series data already associated with the determined event type is displayed in the column of time series data of the correct event. For example, when “B test” is selected in the pull-down menu 333, time series data already associated with the B test is displayed as a correct event. In addition, since the example of a screen before label decision is shown in FIG. 8, data are not displayed on the column of a correct answer event. Acceptance of the correction input of the event type by the pull-down menu 333 and the button 334 corresponds to step S33 in FIG.
  • step S34 classification of time-series data whose association with the event type is unconfirmed is performed again by the classifier after relearning, and the screen transitions to the setting screen.
  • This classification corresponds to step S31 in FIG.
  • the time series data of the target event, the time series data of the correct event, and the time series data of the non-target event are automatically selected from the time series data included in the teacher data. More specifically, in the column of time series data of the target event (the second column from the left), one period of the same event type as the confirmation target event type (test A in the figure) classified by the classifier Time-series data is selected from among the teacher data and displayed. The time series data of one period of the same event type as the event type determined by pressing the button 334 is selected and displayed from the teacher data in the time series data column of the correct event (the third column from the left) Ru. In addition, before the determination of the event type, as shown in FIG. 8, the time-series data of the correct event is not displayed.
  • the time series data of one period of the non-target event is selected from the teacher data and displayed in the column of the time-series data of the non-target event (the fourth column from the left).
  • the selection for deciding which data to be displayed out of a large number of teacher data may be random, but in order to make the confirmation by the administrator easier, the confirmation target of the same row It is preferable to select one having a high degree of similarity with time-series data. Examples of the degree of similarity referred to at the time of selection include the reciprocal of Euclidean distance between data waveforms and the reciprocal of DTW (Dynamic Time Warping) distance between data waveforms.
  • calculation of the degree of similarity may be performed on the acquired data itself, but predetermined processing may be performed before calculation of the degree of similarity.
  • predetermined processing there is a process of standardizing data in each period so as to have an average value of 0 and a variance of 1.
  • FIG. 9 shows a display example of a sensor data (long-term) display screen.
  • a sensor data (long-term) When the tab 303 described as “Sensor data (long-term)” is pressed, a plurality of sensor data (time-series data) as shown in FIG. 9 is displayed in the main window 320.
  • the difference from FIG. 8 is that the horizontal axis of the graph of time series data is longer, and a text box 336 for inputting a display period is displayed below the main window 320.
  • the horizontal axis of each time series data is reset and the graph is updated.
  • the time at the center of the horizontal axis of the graph is set to be the same as the time at the center of the horizontal axis of the graph on the sensor data display screen of FIG.
  • the other points are the same as those in FIG.
  • FIG. 10 shows a display example of the feature data display screen.
  • the tab 304 described as "feature amount data” When the tab 304 described as "feature amount data" is pressed, a plurality of feature amounts as shown in FIG. 10 are displayed in the main window 320.
  • box and whisker plots indicating values of feature quantities of time-series data of the target event, feature quantities of the correct event, and feature quantities of the non-target event are arranged.
  • the broken line in the figure indicates the value of the feature calculated from the time series data to be confirmed.
  • each data is arranged in order of importance.
  • the correct answer event column is displayed after the button 334 is pressed as in FIGS. 8 and 9 and the event type to be confirmed is determined.
  • the other items are the same as in FIG.
  • the sensor data (long-term) display screen of FIG. 10 it is possible to set an event type in consideration of the value of the feature amount.
  • the value of the feature amount is visualized by a box and whisker plot as shown in FIG. 10, it may be a display form in which the value itself of the feature amount is displayed as a numerical value.
  • the display of the feature amount is based on the fourth display information generated by the display information generation unit 241.
  • FIG. 11 shows a display example of the evaluation screen.
  • a tab 305 labeled "evaluation” is pressed, a graph and text box as shown in FIG. 11 are displayed in the main window 320. This display is based on the second display information generated by the display information generation unit 241.
  • the horizontal axis of the graph is a classification threshold value, and the vertical axis is Precision (accuracy rate) and Recall (reproduction rate) which are evaluation results of classification. If the classification threshold is increased, the result is adopted only when the degree of coincidence of the output of the classifier is high, so the Precision is high, but the probability of being rejected is also high, so the Recall is small. Thus, there is a trade-off between Precision and Recall.
  • This evaluation screen is used to appropriately determine the classification threshold while confirming both trends.
  • the text box "classification threshold (%)" receives an input of the classification threshold. This input is sometimes referred to as the second input.
  • a classification threshold is input, Precision and Recall corresponding to the value are automatically displayed in the respective text boxes.
  • FIG. 11 shows that the values of Precision and Recall are both displayed as "80" by inputting "30" as the classification threshold.
  • the default value of the classification threshold is a value that maximizes a predetermined performance indicator such as F-measure.
  • F-measure is the harmonic mean of Precision and Recall.
  • buttons 337 and 338 are displayed below the main window 320.
  • the button 337 will be described later in the description of FIG.
  • the button 338 displayed as "Final confirmation" is pressed, the value of the classification threshold which is a parameter of the classifier is determined by the value input in the text box, and then the display of the main window 320 is displayed on the verification screen. Transition.
  • FIG. 12 shows a display example of the verification screen.
  • a table and check boxes as shown in FIG. 12 are displayed in the main window 320.
  • the table in FIG. 12 shows the state of confusion in the classification of target event 1 and target event 2. For example, in the first line, the mixing ratio of data in which the event type is “A1 test” in the teacher data and data in which the event type is “A2 test” is 20%, and the precision and recall of this class are 99 respectively. % And 79% are shown.
  • the display of the verification screen is based on the third display information generated by the display information generation unit 241.
  • the mixing ratio of the X event and the Y event is (the number of misclassifying the X event as the Y event + the number of misclassifying the Y event as the X event) / (number of having determined the X event as the X event + Y event It is defined by the number determined as Y event).
  • the check box in the “Merge?” Column is a column for setting an event to be merged (merged event types). Further, buttons 337, 339, and 340 are displayed below the main window 320. If a button 339 described as "Merge" is pressed while the "Merge?" Check box is checked, two target events in the checked line are merged. Thereafter, the display of the main window 320 transitions to the evaluation screen.
  • the input of necessity of the merge may be referred to as a third input.
  • buttons 337 described as “reset” When the button 337 described as “reset” is pressed, the state before merging can be restored.
  • the button 337 shown in FIG. 11 has the same function.
  • the button 340 labeled “Done” When the button 340 labeled "Done” is pressed, the learning of the classifier ends.
  • the identifier of the sub window 310 can be pressed to cause the display of the main window 320 to transition to the sensor data display screen, and the target event can be set again.
  • FIGS. 13 to 15 are flowcharts showing an example of the event type input method according to the present embodiment.
  • the present process shows a typical example of the operation of the event type input using the GUIs of FIGS.
  • the flowcharts of FIGS. 13 to 15 are merely examples of procedures that can be performed, and the processing content and order may be changed as appropriate according to the user's operation procedure, the design of the GUI, and the like.
  • the processes in FIGS. 13 to 15 will be described with reference to the corresponding screen examples in FIGS. 6 to 12.
  • Step S31 in FIG. 13 is the same as step S31 in FIG.
  • the process of the classification by a classifier may be beforehand performed before the screen display of FIG. 6 thru
  • step S41 the event type input unit 24 determines whether the classification result of the classifier includes one classified as the target event. If one classified into the target event is included (YES in step S41), the process proceeds from step S42 to a loop of step S45. If the event classified into the target event is not included (NO in step S41), the process proceeds to step S51 in FIG. The determination in this step may be performed by the administrator checking the list of classifications and the result being received by the input unit 242.
  • step S43 the display information generation unit 241 generates display information such as a sensor data display screen in order to make the administrator confirm the classification result by the classifier.
  • the display information is displayed on the display 2014.
  • the screen display may be the setting screen shown in FIGS. 6 and 7, the sensor data display screen shown in FIG. 8, the sensor data (long-term) display screen shown in FIG. 9, and the feature data display screen shown in FIG.
  • the administrator checks the classification result while appropriately transitioning these displays by operations such as pressing the tabs 301, 302, 303, 304.
  • step S44 the input unit 242 receives an input operation such as correction of the classification result by the administrator. This input operation may be input of an event type to the pull-down menu 333 or the like.
  • step S34 the learning unit 21 retrains the classifier using the teacher data for which the setting of the event type by the administrator has been confirmed.
  • the process is the same as step S34 in FIG. Thereafter, the processing shifts to step S31 again.
  • step S51 of FIG. 14 the display information generation unit 241 generates display information of the evaluation screen of FIG. 11 in order to cause the administrator to input a classification threshold.
  • the display information is displayed on the display 2014.
  • the input unit 242 receives an input operation of the classification threshold value by the administrator.
  • step S52 the display information generation unit 241 generates display information of the verification screen of FIG. 12 in order to cause the administrator to input the necessity of the merge and the merge target.
  • the display information is displayed on the display 2014.
  • the input unit 242 receives an input operation of merge by the administrator.
  • step S53 If it is determined in step S53 that the administrator needs to re-set the event type (YES in step S53), a transition operation to a sensor data display screen or the like is performed, and the process proceeds from step S61 to step S62 in FIG. Go to the loop of If the administrator determines that there is no resetting of the event type, and presses the button 340 described as “Done” in FIG. 12 (YES in step S53), the process ends.
  • step S61 to step S62 The loop from step S61 to step S62 is performed for each of the data that requires resetting of the event type.
  • Steps S43 and S44 included in the loop from step S61 to step S62 are the same as those described above, and therefore the description thereof is omitted.
  • steps S34 and S31 are performed. These processes are the same as steps S31 and S34 in FIG. Thereafter, the processing shifts to step S51 in FIG. 14 again.
  • a large number of time series data are obtained by the sensor 11, but in a situation where the number of time series data associated with the event type is small, the event type can be associated with a small load.
  • a GUI is provided.
  • classification is performed using a classifier that has performed learning using a small amount of learning data, and the administrator may correct the classification only with reference to the classification result. Therefore, it is possible to reduce the number of steps of checking and associating time series data, as compared to the case where a large number of data are checked to associate event types and prepare a large amount of learning data.
  • the time-series data of the target event and the non-target event can be displayed side by side in the time-series data to be confirmed.
  • the administrator can visually perform the task of association by a method such as determining whether the feature to be confirmed resembles the target event or the non-target event, etc., and the association can be performed efficiently. It can be carried out.
  • Second Embodiment An example of the configuration of the learning unit 21 and the analysis unit 22 that can be applied to the implementation of the present invention will be described as a second embodiment.
  • the other configuration is the same as that of the first embodiment, and thus the detailed description is omitted.
  • FIG. 16 is a block diagram showing functional configurations of the learning unit 21 and the storage unit 23 according to the present embodiment.
  • FIG. 17 is a flowchart showing the learning operation of the classifier according to the present embodiment.
  • FIG. 18 is a functional block diagram of the analysis unit 22 and the storage unit 23 according to the present embodiment.
  • FIG. 19 is a flowchart showing an operation of determining an event according to the present embodiment.
  • the learning unit 21 includes a feature quantity calculating unit 211, a teacher data generating unit 212, a selecting unit 213, and a classifier learning unit 214.
  • the configuration of the storage unit 23 is the same as that shown in FIG.
  • step S11 of FIG. 17 the analysis system 2 acquires time series data output from the plurality of sensors 11 and stores the time series data in the time series data storage unit 231.
  • the operation of step S11 may be performed in advance by a method such as performing in real time at the time of measurement by the sensor 11, for example.
  • step S12 the feature quantity calculation unit 211 reads the time series data stored in the time series data storage unit 231, and calculates one or more feature quantities.
  • the calculated feature amount is stored in the feature amount storage unit 233.
  • step S13 the event type input unit 24 of the analysis system 2 receives an input of an event type corresponding to each period.
  • the input event type is stored in the event type storage unit 232.
  • step S14 the teacher data generation unit 212 associates the feature amount stored in the feature amount storage unit 233 with the event type stored in the event type storage unit 232 based on each time or period. Generate data. This data is used as supervised data for supervised machine learning of the classifier. The generated teacher data is stored in the teacher data storage unit 234.
  • the K feature quantities are combined are selected to be included in the feature amount group.
  • the feature value group selected in this step is obtained from the data of M sensors obtained in a part or all of the N periods (the number of this period is N1). It includes N1 ⁇ M ⁇ K feature amounts calculated for each of K pieces.
  • the classifier learning unit 214 learns a classifier using data of the feature amount group selected in step S16.
  • the learning performed by the classifier learning unit 214 is supervised machine learning. More specifically, supervised machine learning is performed in which the feature amount of the teacher data is set as data necessary for estimation of classification, and the event type is set as the correct solution (teacher) to be estimated based on the feature amount.
  • Examples of methods used for supervised machine learning include support vector machines, random forests, and neural networks.
  • Step S16 and S17 Learning of one classifier is performed by steps S16 and S17.
  • the learned classifiers are stored in the classifier storage unit 235.
  • the operations of the above steps S16 and S17 are repeated P times, and learning of P classifiers is performed.
  • selection is performed so that the combination of data included in the selected feature amount group is different from each other.
  • the P classifiers generated are learned based on different feature amount groups, and thus become classifiers of the same type but different classification criteria.
  • step S15 to step S18 When the loop from step S15 to step S18 is repeated P times and the learning of P classifiers is completed, the learning operation of the classifier according to the flowchart of FIG. 17 ends.
  • This operation is an operation for determining an event that has occurred in the plant 1 based on time-series data of the sensor 11 using P classifiers obtained by the above-described learning operation.
  • the analysis unit 22 includes a feature amount calculation unit 221, a classification unit 222, and a determination unit 223.
  • the configuration of the storage unit 23 is the same as that shown in FIG.
  • step S21 of FIG. 18 the analysis system 2 acquires time series data output from the plurality of sensors 11 and stores the time series data in the time series data storage unit 231.
  • the operation in step S21 may be performed in advance by a method such as performing in real time at the time of measurement by the sensor 11, for example.
  • the combination of the several sensor 11 which acquires time-sequential data is the same as the combination of the several sensor 11 used for the production
  • step S22 the feature quantity calculation unit 221 reads the time series data stored in the time series data storage unit 231, and calculates one or more feature quantities.
  • the type, the number, and the like of feature amounts to be calculated are the same as the above-described teacher data. Since this process is the same as step S12 of FIG. 17, detailed description will be omitted.
  • step S23 the classification unit 222 uses the P classifiers stored in the classifier storage unit 235 as input data for the feature quantities stored in the feature quantity storage unit 233.
  • Classify event types Each classifier outputs the result of classification into one of the target event and the non-target event defined at the time of learning according to the input.
  • step S24 the determination unit 223 integrates the results of the P event classifications output by the P classifiers, respectively, and determines an event that has occurred in the plant 1 in each period.
  • the P classifiers may output different classification results because the classification criteria are different from one another. Therefore, in order to obtain one determination result, P classification results are integrated and determined at the time of determination. This determination is performed, for example, by majority logic that determines that an event corresponding to an event type classified by the largest number of classifiers has occurred in the classification target period, but an event when the maximum value is less than a predetermined threshold Reject the result of
  • the rejection may be the following algorithm.
  • the determining unit 223 When the maximum value of the number of classifiers classified into each event type is larger than a predetermined threshold, the determining unit 223 generates an event corresponding to the event type classified by the largest number of classifiers in the classification target period It is determined that If the maximum value of the number of classifiers classified into each event type is equal to or less than a predetermined threshold, the determination unit 223 determines that the target event has not occurred in the classification target period. By doing this, the determination result with low certainty can be rejected, and the determination performance of the event can be improved.
  • the analysis system 2 of the present embodiment can determine an event that has occurred in the plant 1 at predetermined intervals based on time series data obtained by the plurality of sensors 11.
  • the analysis system 2 may store the determination result of the event as a log, and may notify the administrator of a message according to the determination result of the event.
  • the message corresponding to the determination result of the event may be display of a warning sentence on the display 2014, notification by sound, light, etc. by an alarm device (not shown).
  • the learning system can reduce the effects of misclassification of some classifiers by performing classification using a plurality of classifiers with different criteria and integrating the results. Therefore, sufficient discrimination performance can be secured for the analysis system 2 as a whole.
  • the amount of work of the administrator in the case where the update is necessary is small.
  • the classifier trained by supervised machine learning is used, when the event type to be classified increases, the administrator inputs the event type and the occurrence time zone after the increase. All you have to do is update the teacher data and have the classifier re-learn. Therefore, there is no large administrative burden such as system repair and database rebuilding. Furthermore, a large management burden is not required even in that it is not necessary to require the plant 1 side to perform additional work at the time of analysis.
  • step S16 the selection method of the data in step S16 is not limited, it is desirable to be performed at random using a random selection algorithm etc. so that different data may be selected more reliably by P times of loops.
  • the number of feature amounts associated with the non-target event is larger than the number of feature amounts associated with the target event among the feature amounts used for learning of one classifier. It is desirable to choose to Because unintended events include events of various behaviors, a large amount of data is required to perform sufficient learning.
  • step S16 all of the feature amounts associated with the target event are selected for the feature amounts used for learning of one classifier, and one for the feature amounts associated with the non-target event. It is desirable to select a department. Some target events have a low frequency of occurrence. For well-classified target events, it is often better to select all to improve the performance of the classifier. On the other hand, for non-target events, a large number of data with various characteristics can be obtained, so selecting all may result in overall degradation of the performance of multiple classifiers, and it is better to select some of them. There are many. In addition, when selecting a part of the feature amount associated with the non-target event, it is desirable to be performed at random using a random selection algorithm or the like as described above.
  • the feature quantities calculated in steps S12 and S22 include the variance of time series data at least within a predetermined period.
  • the time variation of the measurement value by the sensor 11 is often large, and in particular, the characteristic characteristic of the dispersion often appears among various statistics. .
  • the calculation of the feature amount in steps S12 and S22 is performed based on time series data corresponding to at least one of the occurrence time and the end time of the target event.
  • the measured value by the sensor 11 often fluctuates greatly at the occurrence time and end time of the target event, and in the period between the occurrence time and the end time, the fluctuation of the measured value by the sensor 11 is often not so large. Therefore, more effective learning can be performed by performing learning using the feature amount obtained based on at least one of the generation time and the end time indicating the characteristic behavior.
  • the method of dividing the time series data shown in FIG. 4 is arbitrary, from the viewpoint of easiness in applying the method, it is division by a period that can equally divide one day. Is desirable. For example, one day is equally divided into 48 by setting the period T1 sequentially from 00:00 to 0:30 and the period T2 from 0:30 to 1:00 in steps of 30 minutes. Preplanned events such as inspections at plant 1 are often performed regularly at the same time every day, and from the viewpoint of work scheduling, such as 2 o'clock, 4:30, etc. It is often set to time. In order to adjust to the occurrence time of such an event, it is desirable to divide the period so as to equally divide one day.
  • the feature amounts based on at least one day of continuous time-series data for the feature amounts associated with the non-target event It is desirable to select in such a combination that all are included.
  • One day's continuous time-series data is typically one day's worth of time-series data from 0 o'clock of a certain day, but if it is continuous 24 hours, from 18 o'clock of the certain day to the next day It may be time series data crossing the day as 18 o'clock.
  • the characteristics of an unintended event that occurs at a determined time of the day or an unintended event that occurs less frequently, such as once a day, are taken.
  • the likelihood of spills can be reduced and the performance of the classifier can be improved. For example, in the case where it is planned to inspect the facility at 4 o'clock in the plant 1, if the selection is made excluding the period including 4 o'clock, the feature of the inspection of this facility will be missed.
  • the check that is performed every day at 4 o'clock is not excluded, so it is possible to eliminate the omission of this check.
  • the division of the predetermined period in step S11 and the division of the predetermined period in step S21 be performed on the same basis. For example, if the division of the predetermined period in step S11 divides one day into 48 equal parts, it is desirable that the division in step S21 equally divides one day into 48 parts in the same manner. Since the input data at the time of analysis is close to the input data at the time of learning, the performance of the classifier can be improved by making the method of division of the period at the time of learning the same as that at the time of analysis.
  • FIG. 20 is a block diagram showing a functional configuration of an analysis system 600 according to the third embodiment.
  • an analysis system 600 includes an analysis unit 602 including a classifier that classifies event types on input time-series data. Further, the analysis system 600 is a first time-series data in which association of an event type in the time-series data is unconfirmed, and the first corresponding to a state in which a target event is generated by the classifier. A first time-series data classified as an event type, a second time-series data correlated with the first event type, and a second event corresponding to a state in which a target event is not generated The display information generation unit 604 generates the first display information for displaying the third time-series data associated with the type. In addition, the analysis system 600 includes an input unit 606 that receives a first input regarding association of an event type with the first time-series data. This provides the analysis system 600 capable of reducing the management burden.
  • the time-series data may not be an output value from the sensor 11 but a control signal of the device.
  • the control signal may not be an analog signal as shown in FIG. 4 and may be, for example, a binary digital value.
  • the invention can also be applied to monitoring regarding control of the device.
  • a program for operating the configuration of the embodiment to realize the functions of the above-described embodiments is recorded on a recording medium, a program recorded on the recording medium is read as a code, and a processing method is also executed by a computer. It is included in the category of each embodiment. That is, a computer readable recording medium is also included in the scope of each embodiment. Moreover, the computer program itself is included in each embodiment as well as the recording medium in which the computer program described above is recorded.
  • the recording medium for example, a floppy (registered trademark) disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM (Compact Disc-Read Only Memory), a magnetic tape, a non-volatile memory card, and a ROM can be used.
  • the program is not limited to one in which processing is executed by a single program recorded in the recording medium, but is executed on OS (Operating System) in cooperation with other software and expansion board functions. Are also included in the category of each embodiment.
  • SaaS software as a service
  • An analysis unit including a classifier that classifies an event type on input time-series data; It is a first time-series data in which the association of the event type in the time-series data is unconfirmed, and is a first event type corresponding to a state in which a target event is generated by the classifier. In the first time-series data classified into two, the second time-series data associated with the first event type, and the second event type corresponding to a state in which the target event is not generated.
  • a display information generation unit that generates first display information for displaying the associated third time-series data;
  • An input unit that receives a first input regarding association of the event type with the first time-series data;
  • An analysis system comprising:
  • the learning apparatus further comprising: a learning unit that performs learning of the classifier by using, as teacher data, the first time-series data to which the association of the event type has been input by the input unit. Analysis system.
  • the analysis unit determines the event type based on the classification result of the classifier, The analysis system according to appendix 3 or 4, wherein the input unit further receives a second input related to a condition for determining the event type.
  • the display information generation unit further generates third display information for displaying a state of confusion of a plurality of the event types in the classification by the classifier. Analysis system described in Section.
  • the display information generation unit is configured to display the first time-series data, the second time-series data, and the third time-series data in a first direction.
  • the analytical system according to any one of Appendices 1 to 7, characterized in that
  • the display information generation unit is configured to display the first time-series data, the second time-series data, and the third time-series data in a plurality in a second direction.
  • the analysis system according to any one of appendices 1 to 8, wherein the display information of 1 is generated.
  • the display information generation unit may perform display based on the feature of the first time-series data, the feature of the second time-series data, and the feature of the third time-series data.
  • the analysis system according to any one of Appendices 1 to 10, which generates display information of
  • Generating first display information for displaying third time-series data Accepting a first input regarding association of an event type with the first time-series data
  • a storage medium storing a program for executing the program.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成する表示情報生成部と、前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付ける入力部と、を備えることを特徴とする分析システムが提供される。

Description

分析システム、分析方法及び記憶媒体
 本発明は、分析システム、分析方法及び記憶媒体に関する。
 プラントの管理等に用いられる異常検出手法に関する種々の検討が行われている。特許文献1のイベント解析装置は、発生日時と機器識別子とイベント種別識別子とを含むイベントログに基づいてベイジアンネットワークを生成するベイジアンネットワーク生成部を有する。イベント解析装置は、ベイジアンネットワークを利用して機器イベントの解析を行うことができ、イベントの因果関係を把握することができる。
 特許文献2のプラント監視装置は、点検作業実施時に点検作業の属性を識別した点検実施信号をプラントから入力する点検実施信号入力部を有する。点検実施信号の入力の有無により、プロセス信号の異常が検出された際にその異常が点検に起因するものであるか否かを判定でき、異常解析の作業負担を軽減することができる。
特開2014-211837号公報 特開2014-235603号公報
 特許文献1及び特許文献2に記載の技術において、データとイベントの関連付けに要する作業量が多く、管理負担が大きいことが課題となり得る。
 本発明は、上述の課題に鑑みて行われたものであって、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することを目的とする。
 本発明の1つの観点によれば、入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成する表示情報生成部と、前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付ける入力部と、を備えることを特徴とする分析システムが提供される。
 本発明によれば、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することができる。
本発明の第1実施形態に係るプラント及び分析システムの全体構成を示す概略ブロック図である。 本発明の第1実施形態に係る分析システムのハードウェア構成例を示すブロック図である。 本発明の第1実施形態に係る記憶部及びイベント種別入力部の機能構成を示すブロック図である。 本発明の第1実施形態に係る時系列データの例を示すグラフである。 本発明の第1実施形態に係るイベント種別入力の概略を示すフローチャートである。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力のための画面例である。 本発明の第1実施形態に係るイベント種別入力方法の例を示すフローチャートである。 本発明の第1実施形態に係るイベント種別入力方法の例を示すフローチャートである。 本発明の第1実施形態に係るイベント種別入力方法の例を示すフローチャートである。 本発明の第2実施形態に係る学習部及び記憶部の機能構成を示すブロック図である。 本発明の第2実施形態に係る分類器の学習動作を示すフローチャートである。 本発明の第2実施形態に係る分析部及び記憶部の機能構成を示すブロック図である。 本発明の第2実施形態に係るイベントの判別動作を示すフローチャートである。 本発明の第3実施形態に係る分析システムの機能構成を示すブロック図である。
 以下、図面を参照して、本発明の実施形態を説明する。なお、以下で説明する図面において、同一の機能又は対応する機能を有する要素には同一の符号を付し、その繰り返しの説明は省略することもある。
 [第1実施形態]
 本発明の第1実施形態による分析システム2について説明する。まず、本実施形態による分析システム2及び分析の対象であるプラント1を含む概略構成について図1を用いて説明する。図1は、本実施形態に係るプラント1及び分析システム2の全体構成を示す概略ブロック図である。
 図1に示されるようにプラント1には、プラント1の状態を分析する分析システム2が有線又は無線により通信可能に接続されている。プラント1は、例えば、化学プラント、発電所、医薬品工場、組み立て工場等であり得る。分析システム2は、例えば、プラント1の監視装置であり得る。
 プラント1には、プラント1内に設置される装置の状態、配管を流れる流体の状態等を監視するための複数のセンサ11及び時刻取得部12が設けられている。センサ11は、例えば、温度センサ、湿度センサ、圧力センサ、流量センサ等であり得る。図1では3個のセンサ11が図示されているが、これは例示であり、センサ11の個数は任意である。
 時刻取得部12は、複数のセンサ11の出力データをデータ出力時刻と対応付けられた時系列データとするために用いられる現在時刻を取得する。時刻取得部12は、例えば、複数のセンサ11の制御装置に設けられたリアルタイムクロックであり得る。このような構成により、プラント1は分析システム2に複数のセンサ11の出力に基づく時系列データを供給する。当該時系列データは、例えば、プラント1内に設けられた装置内の温度、湿度等の測定値の時系列データ、プラント1内に設けられた配管内の圧力、流量等の測定値の時系列データ等であり得る。なお、図1のように複数のセンサ11に対して1つの時刻取得部12が設けられる構成であってもよいが、複数のセンサ11にそれぞれ対応する複数の時刻取得部12が設けられる構成であってもよい。また、時刻取得部12は分析システム2側に設けられていてもよい。
 分析システム2は、学習部21、分析部22、記憶部23及びイベント種別入力部24を備えている。記憶部23は、プラント1から出力された時系列データをプラント1の状態を示すデータとして記憶する。イベント種別入力部24は、所定の期間に区分された時系列データの各期間に、プラント1で発生したイベントの種別を対応付ける入力インターフェースである。当該イベント種別の対応付けは、分析システム2の管理者により入力される。これにより、記憶部23は、イベント種別が対応付けられた状態の時系列データを記憶する。なお、「イベント」とは、各時刻におけるプラント1の状態を意味する。例えば、プラント1内で点検作業員による設備、配管等の点検作業が行われている状態、作業員による設備のマニュアル作業が行われている状態等は、「イベント」の一種である。また、後述するように、通常運転状態及び異常運転状態も「イベント」に含まれる。
 学習部21は、記憶部23に記憶された時系列データを特徴量に変換し、当該特徴量とこれに対応付けられたイベント種別とを教師データとして用いて、複数の分類器の機械学習を行う。本明細書では、機械学習のことを単に学習と呼ぶこともある。学習済みの複数の分類器は、例えば記憶部23に記憶される。分析部22は、記憶部23に記憶された時系列データを特徴量に変換し、学習部21での学習により得られた複数の分類器を用いて当該特徴量に対応するイベントの分類を行い、プラント1で発生したイベントの判別を行う。本実施形態の分析システム2は、プラント1で発生したイベントの種別(例えば、正常運転、点検作業、異常運転等)を自動で判別することができ、プラント1の異常検出等を行うことができる。
 図1に示す構成は一例であり、プラント1で得られた時系列データの分析が可能であればその構成は適宜変更可能である。例えば、分析システム2はプラント1の内部に設けられる構成であってもよく、学習部21が分析システム2の外部に学習システムとして設けられる構成であってもよい。
 本実施形態による分析システムのハードウェア構成例について図2を用いて説明する。図2は、第2実施形態に係る分析システム2のハードウェア構成例を示すブロック図である。なお、分析システム2は、単一の装置により構成されていてもよいし、有線又は無線で通信可能に接続された2つ以上の物理的に分離された装置により構成されていてもよい。
 分析システム2は、図2に示されるように、CPU(Central Processing Unit)2002と、ROM(Read Only Memory)2004と、RAM(Random Access Memory)2006と、HDD(Hard Disk Drive)2008とを備えている。また、分析システム2は、通信インターフェース(I/F(Interface))2010を備えている。また、分析システム2は、ディスプレイコントローラ2012と、ディスプレイ2014とを備えている。更に、分析システム2は、入力装置2016を備えている。CPU2002、ROM2004、RAM2006、HDD2008、通信I/F2010、ディスプレイコントローラ2012及び入力装置2016は、共通のバスライン2018に接続されている。
 CPU2002は、分析システム2の全体の制御及び演算処理を行う。CPU2002は、HDD2008等に記憶されたプログラムをRAM2006にロードして実行することにより、分析システム2における各部の機能を実現する。
 ROM2004には、ブートプログラム等のプログラムが記憶されている。RAM2006は、CPU2002がプログラムを実行する際のワーキングエリアとして使用される。また、HDD2008には、CPU2002が実行するプログラムが記憶されている。
 また、HDD2008は、記憶部23等の分析システム2における記憶機能を実現する記憶装置である。なお、分析システム2に用いられる記憶装置は、不揮発性であればHDD2008に限定されるものではなく、例えばフラッシュメモリ等であってもよい。
 通信I/F2010は、ネットワークを介したプラント1との間のデータの通信を制御する。ディスプレイコントローラ2012には、表示部としての機能を提供するディスプレイ2014が接続されている。ディスプレイコントローラ2012は、CPU2002とともに表示させる画像に関するデータを出力する出力部として機能し、出力されたデータに基づく画像がディスプレイ2014に表示される。
 入力装置2016は、ユーザがイベント種別入力部24への入力を行うためのキーボード、マウス等のハードウェアである。入力装置2016は、ディスプレイ2014に組み込まれたタッチパネルであってもよい。分析システム2の管理者は、入力装置2016を介して、分析システム2へのイベント種別の入力、処理の実行指示の入力等を行うことができる。
 なお、分析システム2のハードウェア構成は、上述した構成に限定されるものではなく、種々の構成とすることができる。
 図3は、本実施形態に係る記憶部23及びイベント種別入力部24の機能構成を示すブロック図である。記憶部23は、時系列データ記憶部231、イベント種別記憶部232、特徴量記憶部233、教師データ記憶部234及び分類器記憶部235を備える。イベント種別入力部24は表示情報生成部241及び入力部242を備える。
 時系列データ記憶部231は、複数のセンサ11から出力された時系列データを記憶する。図4を参照して時系列データの例を説明する。図4は、本実施形態に係る時系列データの例を示すグラフである。図4には、センサ11による計測値の時間変動が3個分例示されている。図4のグラフの縦軸はセンサ11の計測値であり、単位は任意である。図4のグラフの横軸は時刻取得部12で取得された時刻である。図4に示されるように、時系列データは、N個の所定の期間(T1、T2、T3、…、TN)に区分されている。各区間のデータをN個の別のデータとして扱い、センサ11の個数をM個とすると、時系列データ記憶部231に記憶されている時系列データには、Z=N×M個のデータが含まれていると言える(Nは2以上、Mは1以上の整数)。
 なお、時系列データ記憶部231にセンサ11による計測値が記憶される際には、後述する特徴量の変換に適するように、デジタルデータへの変換が行われる。具体的には、不図示のアナログデジタル変換器により、センサ11による計測値の時系列データに対して標本化、量子化等の処理が行われ、デジタルデータに変換される。
 イベント種別記憶部232は、分析システム2の管理者によりイベント種別入力部24に入力された、各期間に対応するイベント種別を記憶する。イベント種別の入力は、例えば、分類の対象にしようとしているイベント(対象イベント)と、その発生時刻とを管理者がイベント種別入力部24に入力することによりなされ得る。入力する対象イベントの種別は複数個であってもよい。同時刻に複数の対象イベント(対象イベントA及び対象イベントBとする)が重複して発生した場合には、対象イベントA及び対象イベントBとは別の対象イベントCが発生したものとして取り扱うことができる。このイベント種別の入力についての詳細は後述する。
 特徴量記憶部233は、時系列データ記憶部231に記憶されている時系列データから算出された1つ又は複数の特徴量を記憶する。特徴量の例としては、該当期間内(例えば期間T1内)におけるセンサ11による計測値の分散、標準偏差、最大値と最小値の差(レンジ)、勾配、平均等の統計量が挙げられる。1つのデータごとに算出される特徴量の個数をK個(Kは1以上の整数)とすると、算出される特徴量の個数は、N個の期間のそれぞれに対しM×K個、すなわち合計N×M×K個である。
 ここで、管理者が何らかのイベントの発生を入力しなかった時間帯、例えば、プラント1が通常運転を行っている時間については、対象イベントとは別の種別のイベントが発生したものとして扱われる。このイベントは、非対象イベントと呼ばれる。すなわち、対象イベントとして、対象イベントA及び対象イベントBが定義されていた場合、イベント種別は、対象イベントA、対象イベントB及び非対象イベントXの3種類となる。また、対象イベントは第1のイベント種別と呼ばれることもあり、非対象イベントは第2のイベント種別と呼ばれることもある。
 教師データ記憶部234は、学習部21に含まれる分類器に対して教師あり機械学習を行わせるための教師データを記憶する。教師データは、特徴量記憶部233に記憶されている特徴量と、イベント種別記憶部232に記憶されているイベント種別とをそれぞれの時刻又は期間に基づいて対応付けることにより生成される。
 分類器記憶部235は、教師データ記憶部234に記憶されている教師データを用いて教師あり機械学習を行うことにより得られた分類器を記憶する。ここで行われる教師あり機械学習は、教師データのうちの特徴量を分類の推定のために必要なデータとし、イベント種別を特徴量に基づいて推定されるべき正解(教師)とするものである。教師あり機械学習に用いられる手法としては、例えば、サポ-トベクターマシン、ランダムフォレスト、ニューラルネットワーク等が挙げられる。分類器は複数個(P個とする)であり得る。P個の分類器の学習を、組み合わせが互いに異なる一部のデータを用いて行うことにより、生成されるP個の分類器は、同一種類ではあるが、分類基準が互いに異なる分類器となり得る。
 表示情報生成部241は、分析システム2の管理者にイベント種別の入力を行わせるためのデータ及びGUI(Graphical User Interface)をディスプレイ2014に表示させるための表示情報を生成する。入力部242は、ディスプレイ2014に表示されたGUIへのイベント種別の対応付けの入力を受け付ける。入力されたイベント種別の対応付けはイベント種別記憶部232に記憶される。
 本実施形態は、時系列データのうちの一部に対しては既にイベント種別が対応付けられており、これを教師データとした学習済みの分類器が生成されている場合に、更に別の時系列データへのイベント種別の対応付けを追加するという状況に関するものである。イベント種別の対応付けを追加して教師データをより充実させて分類器の再学習を行うことで、分類器の性能を向上させることができる。したがって、時系列データのうちの一部へのイベント種別の対応付け、分類器の学習等はあらかじめ行われているものとし、その手法は特に限定されるものではない。
 図5は、本実施形態に係るイベント種別入力の概略を示すフローチャートである。図5を参照して本実施形態のイベント種別入力の概略を説明する。なお、図5のフローチャートは説明の簡略化のために概略を示したものに過ぎず、処理、分岐等の追加、順序の変更等は適宜行われ得る。
 ステップS31において、分析部22の分類器は、イベント種別との対応付けが未確定である時系列データの特徴量を特徴量記憶部233から取得し、イベント種別の分類を行う。なお、この時系列データは第1の時系列データと呼ばれることもある。
 ステップS32において、表示情報生成部241は、表示情報の生成を行う。表示情報は、分類器によりある対象イベントであると分類された時系列データと、当該対象イベントに対応付けられている時系列データと、非対象データに対応付けられている時系列データとをディスプレイ2014に表示させるための情報である。この表示情報は第1の表示情報と呼ばれることもある。また、当該対象イベントに対応付けられている時系列データは、第2の時系列データと呼ばれることがあり、非対象データに対応付けられている時系列データは第3の時系列データと呼ばれることがある。
 ステップS33において、入力部242は、イベント種別の対応付けに関する入力を受け付ける。この入力内容は第1の入力と呼ばれることもある。管理者がイベント種別を修正する入力をした場合には、処理はステップS34に移行する(ステップS33においてYES)。管理者が分類器によって分類されたイベント種別を修正せず確定した場合、分類器による分類に問題は無いため、処理は終了する(ステップS33においてNO)。なお、第1の時系列データとこれに対応付けられた修正済みのイベント種別は教師データとして教師データ記憶部234に追加される。
 ステップS34において、学習部21は、イベント種別の修正入力が行われた第1の時系列データを含む教師データを用いて分類器の再学習を行う。その後処理は再びステップS31に移行し、同様の処理が繰り返される。
 図6乃至図12は、本実施形態に係るイベント種別入力のための画面例であり、図5の処理を行うためのGUIに相当するものである。以下、これらの図を参照して、表示情報生成部241により生成される表示情報に基づいてディスプレイ2014に表示されるデータ表示及びイベント種別入力用の画面例を説明する。
 以下に述べる画面例は、時系列データのイベント種別の対応付けを追加するための画面である。時系列データのうちの一部に対してはあらかじめイベント種別が対応付けられており、これを教師データとした学習済みの分類器が生成されていることを前提とする。すなわち、イベント種別が対応付けられた時系列データの個数が少ない状況で、学習用の教師データを増加させて分類器の再学習を行うという状況を想定した入力用画面である。時系列データのうちの一部へのイベント種別の対応付け、分類器の学習等は別のGUIにより既に実行されているものとする。
 図6は設定画面の表示例を示している。画面上方にはタブ301、302、303、304、305、306が表示されており、分析システム2の管理者がポインティングデバイス等により各タブを押下することによりメインウィンドウ320の表示内容が各タブに表示されたものに遷移する。図6では、「設定」と表記されたタブ301が押下されたことにより、メインウィンドウ320には設定画面が表示されている。
 また、メインウィンドウ320の左方にはサブウィンドウ310が表示されている。サブウィンドウ310には確認対象となる時系列データに付され識別子が列挙される。サブウィンドウ310及びメインウィンドウ320の左方にそれぞれ設けられたスクロールバーのノブ311、321を上下方向にスライドさせることにより、サブウィンドウ310及びメインウィンドウ320を上下方向にスクロールさせることができる。
 サブウィンドウ310及びメインウィンドウ320の下方には、プログレスバー331とボタン322が表示されている。プログレスバー331は、処理の進捗状況を表示する。イベント種別の入力が完了した後、「最終評価」と表記されたボタン322を押下することにより、メインウィンドウ320の表示をイベントの分類の評価画面に遷移させることができる。
 メインウィンドウ320には、「分類閾値(%)」、「確認件数(件)」、「センサデータ表示数(個)」及び「特徴量データ表示数(個)」のラベルが付されたテキストボックスが表示されている。「センサデータ表示数(個)」のテキストボックスは、センサデータ表示画面及びセンサデータ(長期)表示画面で表示されるデータの個数の設定を受け付ける。「特徴量データ表示数(個)」のテキストボックスは、特徴量データ表示画面で表示されるデータの個数の設定を受け付ける。
 「分類閾値(%)」のテキストボックスは、分析部22におけるイベントの判別のためのパラメータである分類閾値の入力を受け付ける。図7は、「分類閾値(%)」のテキストボックスに数値を入力した後の設定画面の表示例を示している。図7の例では、「分類閾値(%)」のテキストボックスに「80」を入力した場合に、サブウィンドウ310に確認対象が表示され、「確認件数(件)」のテキストボックスに確認すべきデータの総数「10」が表示されたことを示している。
 分類閾値について説明する。分類閾値は、分類器による分類結果からイベント種別を判別する条件を定めるパラメータの1つである。分析部22に判定基準の異なる複数の分類器が設けられている場合、複数の分類器が異なる分類結果を出力することがある。このとき、最も多くの分類器が出力した結果を採択する多数決論理によりイベント種別を判定してもよいが、複数の分類器の分類結果がばらついている場合には、確実性が担保できないこともある。そのため、分析部22は、分類閾値(本例では80%)よりも多くの割合の分類器が同じ分類結果を出力した場合にのみその結果を採択し、各イベント種別に分類した分類器の個数の最大値が所定の閾値以下である場合にその結果を棄却する。このようにすることで、確実性の低い判別結果を棄却することができ、イベントの判別性能を高めることができる。
 サブウィンドウ310には、確認対象となるデータの識別子が列挙される。本例では、1日単位分の時系列データを一単位とした特徴量の算出が行われている場合を想定しており、センサ11においてデータを計測した日付が識別子となっている。そのため、図7では「10/01/15」(2010年1月15日を示す)等のように日付が縦方向に列挙されている。なお、1時間単位、1分単位などより短い期間を一単位としている場合には、日付だけでなく時刻も識別子に含めることが望ましい。なお、サブウィンドウ310に表示されたデータの識別子は押下することが可能であり、押下されると、後述のセンサデータ表示画面に遷移して対応するデータが表示される。
 図8はセンサデータ表示画面の表示例を示している。「センサデータ」と表記されたタブ302又はサブウィンドウ310に表示されたデータの識別子が押下されると、メインウィンドウ320に図8に示されるような複数のセンサデータ(時系列データ)が表示される。このメインウィンドウ320の表示は図5のステップS32に相当する表示であり、表示情報生成部241により生成された第1の表示情報に基づくものである。
 サブウィンドウ310に表示されている識別子のうち、既にイベント種別の対応付け(本表示画面ではラベルと表記)が完了しているものは網掛けで表示されており、メインウィンドウ320に表示中のものについては白黒反転して表示されている。
 メインウィンドウ320には、行列状に時系列データが並んで配置されている。水平方向(第1の方向)には確認対象の時系列データ、対象イベントの時系列データ、正解事象の時系列データ、非対象イベントの時系列データが並べられている。また、垂直方向(第2の方向)には重要度順に複数の時系列データが並べられている。ここで、確認対象の時系列データとは、イベント種別との対応付けが未確定である時系列データであって、ステップS31において分類器によりある対象イベントであると分類された第1の時系列データであり、管理者による確認対象となる時系列データである。本例では、分類器により「A試験」という名称の対象イベントであると分類されたものとする。このように時系列データを配列することで、管理者は一目で確認対象の時系列データが正解事象の時系列データ、非対象イベントの時系列データのどちらに類似しているかを判断することができる。
 対象イベントの時系列データとは、分類器による分類結果と同じ対象イベント(すなわち、A試験)と既に対応付けられている第2の時系列データである。正解事象の時系列データについては後述する。非対象イベントの時系列データとは、非対象イベントと既に対応付けられている第3の時系列データである。重要度とは、複数の時系列データのうちの、対応付けを行って学習に用いた場合における寄与度の度合いである。例えば、機械学習のアルゴリズムにランダムフォレストを採用している場合には、重要度の指標としてジニ係数が用いられ得る。
 メインウィンドウ320の下方には、プルダウンメニュー333及びボタン334、335が表示されている。プルダウンメニュー333は、管理者にイベント種別を選択又は入力させるためのメニューである。本例では、プルダウンメニュー333は、「A試験」、「B試験」、「対象外」、「新規」のいずれかの項目から選択するように構成されている。デフォルトでは、プルダウンメニュー333には、分類器の分類結果と同一の「A試験」が表示される。例えば、管理者が確認対象の時系列データを「A試験」とは別のイベント種別である「B試験」であると判断した場合には、「B試験」を選択することで、イベント種別の設定が可能である。また、「対象外」は、管理者が確認対象の時系列データを分類対象外のデータであると判断した場合に選択する項目であり、「新規」は、「A試験」及び「B試験」とは別のイベント種別として区別すべきと判断した場合に選択する項目である。「新規」が選択された場合には、管理者に項目名を入力させるウィンドウ、テキストボックス等が更に表示されてもよい。
 「ラベル確定」と表記されたボタン334が押下されると、プルダウンメニュー333で選択されたイベント種別の設定が確定し、教師データが更新される。また、確定したイベント種別と既に対応付けられている時系列データが正解事象の時系列データの欄に表示される。例えば、プルダウンメニュー333で「B試験」が選択された場合には、B試験と既に対応付けられている時系列データが正解事象として表示される。なお、図8ではラベル確定前の画面例を示しているため、正解事象の欄にはデータが表示されていない。プルダウンメニュー333及びボタン334によるイベント種別の修正入力の受け付けは、図5のステップS33に相当する。
 「モデル更新」と表記されたボタン335が押下されると、更新された教師データを用いた分類器(本表示画面ではモデルと表記)の再学習が行われる。この再学習は、図5のステップS34に相当する。その後、再び再学習後の分類器によりイベント種別との対応付けが未確定である時系列データの分類が行われ、設定画面に遷移する。この分類は図5のステップS31に相当する。
 なお、対象イベントの時系列データ、正解事象の時系列データ及び非対象イベントの時系列データは、教師データに含まれる時系列データから自動的に選択される。より具体的には、対象イベントの時系列データの列(左から2列目)には、分類器により分類された確認対象のイベント種別(図ではA試験)と同じイベント種別の1期間分の時系列データが教師データの中から選択されて表示される。正解事象の時系列データの列(左から3列目)には、ボタン334の押下により確定したイベント種別と同じイベント種別の1期間分の時系列データが教師データの中から選択されて表示される。なお、イベント種別の確定前には、図8に示されているように正解事象の時系列データは表示されない。非対象イベントの時系列データの列(左から4列目)には、非対象イベントの1期間分の時系列データが教師データの中から選択されて表示される。このとき、多数の教師データの中からどのデータを表示させるかを決めるための選択は、無作為なものであってもよいが、管理者による確認をより容易にするため、同じ行の確認対象の時系列データとの類似度の高いものが選択されることが好適である。この選択時に参照される類似度の例としては、データ波形間のユークリッド距離の逆数、データ波形間のDTW(Dynamic Time Warping)距離の逆数が挙げられる。ここで、取得したデータそのものに対して類似度の計算を行ってもよいが、類似度の計算の前に所定の処理を行ってもよい。類似度の計算前に行われる所定の処理の例としては、期間ごとのデータを平均値0、分散1となるように標準化する処理が挙げられる。
 図9はセンサデータ(長期)表示画面の表示例を示している。「センサデータ(長期)」と表記されたタブ303が押下されると、メインウィンドウ320に図9に示されるような複数のセンサデータ(時系列データ)が表示される。図8との違いは、時系列データのグラフの横軸がより長期になっている点と、表示期間の入力を行うテキストボックス336がメインウィンドウ320の下方に表示されている点である。テキストボックス336に所望の期間を入力すると各時系列データの横軸が再設定されグラフの更新が行われる。なお、グラフの横軸の中心の時刻は、図8のセンサデータ表示画面におけるグラフの横軸の中心の時刻と同一になるように設定される。その他の点は図8と同様であるため説明を省略する。図9のセンサデータ(長期)表示画面を更に参照することで、長期的な時系列データの特徴を考慮したイベント種別の設定が可能となる。
 図10は特徴量データ表示画面の表示例を示している。「特徴量データ」と表記されたタブ304が押下されると、メインウィンドウ320に図10に示されるような複数の特徴量が表示される。水平方向(第1の方向)には対象イベントの時系列データの特徴量、正解事象の特徴量、非対象イベントの特徴量の値を示す箱ひげ図が並べられている。図中の破線は確認対象の時系列データから算出された特徴の値を示している。また、垂直方向(第2の方向)には重要度順に各データが並べられている。正解事象の欄は、図8及び図9と同様にボタン334が押下され、確認対象のイベント種別が確定した後に表示される。その他の項目は図8及び図9と同様であるため説明を省略する。図10のセンサデータ(長期)表示画面を更に参照することで、特徴量の値を考慮したイベント種別の設定が可能となる。なお、特徴量の値は、図10に示されるように箱ひげ図により可視化されているが、特徴量の値そのものが数値で表示される表示形態であってもよい。この特徴量の表示は、表示情報生成部241により生成された第4の表示情報に基づくものである。
 図11は評価画面の表示例を示している。「評価」と表記されたタブ305が押下されると、メインウィンドウ320に図11に示されるようなグラフ及びテキストボックスが表示される。この表示は、表示情報生成部241により生成された第2の表示情報に基づくものである。
 グラフの横軸は分類閾値であり、縦軸は分類の評価結果であるPrecision(適合率)及びRecall(再現率)である。分類閾値を大きくすると分類器の出力の一致度が高い場合にのみその結果が採択されるのでPrecisionは高くなるが、棄却される確率も高くなるため、Recallは小さくなる。このようにPrecisionとRecallはトレードオフの関係となる。本評価画面は、両者の傾向を確認しながら分類閾値を適切に決定するために用いられる。
 「分類閾値(%)」のテキストボックスは、分類閾値の入力を受け付ける。この入力は第2の入力と呼ばれることもある。分類閾値が入力されるとその値に対応したPrecisionとRecallがそれぞれのテキストボックスに自動的に表示される。図11は、分類閾値に「30」が入力されたことにより、PrecisionとRecallの値がいずれも「80」であると表示されたことを示している。なお、分類閾値のデフォルト値はF-measure等の所定の性能指標が最大になるような値とする。F-measureとは、PrecisionとRecallの調和平均である。
 メインウィンドウ320の下方には、ボタン337、338が表示されている。ボタン337については図12の説明において後述する。「最終確認」と表示されたボタン338が押下されると、分類器のパラメータである分類閾値の値がテキストボックスに入力されている値で確定され、その後、メインウィンドウ320の表示が検証画面に遷移する。
 図12は検証画面の表示例を示している。「検証」と表記されたタブ306が押下されると、メインウィンドウ320に図12に示されるような表及びチェックボックスが表示される。図12の表は対象イベント1と対象イベント2との分類における混同の状況を示している。例えば1行目は、教師データ内のイベント種別が「A1試験」であるデータとイベント種別が「A2試験」であるデータとの混合率が20%であり、この分類のPrecisionとRecallがそれぞれ99%と79%であることを示している。この検証画面の表示は、表示情報生成部241により生成された第3の表示情報に基づくものである。
 ここで、XイベントとYイベントの混合率とは、(XイベントをYイベントと誤判別した数+YイベントをXイベントと誤判別した数)/(XイベントをXイベントと判別した数+YイベントをYイベントと判別した数)で定義される。混合率が高いイベント種別は、同一のイベント種別として扱っても問題ない場合がある。その場合、混合率が高いイベント種別を1つのイベント種別にマージすることでよりイベントの判別性能が向上し得る。
 「マージ?」の欄のチェックボックスは、マージ(イベント種別の合併)を行う対象イベントを設定する欄である。また、メインウィンドウ320の下方には、ボタン337、339、340が表示されている。「マージ?」のチェックボックスにチェックが入った状態で「マージ」と表記されたボタン339を押下すると、チェックが入った行の2つの対象イベントがマージされる。その後、メインウィンドウ320の表示が評価画面に遷移する。なお、このマージの要否の入力は、第3の入力と呼ばれることもある。
 「リセット」と表記されたボタン337を押下するとマージする前の状態に戻すことができる。図11に示されたボタン337も同様の機能を有する。「完了」と表記されたボタン340を押下すると分類器の学習が終了する。
 なお、図12のPrecisionとRecallは、F-measure等の分類器の性能指標が最大になる場合の値が表示される。この値が直前の評価画面で設定された値を下回る場合には図11の1行目のRecallの網掛けのように区別できる状態で表示される。
 混合率が大きい場合にマージを行うことが適切とは限らない。例えば、対象イベントの設定が適切でない場合には、マージを行うのではなく対象イベントの設定を修正したほうがよい。そのような場合は、サブウィンドウ310の識別子を押下してメインウィンドウ320の表示をセンサデータ表示画面に遷移させ、再び対象イベントの設定を行うこともできる。
 図13乃至図15は、本実施形態に係るイベント種別入力方法の例を示すフローチャートである。本処理は、図6乃至図12のGUIを用いたイベント種別入力の操作の典型例を示すものである。なお、図13乃至図15のフローチャートは行われ得る手順の一例を示したものに過ぎず、処理内容及び順序はユーザの操作手順、GUIの設計等に応じて適宜変更され得る。図6乃至図12の対応する画面例にも言及しつつ図13乃至図15の処理を説明する。
 図13のステップS31は、図5のステップS31と同様であるため説明を省略する。なお、分類器による分類の処理は、図6乃至図12の画面表示の前にあらかじめ行われ得る。
 ステップS41において、イベント種別入力部24は、分類器による分類結果の中に対象イベントに分類されたものが含まれているか否かを判断する。対象イベントに分類されたものが含まれている場合(ステップS41においてYES)、処理はステップS42からステップS45のループに移行する。対象イベントに分類されたものが含まれていない場合(ステップS41においてNO)、処理は図14のステップS51に移行する。なお、本ステップにおける判断は、管理者が分類のリストを確認し、その結果を入力部242が受け付けることにより行われるものであってもよい。
 ステップS42からステップS45のループは、対象イベントに分類されたデータのそれぞれに対して行われる。ステップS43において、分類器による分類結果を管理者に確認させるため、表示情報生成部241は、センサデータ表示画面等の表示情報の生成を行う。当該表示情報は、ディスプレイ2014に表示される。当該画面表示は、図6及び図7の設定画面、図8のセンサデータ表示画面、図9のセンサデータ(長期)表示画面、図10の特徴量データ表示画面であり得る。管理者はこれらの表示をタブ301、302、303、304の押下等の操作により、適宜遷移させながら分類結果の確認を行う。ステップS44において、入力部242は、管理者による分類結果の修正等の入力操作を受け付ける。この入力操作は、プルダウンメニュー333へのイベント種別の入力等であり得る。
 ステップS42からステップS45のループの後、ステップS34において、学習部21は、管理者によるイベント種別の設定が確認された教師データを用いて分類器の再学習を行う。図5のステップS34と同様であるため説明を省略する。その後、処理は再びステップS31に移行する。
 図14のステップS51において、表示情報生成部241は、分類閾値を管理者に入力させるため、図11の評価画面の表示情報の生成を行う。当該表示情報は、ディスプレイ2014に表示される。入力部242は、管理者による分類閾値の入力操作を受け付ける。
 ステップS52において、表示情報生成部241は、マージの要否及びマージ対象を管理者に入力させるため、図12の検証画面の表示情報の生成を行う。当該表示情報は、ディスプレイ2014に表示される。入力部242は、管理者によるマージの入力操作を受け付ける。
 ステップS53において、管理者がイベント種別の再設定が必要と判断した場合(ステップS53においてYES)、センサデータ表示画面などへの遷移の操作が行われることにより処理は図15のステップS61からステップS62のループに移行する。管理者がイベント種別の再設定がないと判断し、図12の「完了」と表記されたボタン340を押下した場合(ステップS53においてYES)、処理は終了する。
 ステップS61からステップS62のループは、イベント種別の再設定を要するデータのそれぞれに対して行われる。ステップS61からステップS62のループに含まれるステップS43とステップS44は上述のものと同様であるため説明を省略する。
 ステップS61からステップS62のループの後、ステップS34及びステップS31の処理が行われる。これらの処理は、図5のステップS31、S34と同様であるため説明を省略する。その後、処理は再び図14のステップS51に移行する。
 本実施形態の効果について説明する。本実施形態では、センサ11により多数の時系列データが得られているが、イベント種別が対応付けられた時系列データの個数が少ない状況において、少ない負担でイベント種別の対応付けを行うことができるGUIが提供される。本実施形態では、少量の学習データを用いて学習を行った分類器を用いて分類を行い、管理者はその分類結果を参照しながら必要なもののみ分類を修正すればよい。そのため、はじめから多数のデータを確認してイベント種別の対応付けを行って多量の学習データを準備する場合と比べて時系列データの確認及び対応付けの工数を削減することができる。
 また、イベント種別が対応付けられた時系列データの個数が少ない場合には、どのようにイベント種別を設定すれば適切であるかが明確でないことが多い。これに対し、本実施形態では、確認対象の時系列データに対象イベントと非対象イベントの時系列データを並べて表示することができる。これにより、確認対象の特徴が対象イベントと非対象イベントのどちらに似ているかを判断する等の方法により、管理者は対応付けの作業をより視覚的に行うことができ、効率よく対応付けを行うことができる。
 以上の理由により、本実施形態によれば、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することができる。
 [第2実施形態]
 本発明の実施にあたり適用され得る学習部21及び分析部22の構成の一例を第2実施形態として説明する。その他の構成は第1実施形態と同様であるため詳細な説明は省略する。
 図16乃至図19を相互に参照しつつ、本実施形態における分類器の学習及びイベントの判別について説明する。図16は、本実施形態に係る学習部21及び記憶部23の機能構成を示すブロック図である。図17は、本実施形態に係る分類器の学習動作を示すフローチャートである。図18は、本実施形態に係る分析部22及び記憶部23の機能ブロック図である。図19は、本実施形態に係るイベントの判別動作を示すフローチャートである。
 図16及び図17を参照しつつ本実施形態に係る分類器の学習動作を説明する。図16に示されるように、学習部21は、特徴量算出部211、教師データ生成部212、選択部213及び分類器学習部214を備える。記憶部23の構成は図3と同様であり説明を省略する。
 図17のステップS11において、分析システム2は、複数のセンサ11から出力された時系列データを取得し、時系列データ記憶部231に記憶させる。なお、ステップS11の動作は、例えば、センサ11での計測時にリアルタイムに行う等の手法により事前に行われていてもよい。
 ステップS12において、特徴量算出部211は、時系列データ記憶部231に記憶されている時系列データを読み出し、1つ又は複数の特徴量を算出する。算出された特徴量は、特徴量記憶部233に記憶される。
 ステップS13において、分析システム2のイベント種別入力部24は、各期間に対応するイベント種別の入力を受け付ける。入力されたイベント種別は、イベント種別記憶部232に記憶される。
 ステップS14において、教師データ生成部212は、特徴量記憶部233に記憶されている特徴量と、イベント種別記憶部232に記憶されているイベント種別とをそれぞれの時刻又は期間に基づいて対応付けたデータを生成する。このデータは、分類器の教師あり機械学習のための教師データとして用いられる。生成された教師データは、教師データ記憶部234に記憶される。
 その後、ステップS15からステップS18までのループがP回繰り返される(Pは2以上の整数)。ステップS16において、選択部213は、教師データ記憶部234に記憶された教師データのうち、N個の期間におけるM個のセンサ11のデータ、すなわち、Z=N×M個のデータをイベント種別ごとに分け、それぞれのイベント種別ごとに一部又は全部の期間に対応する特徴量群を選択する。例えば、対象イベントA、対象イベントB及び非対象イベントXの3種類がある場合には、対象イベントA、対象イベントB及び非対象イベントXのそれぞれに対して選択が行われる。ここで、ステップS12においてZ=N×M個のデータのうちの1つに対して複数個の特徴量が算出されている場合(Kが複数の場合)には、K個の特徴量が組として特徴量群に含まれるように選択される。このように、本ステップで選択される特徴量群は、N個の期間のうちの一部又は全部の期間(この期間の個数をN1個とする)に得られたM個のセンサのデータからK個ずつ算出されたN1×M×K個の特徴量を含む。
 ステップS17において、分類器学習部214は、ステップS16で選択された特徴量群のデータを用いて分類器の学習を行う。ここで、分類器学習部214で行われる学習は、教師あり機械学習である。より具体的には、教師データのうちの特徴量を分類の推定のために必要なデータとし、イベント種別を特徴量に基づいて推定されるべき正解(教師)とする教師あり機械学習が行われる。教師あり機械学習に用いられる手法としては、例えば、サポ-トベクターマシン、ランダムフォレスト、ニューラルネットワーク等が挙げられる。
 ステップS16及びステップS17により1個の分類器の学習が行われる。学習済みの分類器は分類器記憶部235に記憶される。以上のステップS16及びステップS17の動作がP回繰り返され、P個の分類器の学習が行われる。ここで、P回のステップS16のそれぞれにおいて、選択される特徴量群に含まれるデータの組み合わせが互いに異なるように選択が行われる。これにより、生成されるP個の分類器は、互いに異なる特徴量群に基づいて学習されたことにより、同一種類ではあるが、分類基準が互いに異なる分類器となる。
 ステップS15からステップS18の間のループがP回繰り返され、P個の分類器の学習が完了すると、図17のフローチャートによる分類器の学習動作は終了する。
 次に、図18及び図19を参照しつつ本実施形態に係るイベントの判別動作を説明する。本動作は、上述の学習動作により得られたP個の分類器を用いて、センサ11の時系列データに基づいてプラント1で発生したイベントを判別する動作である。図18に示されるように、分析部22は、特徴量算出部221、分類部222及び判別部223を備える。記憶部23の構成は図3と同様であるため説明を省略する。
 図18のステップS21において、分析システム2は、複数のセンサ11から出力された時系列データを取得し、時系列データ記憶部231に記憶させる。ステップS21の動作は、例えば、センサ11での計測時にリアルタイムに行う等の手法により事前に行われていてもよい。なお、時系列データを取得する複数のセンサ11の組み合わせは、上述の教師データの生成に用いた複数のセンサ11の組み合わせと同じものである。
 ステップS22において、特徴量算出部221は、時系列データ記憶部231に記憶されている時系列データを読み出し、1つ又は複数の特徴量を算出する。ここで、算出する特徴量の種類、個数等は上述の教師データと同じものとする。この処理は図17のステップS12と同様であるため詳細な説明を省略する。
 ステップS23において、分類部222は、分類器記憶部235に記憶されているP個の分類器のそれぞれを用いて、特徴量記憶部233に記憶されている期間ごとの特徴量を入力データとするイベント種別の分類を行う。各分類器は、入力に応じて、学習時に定義されている対象イベント及び非対象イベントのうちのいずれかのイベント分類に分類した結果を出力する。
 ステップS24において、判別部223は、P個の分類器がそれぞれ出力したP個のイベント分類の結果を統合して各期間にプラント1で発生したイベントを判別する。P個の分類器は、分類基準が互いに異なるため、異なる分類結果を出力する場合がある。そこで、1つの判別結果を得るため、判別時にP個の分類結果を統合して判別を行う。この判別は、例えば、最も多くの分類器により分類されたイベント種別に対応するイベントが分類対象期間に発生したものと判定する多数決論理により行われるが、最大値が所定の閾値以下の場合にイベントの判別結果を棄却する。
 当該棄却は、より具体的には、以下のようなアルゴリズムとすることができる。各イベント種別に分類した分類器の個数の最大値が所定の閾値よりも大きい場合、判別部223は、最も多くの分類器により分類されたイベント種別に対応するイベントが分類対象期間に発生したものと判定する。各イベント種別に分類した分類器の個数の最大値が所定の閾値以下である場合、判別部223は、対象イベントが分類対象期間に発生していないものと判定する。このようにすることで、確実性の低い判別結果を棄却することができ、イベントの判別性能を向上させることができる。
 このようにして、本実施形態の分析システム2は、複数のセンサ11で得られた時系列データに基づいて、所定の期間ごとにプラント1で発生したイベントを判別することができる。分析システム2は、イベントの判別結果をログとして記憶してもよく、イベントの判別結果に応じたメッセージを管理者に通知してもよい。イベントの判別結果に応じたメッセージとは、ディスプレイ2014への警告文章の表示、不図示の警報装置による音、光等による報知等であり得る。
 本実施形態の効果について説明する。一般に、通常運転とは抽象的な概念であるため、通常運転か否かの判断基準を定義して、通常運転であるという情報を入力することには大きな負担を要する。これに対し、本実施形態の分析システム2の運用においては、管理者は、対象イベントの発生時刻を入力すればよく、通常運転についてはその時刻を特に入力しなくても非対象イベントとして扱われるので、通常運転についての情報の入力は必須ではない。また、分類の必要がないイベントについても同様に、特に入力しなくても非対象イベントとして扱うことができる。したがって、本実施形態の分析システム2は管理者が入力しなければならない情報を少なくすることができ、管理負担を低減することができる。
 通常運転を定義せず対象イベント以外を一括して非対象イベントとして扱っていることから、学習の状況によってはP個の分類器のうちの一部の分類器で正しくイベントが分類されない場合があり得る。しかしながら、本実施形態の学習システムは、基準が互いに異なる複数の分類器により分類を行い、その結果を統合することで一部の分類器の誤分類の影響を低減することができる。そのため、分析システム2全体としては十分な判別性能を確保することができる。
 また、本実施形態の分析システム2は、分類すべきイベント種別が増加した場合など、更新が必要な場合の管理者の作業量が少ない。本実施形態では教師あり機械学習により学習させた分類器を用いているため、分類すべきイベント種別が増加した場合には、管理者は、増加後のイベント種別と発生時間帯を入力することにより教師データを更新して、分類器を再学習させるだけでよい。したがって、システムの改修、データベースの再構築のような多大な管理負担が生じない。更に、分析時にプラント1側に追加の作業を要求する必要がない点においても大きな管理負担を要しない構成となっている。
 以上のように、本実施形態によれば、管理負担を低減することが可能な学習システム、分析システム、学習方法及び記憶媒体を提供することができる。
 なお、ステップS16におけるデータの選択手法は限定されないが、P回のループでより確実に異なるデータが選択されるように、乱択アルゴリズム等を用いて無作為に行われることが望ましい。
 また、ステップS16における選択において、1つの分類器の学習に用いられる特徴量群のうち、非対象イベントに対応付けられた特徴量の個数を対象イベントに対応付けられた特徴量の個数よりも多くするように選択することが望ましい。非対象イベントは様々な挙動のイベントを含むため、十分な学習を行うためには、多数のデータが必要となるためである。
 また、ステップS16における選択において、1つの分類器の学習に用いられる特徴量について、対象イベントに対応付けられた特徴量についてはすべてを選択し、非対象イベントに対応付けられた特徴量については一部を選択することが望ましい。対象イベントの中には発生頻度が低いものがある。分類が明確な対象イベントについては、分類器の性能の向上のため、すべてを選択する方がよい場合が多い。一方、非対象イベントについては多様な特徴を持つデータが多数得られるため、すべてを選択すると逆に複数の分類器の性能が全体的に低下することがあり、一部を選択する方がよい場合が多い。なお、非対象イベントに対応付けられた特徴量の一部を選択する際には、上述のように乱択アルゴリズム等を用いて無作為に行われることが望ましい。
 また、ステップS12、S22で算出される特徴量としては、少なくとも所定の期間内における時系列データの分散を含むことが望ましい。プラント1において重要なイベントが発生した場合には、センサ11による計測値の時間変動が大きくなる場合が多く、様々な統計量の中で特に分散に特徴的な挙動が現れることが多いためである。
 また、ステップS12、S22での特徴量の算出は、対象イベントの発生時刻及び終了時刻の少なくとも一方のみに対応する時系列データに基づいて行われることが望ましい。センサ11による計測値は、対象イベントの発生時刻及び終了時刻に大きく変動する場合が多く、発生時刻から終了時刻の間の期間においては、センサ11による計測値の変動はさほど大きくない場合が多い。そのため、特徴的な挙動を示す発生時刻及び終了時刻の少なくとも一方のみに基づいて得られた特徴量を用いて学習を行うことで、より有効な学習を行うことができる。
 また、図4に示された時系列データの区分の仕方は任意であるが、手法を適用する際の容易性の観点からは1日を等分することができるような期間による区分であることが望ましい。例えば、期間T1を0時00分から0時30分、期間T2を0時30分から1時00分というように30分刻みで順次設定することで、1日が48等分される。プラント1における点検等の事前に計画されているイベントは、毎日同じ時刻に定期的に行われることが多く、また、作業のスケジューリングの観点から2時、4時30分等のようにキリのよい時間に設定されていることが多い。このようなイベントの発生時間に合わせるため、1日を等分するように期間を区分することが望ましい。
 また、ステップS16における選択において、1つの分類器の学習に用いられる特徴量の組のうち、非対象イベントに対応付けられた特徴量については少なくとも1日分の連続した時系列データに基づく特徴量がすべて含まれるような組み合わせで選択することが望ましい。1日分の連続した時系列データとは、典型的にはある日の0時からの1日分の時系列データであるが、連続した24時間であれば、ある日の18時から翌日の18時のように日をまたいだ時系列データであってもよい。1日分のデータをすべてまとめて選択することにより、1日の中で決められた時間に発生する非対象イベント又は1日に1回のように低頻度に発生する非対象イベントの特徴を取りこぼす可能性を低減することができ、分類器の性能を向上させることができる。例えば、プラント1において毎日4時にある設備の点検が予定されている場合に、4時を含む期間を除いた選択がなされると、この設備の点検の特徴を取りこぼすことになる。これに対し、1日分のデータをまとめて選択すれば、毎日4時に行われる点検は除外されないため、この点検の取りこぼしを無くすことができる。
 また、ステップS11における所定の期間の区分と、ステップS21における所定の期間の区分は、同じ基準で行われていることが望ましい。例えば、ステップS11における所定の期間の区分が1日を48等分するものであれば、ステップS21における区分もこれと同様に1日を48等分するものであることが望ましい。学習時と分析時の期間の区分の仕方を同一とすることで、分析時の入力データが学習時の入力データに近くなるため、分類器の性能を向上させることができる。
 [第3実施形態]
 上述の第1実施形態及び第2実施形態において説明した分析システム2は、第3実施形態によれば、図20に示すような分析システム600として構成することもできる。図20は、第3実施形態に係る分析システム600の機能構成を示すブロック図である。
 図20に示すように、第3実施形態による分析システム600は、入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部602を有している。また、分析システム600は、時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、分類器によって対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、第1のイベント種別に対応付けられている第2の時系列データと、対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成する表示情報生成部604を有している。また、分析システム600は、第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付ける入力部606を有している。これにより、管理負担を低減することが可能な分析システム600が提供される。
 [変形実施形態]
 以上、実施形態を参照して本発明を説明したが、本発明は上述の実施形態に限定されるものではない。本願発明の構成及び詳細には本発明の要旨を逸脱しない範囲で、当業者が理解し得る様々な変形をすることができる。例えば、いずれかの実施形態の一部の構成を、他の実施形態に追加した実施形態、あるいは他の実施形態の一部の構成と置換した実施形態も本発明を適用し得る実施形態であると理解されるべきである。
 例えば、上述の実施形態では、時系列データは、センサ11からの出力値ではなく、装置の制御信号であってもよい。その場合、当該制御信号は、図4に示されるようなアナログ信号でなくてもよく、例えば、2値のデジタル値であり得る。このように、本発明は、装置の制御に関する監視にも適用され得る。
 また、上述の各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のコンピュータプログラムが記録された記録媒体はもちろん、そのコンピュータプログラム自体も各実施形態に含まれる。
 該記録媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM(Compact Disc-Read Only Memory)、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS(Operating System)上で動作して処理を実行するものも各実施形態の範疇に含まれる。
 上述の各実施形態の機能により実現されるサービスは、SaaS(Software as a Service)の形態でユーザに対して提供することもできる。
 上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
 (付記1)
 入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、
 前記時系列データのうちの前記イベント種別の対応付けが未確定である第1の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成する表示情報生成部と、
 前記第1の時系列データに対する前記イベント種別の対応付けに関する第1の入力を受け付ける入力部と、
 を備えることを特徴とする分析システム。
 (付記2)
 前記入力部により前記イベント種別の対応付けが入力された前記第1の時系列データを教師データとして用いることにより、前記分類器の学習を行う学習部を更に備える
 ことを特徴とする付記1に記載の分析システム。
 (付記3)
 前記表示情報生成部は、更に、前記分類器による分類の評価結果を表示させるための第2の表示情報を生成する
 ことを特徴とする付記1又は2に記載の分析システム。
 (付記4)
 前記評価結果は、適合率及び再現率を含む
 ことを特徴とする付記3に記載の分析システム。
 (付記5)
 前記分析部は、前記分類器の分類結果に基づいて前記イベント種別の判別を行い、
 前記入力部は、更に、前記イベント種別の判別の条件に関する第2の入力を受け付ける
 ことを特徴とする付記3又は4に記載の分析システム。
 (付記6)
 前記表示情報生成部は、更に、前記分類器による分類における複数の前記イベント種別の混同の状況を表示させるための第3の表示情報を生成する
 ことを特徴とする付記1乃至5のいずれか1項に記載の分析システム。
 (付記7)
 前記入力部は、更に、複数の前記イベント種別の合併の要否に関する第3の入力を受け付ける
 ことを特徴とする付記6に記載の分析システム。
 (付記8)
 前記表示情報生成部は、前記第1の時系列データと、前記第2の時系列データと、前記第3の時系列データとを第1の方向に並べて表示させるように前記第1の表示情報を生成する
 ことを特徴とする付記1乃至7のいずれか1項に記載の分析システム。
 (付記9)
 前記表示情報生成部は、前記第1の時系列データと、前記第2の時系列データと、前記第3の時系列データとをそれぞれ複数個ずつ第2の方向に並べて表示させるように前記第1の表示情報を生成する
 ことを特徴とする付記1乃至8のいずれか1項に記載の分析システム。
 (付記10)
 前記第2の方向に並んで表示される複数の前記第1の時系列データは、前記分類器の学習における重要度順に配列される
 ことを特徴とする付記9に記載の分析システム。
 (付記11)
 前記表示情報生成部は、前記第1の時系列データの特徴量と、前記第2の時系列データの特徴量と、前記第3の時系列データの特徴量とに基づく表示を行わせる第4の表示情報を生成する
 ことを特徴とする付記1乃至10のいずれか1項に記載の分析システム。
 (付記12)
 入力された時系列データに対してイベント種別の分類を行うステップと、
 前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成するステップと、
 前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付けるステップと、
 を備えることを特徴とする分析方法。
 (付記13)
 コンピュータに、
 入力された時系列データに対してイベント種別の分類を行うステップと、
 前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成するステップと、
 前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付けるステップと、
 を実行させることを特徴とするプログラムが記憶された記憶媒体。
1                    プラント
2、600                分析システム
11                   センサ
12                   時刻取得部
21                   学習部
22、602               分析部
23                   記憶部
24                   イベント種別入力部
211、221              特徴量算出部
212                  教師データ生成部
213                  選択部
214                  分類器学習部
222                  分類部
223                  判別部
231                  時系列データ記憶部
232                  イベント種別記憶部
233                  特徴量記憶部
234                  教師データ記憶部
235                  分類器記憶部
241、604              表示情報生成部
242、606              入力部
301~306              タブ
310                  サブウィンドウ
311、321              ノブ
331                  プログレスバー
332、334、335、337~340  ボタン
333                  プルダウンメニュー
336                  テキストボックス
2002                 CPU
2004                 ROM
2006                 RAM
2008                 HDD
2010                 通信I/F
2012                 ディスプレイコントローラ
2014                 ディスプレイ
2016                 入力装置
2018                 バスライン

Claims (13)

  1.  入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、
     前記時系列データのうちの前記イベント種別の対応付けが未確定である第1の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成する表示情報生成部と、
     前記第1の時系列データに対する前記イベント種別の対応付けに関する第1の入力を受け付ける入力部と、
     を備えることを特徴とする分析システム。
  2.  前記入力部により前記イベント種別の対応付けが入力された前記第1の時系列データを教師データとして用いることにより、前記分類器の学習を行う学習部を更に備える
     ことを特徴とする請求項1に記載の分析システム。
  3.  前記表示情報生成部は、更に、前記分類器による分類の評価結果を表示させるための第2の表示情報を生成する
     ことを特徴とする請求項1又は2に記載の分析システム。
  4.  前記評価結果は、適合率及び再現率を含む
     ことを特徴とする請求項3に記載の分析システム。
  5.  前記分析部は、前記分類器の分類結果に基づいて前記イベント種別の判別を行い、
     前記入力部は、更に、前記イベント種別の判別の条件に関する第2の入力を受け付ける
     ことを特徴とする請求項3又は4に記載の分析システム。
  6.  前記表示情報生成部は、更に、前記分類器による分類における複数の前記イベント種別の混同の状況を表示させるための第3の表示情報を生成する
     ことを特徴とする請求項1乃至5のいずれか1項に記載の分析システム。
  7.  前記入力部は、更に、複数の前記イベント種別の合併の要否に関する第3の入力を受け付ける
     ことを特徴とする請求項6に記載の分析システム。
  8.  前記表示情報生成部は、前記第1の時系列データと、前記第2の時系列データと、前記第3の時系列データとを第1の方向に並べて表示させるように前記第1の表示情報を生成する
     ことを特徴とする請求項1乃至7のいずれか1項に記載の分析システム。
  9.  前記表示情報生成部は、前記第1の時系列データと、前記第2の時系列データと、前記第3の時系列データとをそれぞれ複数個ずつ第2の方向に並べて表示させるように前記第1の表示情報を生成する
     ことを特徴とする請求項1乃至8のいずれか1項に記載の分析システム。
  10.  前記第2の方向に並んで表示される複数の前記第1の時系列データは、前記分類器の学習における重要度順に配列される
     ことを特徴とする請求項9に記載の分析システム。
  11.  前記表示情報生成部は、前記第1の時系列データの特徴量と、前記第2の時系列データの特徴量と、前記第3の時系列データの特徴量とに基づく表示を行わせる第4の表示情報を生成する
     ことを特徴とする請求項1乃至10のいずれか1項に記載の分析システム。
  12.  入力された時系列データに対してイベント種別の分類を行うステップと、
     前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成するステップと、
     前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付けるステップと、
     を備えることを特徴とする分析方法。
  13.  コンピュータに、
     入力された時系列データに対してイベント種別の分類を行うステップと、
     前記時系列データのうちのイベント種別の対応付けが未確定である第1の時系列データであって、対象イベントが発生している状態に対応する第1のイベント種別であると分類された第1の時系列データと、前記第1のイベント種別に対応付けられている第2の時系列データと、前記対象イベントが発生していない状態に対応する第2のイベント種別に対応付けられている第3の時系列データと、を表示させるための第1の表示情報を生成するステップと、
     前記第1の時系列データに対するイベント種別の対応付けに関する第1の入力を受け付けるステップと、
     を実行させることを特徴とするプログラムが記憶された記憶媒体。
PCT/JP2017/025560 2017-07-13 2017-07-13 分析システム、分析方法及び記憶媒体 WO2019012654A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2017/025560 WO2019012654A1 (ja) 2017-07-13 2017-07-13 分析システム、分析方法及び記憶媒体
JP2019529395A JP6922983B2 (ja) 2017-07-13 2017-07-13 分析システム、分析方法及びプログラム
US16/628,827 US11755004B2 (en) 2017-07-13 2017-07-13 Analysis system, analysis method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/025560 WO2019012654A1 (ja) 2017-07-13 2017-07-13 分析システム、分析方法及び記憶媒体

Publications (1)

Publication Number Publication Date
WO2019012654A1 true WO2019012654A1 (ja) 2019-01-17

Family

ID=65001164

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/025560 WO2019012654A1 (ja) 2017-07-13 2017-07-13 分析システム、分析方法及び記憶媒体

Country Status (3)

Country Link
US (1) US11755004B2 (ja)
JP (1) JP6922983B2 (ja)
WO (1) WO2019012654A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021081773A (ja) * 2019-11-14 2021-05-27 株式会社日立製作所 診断装置、モータ駆動装置および診断方法
CN113313280A (zh) * 2021-03-31 2021-08-27 阿里巴巴新加坡控股有限公司 云平台的巡检方法、电子设备及非易失性存储介质
WO2021199160A1 (ja) * 2020-03-30 2021-10-07 日本電気株式会社 情報処理装置、情報処理方法、記録媒体、情報処理システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7335154B2 (ja) * 2019-12-17 2023-08-29 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286995A (ja) * 2006-04-19 2007-11-01 Hitachi Ltd 注目度計測装置及び注目度計測システム
JP2012098181A (ja) * 2010-11-02 2012-05-24 Sumitomo Electric Ind Ltd 検出装置及び検出方法
JP2013105377A (ja) * 2011-11-15 2013-05-30 Kddi Corp 学習装置、学習方法、プログラム
JP2016099734A (ja) * 2014-11-19 2016-05-30 キヤノン株式会社 画像処理装置、情報処理方法及びプログラム
JP2016143104A (ja) * 2015-01-30 2016-08-08 株式会社日立ハイテクノロジーズ 稼働データ分類装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6546378B1 (en) * 1997-04-24 2003-04-08 Bright Ideas, L.L.C. Signal interpretation engine
US8019702B1 (en) * 2007-12-07 2011-09-13 Google Inc. Supervised learning with multi-scale time intervals using a statistical classification model to classify unlabeled events
JP5277667B2 (ja) * 2008-03-07 2013-08-28 日本電気株式会社 障害分析システム、障害分析方法、障害分析サーバおよび障害分析プログラム
JP2009282926A (ja) * 2008-05-26 2009-12-03 Toshiba Corp 時系列データ分析装置、方法及びプログラム
JP5301310B2 (ja) * 2009-02-17 2013-09-25 株式会社日立製作所 異常検知方法及び異常検知システム
JP5431235B2 (ja) * 2009-08-28 2014-03-05 株式会社日立製作所 設備状態監視方法およびその装置
JP5740459B2 (ja) 2009-08-28 2015-06-24 株式会社日立製作所 設備状態監視方法
US8583647B2 (en) * 2010-01-29 2013-11-12 Panasonic Corporation Data processing device for automatically classifying a plurality of images into predetermined categories
JP2013025367A (ja) 2011-07-15 2013-02-04 Wakayama Univ 設備状態監視方法およびその装置
WO2013030984A1 (ja) * 2011-08-31 2013-03-07 株式会社日立エンジニアリング・アンド・サービス 設備状態監視方法およびその装置
JP5769138B2 (ja) 2013-04-22 2015-08-26 横河電機株式会社 イベント解析装置およびコンピュータプログラム
JP6556418B2 (ja) 2013-06-03 2019-08-07 株式会社東芝 プラント監視装置、プラント監視方法及びプラント監視プログラム
JP5530019B1 (ja) 2013-11-01 2014-06-25 株式会社日立パワーソリューションズ 異常予兆検知システム及び異常予兆検知方法
JP5753286B1 (ja) * 2014-02-05 2015-07-22 株式会社日立パワーソリューションズ 情報処理装置、診断方法、およびプログラム
US10505825B1 (en) * 2014-10-09 2019-12-10 Splunk Inc. Automatic creation of related event groups for IT service monitoring
US10198159B2 (en) * 2015-04-28 2019-02-05 Osisoft, Inc. Multi-context sensor data collection, integration, and presentation
JP5885875B1 (ja) * 2015-08-28 2016-03-16 株式会社Ubic データ分析システム、データ分析方法、プログラム、および、記録媒体
JP6710644B2 (ja) * 2017-01-05 2020-06-17 株式会社東芝 動作解析装置、動作解析方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286995A (ja) * 2006-04-19 2007-11-01 Hitachi Ltd 注目度計測装置及び注目度計測システム
JP2012098181A (ja) * 2010-11-02 2012-05-24 Sumitomo Electric Ind Ltd 検出装置及び検出方法
JP2013105377A (ja) * 2011-11-15 2013-05-30 Kddi Corp 学習装置、学習方法、プログラム
JP2016099734A (ja) * 2014-11-19 2016-05-30 キヤノン株式会社 画像処理装置、情報処理方法及びプログラム
JP2016143104A (ja) * 2015-01-30 2016-08-08 株式会社日立ハイテクノロジーズ 稼働データ分類装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021081773A (ja) * 2019-11-14 2021-05-27 株式会社日立製作所 診断装置、モータ駆動装置および診断方法
JP7275008B2 (ja) 2019-11-14 2023-05-17 株式会社日立製作所 診断装置、モータ駆動装置および診断方法
WO2021199160A1 (ja) * 2020-03-30 2021-10-07 日本電気株式会社 情報処理装置、情報処理方法、記録媒体、情報処理システム
CN113313280A (zh) * 2021-03-31 2021-08-27 阿里巴巴新加坡控股有限公司 云平台的巡检方法、电子设备及非易失性存储介质
CN113313280B (zh) * 2021-03-31 2023-09-19 阿里巴巴新加坡控股有限公司 云平台的巡检方法、电子设备及非易失性存储介质

Also Published As

Publication number Publication date
JPWO2019012654A1 (ja) 2020-03-19
US20210373542A1 (en) 2021-12-02
US11755004B2 (en) 2023-09-12
JP6922983B2 (ja) 2021-08-18

Similar Documents

Publication Publication Date Title
JP6856122B2 (ja) 学習システム、分析システム、学習方法及び記憶媒体
JP6922983B2 (ja) 分析システム、分析方法及びプログラム
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
JP4832609B1 (ja) 異常予兆診断装置および異常予兆診断方法
JP6708203B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US20220414539A1 (en) Machine learning performance monitoring and analytics
US11609812B2 (en) Anomalous equipment trace detection and classification
JP2013025367A (ja) 設備状態監視方法およびその装置
JP2020064367A (ja) 異常検知装置及び異常検知方法
JP2013143009A (ja) 設備状態監視方法およびその装置
WO2022038804A1 (ja) 診断装置及びパラメータ調整方法
US11436769B2 (en) Visualized data generation device, visualized data generation system, and visualized data generation method
CN116415931A (zh) 一种基于大数据的电力设备运行状态监控方法和***
JP2013041491A (ja) 異常診断装置
CN114120470A (zh) 监视装置、监视方法、以及记录了监视程序的计算机可读介质
US20220147039A1 (en) Event analytics in modular industrial plants
CN114223002A (zh) 用于基于在相关事件中识别传感器组合中的显著变化来改进资产操作的方法和***
JP2022191680A (ja) データ選択支援装置及びデータ選択支援方法
JP7222939B2 (ja) 時系列パターンの説明情報生成装置
JP6247777B2 (ja) 異常診断装置および異常診断方法
US20230097599A1 (en) Monitoring apparatus, monitoring method, and non-transitory computer readable medium
WO2021140607A1 (ja) 情報処理装置、制御方法及び記憶媒体
JP2021128457A (ja) 故障予兆検知システム
WO2022128298A1 (en) Assistance apparatus and method for automatically identifying failure types of a technical system
CN116050597A (zh) 任务风险识别与优化***以及任务风险识别与优化方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17917406

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019529395

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17917406

Country of ref document: EP

Kind code of ref document: A1