CN110471373B - 信息处理方法、程序和信息处理装置 - Google Patents

信息处理方法、程序和信息处理装置 Download PDF

Info

Publication number
CN110471373B
CN110471373B CN201910195680.XA CN201910195680A CN110471373B CN 110471373 B CN110471373 B CN 110471373B CN 201910195680 A CN201910195680 A CN 201910195680A CN 110471373 B CN110471373 B CN 110471373B
Authority
CN
China
Prior art keywords
data
instance
subclass
information
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910195680.XA
Other languages
English (en)
Other versions
CN110471373A (zh
Inventor
王兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN110471373A publication Critical patent/CN110471373A/zh
Application granted granted Critical
Publication of CN110471373B publication Critical patent/CN110471373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31088Network communication between supervisor and cell, machine group

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及信息处理方法、程序以及信息处理装置,将基于物理的实体定义的数据和概念定义的数据进行分类,实现跨越***的数据的利用。作为本发明的实施方式的信息处理方法,将实例分类为基于物理的实体定义的物理世界类或概念定义的信息数字化世界类的任一个的子类。包含:获取包含所述实例的第一数据的步骤;以及参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、日志数据的至少任一个,推定所述实例的所述子类的步骤。

Description

信息处理方法、程序和信息处理装置
本申请以日本专利申请2018-092431(申请日05/11/2018)为基础,从该申请享受优先利益。本申请通过参照此申请而包含该申请的所有内容。
技术领域
本发明的实施方式涉及信息处理方法、程序和信息处理装置。
背景技术
在物联网(IoT)、工业4.0(Industrie4.0)中,提出将所有器件(device)、***相互连接,构建能够交换所有数据的网络。在这样的网络中,大量的传感器、不同过程涉及的多个***相互连接。如果有效地活用从不同源(source)收集的数据,则能够推进各种基础设施、工厂、发电所(plant)等的设备的操作的自动化、最优化。为了通过自动化、最优化实现成本的削减、安全性的提高、产品的品质改善等,需要正确分类数据的种类,明确数据的类型和数据间的关系。
作为处理从多个源得到的数据的技术的示例,列举使用定义数据规格的本体(ontology)的数据处理手法、各种机器学习手法。在这些技术中,能够进行基于共通特征的数据推定,但是不能进行考虑了由于数据的类型的不同导致的数据间的关系的不同的数据推定。正在寻求推定未定义的数据的类型,推定数据间的关系的技术。
发明内容
本发明的实施方式提供信息处理方法、程序和信息处理装置,将基于物理的实体定义的物理世界数据和概念定义的信息数字化世界(cyber world)数据进行分类,实现跨越物理的实体和信息数字化***的综合的数据推定和利用。
作为本发明的实施方式的信息处理方法,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类,使计算机执行:获取包括所述实例的第一数据的步骤;和参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个,推定所述实例的被分类的所述子类的步骤。
附图说明
图1是示出第一实施方式涉及的***的结构例的图。
图2是示出元模型的示例的图。
图3是示出数据构造的称呼的图。
图4是示出数据构造彼此的对应关系的图。
图5是示出第一数据和分类定义数据的构造的图。
图6是示出收集的第一数据的构造的示例的图。
图7是示出第一实施方式中的全体处理的示例的流程图。
图8是示出阶层分类中的类(class)、模式(schema)、实例(instance)的关系的图。
图9是示出基于模式推定实例的数据的类型的处理的示例的流程图。
图10是示出提取最类似的模式的处理的示例的图。
图11是示出包含数据的阶层分类和形式描述的本体的示例的图。
图12是示出基于本体推定第一数据的类型的处理的流程图。
图13是表示基于实例的类似度推定实例的数据的类型的处理的第一方法的流程图。
图14是示出使用了实例的值计算类似度的第一方法的图。
图15是示出基于实例的类似度推定实例的数据的类型的处理的第二方法的流程图。
图16是示出使用了实例的值计算类似度的第二方法的图。
图17是示出第一数据的分类的推定结果画面的示例的图。
图18是示出分类定义数据的编辑画面的示例的图。
图19是示出第二实施方式涉及的信息处理装置的结构例的图。
附图标记说明
1:信息处理装置;2:网络;3:传感器***;4:控制***;5:管理***;6:存储装置;6a:未分类DB;7:数据收集部;8:数据处理部;9:存储部;10:日志DB;11:模式DB;12:本体DB;13:元模型DB;14:模式更新部;15:本体更新部;16:元模型更新部;17:数据关系获取部;18:通知部;19a:显示部;19b:操作部;20:元模型;21、22、23、24、25、26、27、28、29、30、31、40、41、42、43、44、45、46、47、48:类;32:转换规则(Conversion Rule);49a、49b、52、53、54、64、65:表;50、51:模式;60、61:行;62、63:实例;66、67、68:数据;70、71、71a:参照(reference);72、73:对应关系;80、81、82、83、84:第一数据;90、91:按钮;100:计算机;101:处理器;102:输入装置;103:显示装置;104:通信装置;105:存储装置。
具体实施方式
下面,参照附图,对本发明的实施方式进行说明。此外,附图中相同的结构要素,标记相同的编号,适当省略说明。
(第一实施方式)
从大量的传感器、不同过程涉及的多个***收集的数据能够分类为基于物理的实体定义的数据(物理世界数据)和概念定义的数据(信息数字化世界数据)。在物理世界数据和信息数字化世界数据中,数据间的关系不同。于是,如果对物理世界数据和信息数字化世界数据进行分类,执行数据的分类处理使得能够获得数据间的关系相关的信息,则从不同的源得到的数据的性质的不同、数据间的关系变得明确。通过使用本实施方式涉及的信息处理装置执行数据的分类处理,能够得到从不同的源得到的数据的性质的不同、数据间的关系相关的信息,因此变得容易进行跨越多个***的横向的数据的利用。
下面,对包含本实施方式涉及的信息处理装置的***的结构例进行说明。
图1是表示第一实施方式涉及的***的结构例的图。图1的***具备:信息处理装置1、网络2、网络2a、传感器***3、控制***4、管理***5、和存储装置6。信息处理装置1、传感器***3、控制***4、管理***5、存储装置6由网络2相互连接。
信息处理装置1推定从不同源获取的成为分类对象的数据(以下称为第一数据)中除元数据之外的实际数据的类型。并且,通知实际数据的被分类的数据的类型以及类间的关系相关的信息。存在第一数据包含已经由分类定义数据定义了的数据的类型的实际数据的情况,也存在包含未由分类定义数据定义的类型的实际数据的情况。此外,也存在前者和后者的实际数据混在一起的情况。
所谓分类定义数据是从多个观点定义实际数据的元数据的集合。本实施方式中的分类定义数据包含类及其模式、与类以及模式对应的数据的类型、本体、决定类的分类和类间的关系的元模型的定义。这些元数据的详细内容后述。
在信息处理装置1检测到未定义的类涉及的数据的情况下,将新的类、其模式、对应的数据的类型的定义向分类定义数据追加。此外,追加与本体和元模型对应的类的定义。此外,信息处理装置1将收集的实际数据的类型、与数据的类型对应的类、类间的关系相关的信息向用户、外部的信息处理装置通知。
能够使数据的类型和模式与各类相对应。如后所述,可基于阶层构造定义多个类。即,可以说类的阶层构造给与模式的集合。利用定义类的形式的模式描述实际数据。在数据的类中存在基于物理的实体定义的物理世界(Physical World:PW)类和概念定义的信息数字化世界(Cyber World:CW)类。新定义的类成为物理世界(PW)类或信息数字化世界(CW)类的任一个的子类。因此,将各个实际数据(实例)分类为任一个的子类。此外,为了表现在子类间存在的抽象的关联性,能够在子类间定义关系。关系可以是is-a的继承关系、has-a的包含关系、参照关系等表示物理性结合的关系,也可以是表示概念性结合的关系。
作为在物理世界(PW)中定义的数据的示例,列举装置、器件的种类、装置的设置场所、装置的设置台数、装置的机械连接关系、器件的电气连接关系、装置彼此的位置关系、开关的配置等。另一方面,作为在信息数字化世界(CW)中定义的数据的示例,列举器件的性能指标、发电机、照明机器中的能源转换效率、装置的方式(例如,照明机器中的白炽灯和LED)、装置的耐久年数、概念间的继承关系、事件间的因果关系、信息通信机器以及信息***中的用户账户的设定信息、信息通信机器以及信息***中的设定信息等。由信息数字化世界(CW)定义的数据,还包含没有物理的实体的信息数字化空间中的用户帐户、文件、组、计算资源的分配设定、储存器(storage)的分配设定、访问设定、用户的计分、虚拟现实(VR)环境中的状态信息、增强现实(AR)环境中的状态信息、用户具有的点(point)、用户具有的虚拟货币的金额等。
通过考虑物理世界类(以下称为PW类)和信息数字化世界类(以下称为CW类)的不同、类间的关系,能够统一执行各种基础设施、工厂、发电所等的机器、设备等的操作。作为操作的示例,列举运行、停止、控制、生产、诊断、保养、出货、包装、数据的分析、结构变更、动作模式的变更等,但可以是任何种类的。
图2示出由第一实施方式涉及的信息处理方法和信息处理装置利用的元模型的示例。图2是定义了类的PW/CW的种类和数据间的关系的元模型20(数据关系元模型,DataRelationship Meta-Model:DRMM)。参照元模型20,可知各类被分类为PW类(类22)或CW类(类23)中的任一个。在PW类和CW类中分别定义了多个子类(类24~29)。各子类能够与任一个的模式和数据的类型相对应。
在图2的示例中,作为PW类的子类,定义了机械类(类24)、电气类(类25)、位置类(类26)、和PW关系类型类(类30)。PW关系类型类定义类间的关系。作为PW关系类型类定义的关系的示例,列举机械连接、电气连接、位置连接、包含、分解、嵌入、原材料、预防等。例如,在作为PW类的子类定义了“机器类”和“传感器机器类”的情况下,“传感器机器类”相对于“机器类”具有“包含”的关系。
在图2的示例中,作为CW类的子类,定义了坐标类(类27)、设备类(类28)、功能类(类29)、和CW关系类型类(类31)。CW关系类型类与PW关系类型类同样地,定义类间的关系。作为CW关系类型类定义的关系的示例,列举继承、包含、分解、因果、同等、参照等。例如,在作为CW类的子类定义了“***类”和“辅助电源***类”的情况下,“辅助电源***类”相对于“***类”具有“继承”的关系。
另外,在PW关系类型类和CW关系类型类之间定义了转换规则32。以下,将由PW关系类型类定义了的关系(relation)与由CW关系类型类定义了的关系(relation)之间的对应(关联性)称为转换规则。例如,PW关系类型类中的“机械连接”与CW关系类型类中的“参照”对应,具有转换规则。另外,可以不一定是由PW关系类型类定义了的所有关系具有转换规则。此外,可以是由PW关系类型类定义了的一个关系具有多个转换规则。关于由CW关系类型类定义了的关系也同样。
此处说明的PW类的子类、CW类的子类、关系、转换规则仅仅为一例。因此,本实施方式涉及的信息处理装置(信息处理方法)中可以定义不同于这些的子类、关系、转换规则。分类定义数据定义了如上所述的数据的类型的子类。另外,在以下简称为“类”的情况下,意指包含PW类或CW类的子类的一般的类(与数据的类型相对应的数据的定义)。
下面,再次参照图1,对第一实施方式涉及的***进行说明。
网络2提供在信息处理装置1、传感器***3、控制***4、管理***5、存储装置6之间发送接收数据的手段。另一方面,网络2a提供在信息处理装置1和外部的信息处理装置之间发送接收数据的手段。外部的信息处理装置能够经由网络2a接收收集的实际数据的类型、类、关系相关的信息的通知,或者参照信息处理装置1的存储部9中保存的分类定义数据。
作为网络2、2a的通信介质,例如可以使用光纤、LAN电缆、电话线路、同轴电缆、无线或它们的组合。作为通信规格,可以使用以太网,IEEE802.11系列的无线LAN,NFC,蓝牙(Bluetooth)、紫蜂(ZigBee)、各种LPWA(低功耗广域,Low-Power Wide-Area)规格等,但对规格的种类不特别限定。
网络2、2a可以是如图1的示例那样独立的网络,也可以是相互连接的、一体的网络。
传感器***3是由多个传感器进行物理信息的测量的***。传感器***3可以是无线传感器网络,也可以是在各种基础设施、工厂、发电所等的机器、设备具备的传感器的集合。对传感器***3中的传感器的种类、个数不特别限定。信息处理装置1能够从传感器***3获取包含由传感器测量的物理信息的数据。
控制***4是控制各种基础设施、工厂、发电所等的机器、设备的***。对控制***4的控制对象不特别限定。信息处理装置1能够从控制***4获取包含控制对象的设定值、动作模式、状态等的数据。
管理***5是进行用户帐户的设定、访问权限的设定、操作历史的记录、计算资源向用户的分配、计算资源的使用状况的监视等的信息***。信息处理装置能够从管理***5获取包含用户的登录后的活动、操作历史、计算资源的使用状况等的数据。
存储装置6是提供能够积存第一数据的存储区域的储存器***。存储装置6中积存的数据可以是从传感器***3、控制***4、管理***5获取的数据,也可以是从其它***获取的数据。在第一数据大量产生的情况下,能够将第一数据暂时积存在存储装置6后,使信息处理装置1执行数据的分类处理。
接下来,对信息处理装置1的内部的结构要素进行说明。
信息处理装置1具备:数据收集部7、数据处理部8、存储部9、模式更新部14、本体更新部15、元模型更新部16、数据关系获取部17、通知部18、显示部19a、和操作部19b。
数据收集部7经由网络2从传感器***3、控制***4、管理***5、存储装置6收集数据。数据收集部7将收集到的数据保存到日志数据库10。将由数据收集部7收集的数据称为第一数据。此外,数据收集部7将第一数据转送到数据处理部8。对第一数据的构造将后述。
数据处理部8推定第一数据中包含的实际数据(实例)的模式、与模式对应的数据的类型、与数据的类型对应的类,提供实际数据的分类及属性相关的信息。数据处理部8参照存储部9中保存的分类定义数据,执行上述处理。此外,在判定为在分类定义数据中存在未定义的数据的类型、模式、子类等的情况下,数据处理部8向模式更新部14、本体更新部15、元模型更新部16指示分类定义数据的更新。另外,对数据处理部8执行的处理的详细内容将后述。数据处理部8例如通过CPU等的处理器、ASIC、CPLD等的硬件电路、OS(操作***,Operating System)、应用等的程序或它们的组合被安装。
存储部9是用于保存收集的第一数据、分类定义数据、程序等的存储介质。存储部9例如可以是SRAM、DRAM等易失性存储器,也可以是NAND、MRAM、FRAM等非易失性存储器。此外,可以是硬盘、SSD等的储存器装置、外部的存储装置,对器件的种类不特别限定。此外,存储部9可以是多个种类的器件、存储装置的组合。
在存储部9中保存有日志数据库(日志DB)10、模式数据库(模式DB)11、本体数据库(本体DB)12和元模型(元模型DB)13。在说明存储部9中保存的各数据库的作用之前,叙述本实施方式涉及的信息处理方法和信息处理装置中使用的数据构造。
图3示出本实施方式涉及的信息处理方法及信息处理装置中使用的数据构造的称呼。此外,图4示出数据构造彼此的对应关系。图3示出元模型、本体、模式、和实例。对图3上段的元模型的详细内容已经在图2的说明中叙述。本体是定义概念间的关联性、属性、规定数据的规格的元数据。如图3中段所示,本体包含表示类的阶层分类的树、向类分配的代码(例如,PW_E、G、GT、CW_S、C等)、和使用了代码的类的标识符即形式描述(例如,+B、=B等)。如后所述,在形式描述中结合了序列号的代码被用作各实例的标识符。
元模型可以由程序等生成,也可以是用户定义。如图4所示,以依照元模型的方式定义本体。因此,元模型中的类与本体中的类之间存在对应关系。
图3下段的模式规定实际数据中的数据的形式。在图3的示例中,第一模式为{代码、额定效率、种类、启动时间},第二模式为{代码、种类、值},以包含多个数据项目(item)的形式被定义。此外,图3下段的实例是按照由模式规定的形式的实际数据,成为多个数据项目的组合。模式定义类具有的属性(attribute)。在图3的示例中的实例为{B001,温度传感器,100℃}、{B002,流量传感器,300L/分},成为组合多个值的形式。
在第一实例中,可以说第二模式的各数据项目以代码=“B001”、种类=“温度传感器”、值=“100℃”的形式被具体化。同样地,在第二实例中,第二模式的各数据项目以代码=“B002”、种类=“流量传感器”、值=“300L/分”的形式被具体化。这样,可以存在按照一个模式的形式的多个实例。
另外,关于描述元模型、本体、模式的定义的方法不特别限定。可以使用例如XML、JSON、CSV、文本等进行数据构造的定义相关的描述,但也可以通过其它方法进行。
如图4所示,按每个类定义模式。因此,在信息处理装置(信息处理方法)中存在多个类的情况下,不同形式的模式被定义多个。
如图4所示,与本体相对应地定义模式及其类。此外,存在本体与元模型之间的对应关系,所以在利用获取的实例(实际数据)时,能够参照由元模型定义的类的分类、类间的关系相关的信息。
另外,模式及对应的类可以由程序等定义,也可以由用户定义。此外,图3所示的模式和实例仅仅为一例,也可以使用与示例不同的形式的模式、不同内容的实例。此外,对定义的模式和类,不特别限定。
接下来,说明保存在日志数据库10、模式数据库11、本体数据库12、和元模型数据库13中的数据。图5示出第一数据和分类定义数据的构造。下面,参照图5进行说明。
在日志数据库10中保存包含过去获取的实例(实际数据)的第一数据的集合。第一数据可以与识别获取时刻或测量时刻、数据的源(获取源)的信息等组合保存。作为识别数据的源的信息的示例,存在IP地址、MAC地址、传感器名、***名、模块名、住址、坐标信息、纬度和经度的组合、各种识别符,但可以是任何种类。此外,可以一起保存用于识别第一数据中包含的各实例的数据的类型是否由模式数据库11已定义的信息。
在实例的数据的类型已定义的情况下,在日志数据库10中保存对模式数据库11中的、定义了对应的数据的类型的信息以及定义了模式的信息的参照(reference)70。作为参照70的示例,列举指针、文件名、对象名、标识符(ID)等,但只要能够确定该数据的类型或模式,则不特别限定安装方法。
在模式数据库11、本体数据库12、元模型数据库13中保存各种分类定义数据。如上所述,分类定义数据从多个观点对数据给与定义。
在模式数据库11中,保存对应于模式的数据的类型的定义相关的信息、和按每个数据的类型定义实例的形式的模式定义信息。可以对数据的类型以及模式赋予标识符,在模式数据库11中保存该标识符。标识符可以是字母数字,也可以是字母数字和符号的组合,可以说明数据的类型和模式(例如,数据的类型或模式的名称),对形式不特别限定。
在模式数据库11中,可以保存对对应于各个数据的类型和模式的类的参照(reference)71。作为参照71的示例,列举指针、文件名、对象名、标识符(ID)等,但只要定义了该类的数据被确定,则不特别限定实现方法。在图5的示例中,参照71示出由本体数据库12的本体定义了的类,但是也可以示出由元模型数据库13的元模型定义了的类。
在本体数据库12中保存本体。如上所述,包含类的阶层分类、向各类分配的代码、和形式描述相关的信息。可以向类赋予标识符,在本体数据库12中保存该标识符。标识符可以是字母数字,也可以是字母数字和符号的组合,可以是说明类(例如,类的分类、类的属性、类的名称)的,对形式不特别限定。
在本体数据库12中,可以保存对对应于各个类的数据的类型或者模式的参照(reference)71a。作为参照71a的示例,列举指针、文件名、对象名、标识符(ID)等,但只要定义了该数据的类型或模式的数据能够确定,则不特别限定实现方法。
在元模型数据库13中,保存元模型。元模型与本体同样地,给与各类的定义。如图2所示,在元模型中,将各个类分类为物理世界(PW)类的子类或信息数字化世界(CW)的子类。因此,通过参照元模型数据库13,能够判定类是定义了物理世界(PW)中的数据,还是定义了信息数字化世界(CW)中的数据。此外,参照PW关系类型类或CW关系类型类,能够得到类间的关系相关的信息(对应关系73)。
另外,可以在元模型数据库13中保存类的标识符。标识符可以是字母数字,也可以是字母数字和符号的组合,可以说明类(例如,类的分类、类的属性、类的名称),对形式不特别限定。
另外,可以使得能够在定义本体数据库12中的各类的数据与定义元模型数据库13中的各类的数据之间建立对应。例如,可以使得能够由标识符确定相同或对应的类,也可以使得能够由指针、文件名、对象名等相互参照由双方的数据库定义了的类(对应关系72)。也可以通过其它方法,实现对应关系72。
通过使用图5中说明的参照或对应关系,数据处理部8能够根据第一数据中包含的实例(实际数据),得到该实例的模式、与该实例对应的类、类间的关系、该实例属于信息数字化世界(CW)或物理世界(PW)中的哪一个等的信息。通过提高分类定义数据的完成度,能够获取接连地被收集的数据的属性、关联、分类等,能够进行高效的机器、设备的控制、数据分析。
接下来,对由数据收集部7收集的第一数据的构造进行说明。图6示出收集的第一数据的构造的示例。存在收集的第一数据如样式#1(第一数据80)那样,包含实例(实际数据)、和与该实例对应的形式描述信息以及模式信息两者的情况。此处,所谓模式信息,是指模式的定义、模式或数据的类型的标识符等,至少足以确定模式或数据的类型的数据。
此外,也存在如样式#2(第一数据81)那样,包含实例(实际数据),但不包含与该实例对应的形式描述信息的情况。此外,也存在如样式#3(第一数据82)那样,包含实例(实际数据),但不包含与该实例对应的模式信息的情况。也存在如样式#4(第一数据83)那样,包含相当于实际数据的实例,但与该实例对应的形式描述信息以及模式信息中的哪一个都不包含的情况。这样,第一数据的构造存在多个样式,所以数据处理部8根据第一数据的构造执行不同的处理。
此外,也可以是第一数据如样式#5(第一数据84)那样包含多个实例。在第一数据84中,包含实例#1~#3的3个实例。实例#2具有对应的模式信息#2,实例#3具有对应的形式描述信息#3。然而,实例#1不具有对应的模式信息和形式描述信息。
可以使得能够通过使用元数据、特定的位串、特定的文件名判别第一数据中包含的数据的种类(实例、形式描述信息、模式信息)、对应关系,也可以使得能够通过其它方法判别数据。
下面将再次参照图1,对信息处理装置1的内部的结构要素进行说明。
模式更新部14执行模式数据库11的更新处理。例如,模式更新部14向模式数据库11追加新的数据的类型的定义、和与该数据的类型对应的模式(模式定义信息)。此外,模式更新部14将对与模式及数据的类型对应的子类的参照涉及的数据写入到模式数据库11。本体更新部15执行本体数据库12的更新处理。本体更新部15例如向本体数据库12追加新的子类、形式描述。元模型更新部16执行元模型数据库13的更新处理。元模型更新部16例如向元模型数据库13追加新的子类。
模式更新部14、本体更新部15、元模型更新部16可以在程序的处理满足预定条件时,自动更新分类定义数据。此外,可以接收从数据处理部8、操作部19b发送的指令,基于该指令更新分类定义数据。
数据关系获取部17参照元模型数据库13,获取特定的子类具有的关系相关的信息。该信息经由通知部18被转送到用户、外部的信息处理装置。
通知部18向用户、外部的信息处理装置通知由数据处理部8推定的第一数据的类型、模式、子类以及由数据关系获取部17获取的该子类具有的关系相关的信息。对由通知部18进行的信息的通知方法不特别限定。例如,通知部18可以通过电子邮件、短信进行通知,也可以由网页***息。此外,可以向外部的储存器装置等进行结果的写入,也可以向控制装置、进行数据分析的服务器等发送结果。
显示部19a是显示用户操作信息处理装置1时利用的GUI(图形用户接口,Graphical User Interface)、CLI(命令行接口,Command Line Interface)、分类定义数据的编辑画面、推定结果等的显示器。作为显示器,例如可以使用液晶显示器、有机电致发光显示器、投影仪、LED显示器等,但是也可以使用其它种类的显示器。另外,图1的示例中的显示部19a内置在信息处理装置1中,但是对显示部19a的位置不特别限定。显示部19a可以被设置在远离信息处理装置1的房间、建筑物,也可以是平板电脑、智能手机等的无线通信终端的显示器。
操作部19b是向用户提供信息处理装置1的操作单元的器件。操作部19b例如是键盘、鼠标、开关、语音识别器件等,但不限于此。此外,操作部19b可以是与显示部19a一体化的触摸面板。对操作部19b的位置也不特别限定。操作部19b可以设置在远离信息处理装置1的房间、建筑物,也可以是平板电脑、智能手机等无线通信终端的触摸面板。
接着,对本实施方式涉及的信息处理装置执行的处理进行说明。图7是示出第一实施方式中的全体处理的示例的流程图。下面,参照图7对处理进行说明。
首先,数据收集部7获取成为分类对象的数据(第一数据)(步骤S101)。如上所述,实际被分类的是第一数据中包含的实际数据(实例)。第一数据中包含的元数据(模式信息、形式描述)提供分类处理所需的信息。
当从数据收集部7向数据处理部8转送第一数据后,判断是否包含与该第一数据中包含的实例对应的模式信息(步骤S102)。在包含该模式信息的情况下(步骤S102的是),数据处理部8基于模式信息,推定实例的数据的类型(步骤S104)。在未包含该模式信息的情况下(步骤S102的否),判定是否包含与实例对应的形式描述信息(步骤S103)。
在该形式描述信息被包含在第一数据中的情况下(步骤S103中的是),基于形式描述信息推定数据的类型(步骤S105)。在该形式描述信息未包含在第一数据中的情况下(步骤S103的否),基于类似度推定数据的类型(步骤S106)。
即,数据处理部8根据第一数据中包含的元数据,选择数据的类型的推定中使用的方法。另外,在步骤S104、步骤S105、步骤S106中执行的处理的详细内容后述。在如图5的样式#5(第一数据84)那样,同时收集的第一数据包含多个实例的情况下,对各个实例执行步骤S102~S106的处理。
当执行步骤S104~S106的处理后,数据处理部8确认是否在分类定义数据中定义了与推定的数据的类型相同的数据的类型(步骤S107)。例如,数据处理部8访问模式数据库11,搜索该数据的类型的定义。
在分类定义数据中定义了相同的数据的类型的情况下(步骤S107的是),通知与该数据的类型对应的子类以及子类具有的关系(步骤S108)。具体而言,数据处理部8参照本体数据库12确定与数据的类型对应的子类。然后,数据关系获取部17参照元模型数据库13,获得该子类具有的关系相关的信息。最后,通知部18向用户、外部的信息处理装置通知这些信息。可以一起通知实例涉及物理世界(PW)或信息数字化世界(CW)的哪一个。此外,通知部18可以在显示部19a显示与数据的类型对应的子类及子类具有的关系相关的信息。可以根据需要,通知对应于数据的类型的模式的信息。
在分类定义数据中未定义相同的数据的类型的情况下(步骤S107的否),数据处理部8判定为该实例涉及新的数据的类型。将与该新的数据的类型对应的模式的定义(模式定义信息)向模式数据库11追加(步骤S109)。追加与新的数据的类型对应的模式的定义的处理,可以由程序等自动执行,也可以由用户经由操作部19b进行。
接着,定义对应于新的数据的类型的子类,将子类的定义和子类具有的关系向分类定义数据追加(步骤S110)。具体而言,将新的子类的定义向本体数据库12和元模型数据库13追加。这里,追加物理世界(PW)类或信息数字化世界(CW)类的任一个的子类。此外,向元模型的PW关系类型类或CW关系类型类追加子类间的关系相关的信息。另外,在该子类不特别具有与其它子类的关系的情况下,可以跳过追加关系相关的信息的处理。步骤S110的处理可以由程序等自动执行,也可以由用户经由操作部19b进行。
然后,通知与实例对应的子类以及子类具有的关系(步骤S111)。在步骤S111中执行的处理和在步骤S108中执行的处理相同。但是,在分类定义数据中追加了新的数据的类型、模式、子类、子类具有的关系的定义的情况下,可以将分类定义数据已被更新的意思在显示部19a显示,或者向用户、外部的信息处理装置通知。由此,用户、其它***能够参照被更新了的分类定义数据。
以下,对推定数据的类型的处理的详细内容进行说明。
首先,叙述模式和其它元数据的关系。图8示出阶层分类中的类、模式、实例的关系。图8上段示出类的阶层分类的示例。传感器机器类(类42)的模式50被定义为“{代码、种类、值}”。此外,辅助电源***类(类46)的模式51被定义为“{代码、额定效率、种类、启动时间}”。
图8下段的表52和表53示出模式和实例的关系。表52的第一行相当于模式50。在表52的第二行和第三行,示出作为具体化模式50的实际数据的实例的示例。表53的第一行相当于模式51。在表53的第二行示出作为具体化模式51的实际数据的实例的示例。
另外,类的阶层分类的详细内容后述。
接着,对在图7的步骤S104中执行的处理的详细内容进行说明。图9是示出基于模式推定实例的数据的类型的处理的示例的流程图。
首先对图9中所使用的表述进行说明。在分类定义数据中作为模式定义信息定义m个模式的情况下,将模式的集合Cls表述为Cls=[p1、p2、p3、……、pm]。当设为i=1、2、3、……、m时,各模式被表述为pi={x1、x2、x3、x4}。这里,当设为j=1、2、3、4时,xj是模式中的各个数据项目(item)。例如,在图8中的模式51的情况下,“代码”、“额定效率”、“种类”、“值”相当于模式中的数据项目(item)。
数据收集部7获取的第一数据可以以同样的表述来表现。在第一数据中包含n个模式的情况下,模式的集合S表述为S=[s1、s2、s3、……、sn]。当设为k=1、2、3、……、n时,各模式被表述为sk={y1、y2、y3、y4}。yj是在模式中的各个数据项目(item)。另外,存在第一数据中包含对应于相同的模式(数据的类型)的多个实例的可能性,所以sk中可以存在重复。
另外,在这个示例中,包含在模式中的数据项目数为4,但是不限定模式中包含的数据项目数。
首先,对模式的集合S中包含的各个模式sk,从集合Cls提取最类似的模式pi(步骤S201)。在步骤S201中进行类似度的计算,基于类似度,选择最类似的模式pi。作为类似度的计算手法的示例,存在Simpson系数、WORDNET、TF-IDF等,但可以使用其它手法。另外,可以在步骤S201的计算处理中设定阈值,在类似度小于阈值的情况下,对计算结果赋予因为不相当于相同或对应的模式的可能性高而需要再检查的意思的标签。对使用Simpson系数的具体处理的示例后述。
接着,将在步骤S201中提取的模式pi的集合定义为Clsx(步骤S202)。集合Clsx相对于模式的集合Cls,成为
Figure BDA0001995755030000171
的关系。然后,推定为集合Clsx中包含的各模式相当于集合S中的各模式(步骤S203)。另外,可以将在步骤S203中推定的模式的对应关系在显示部19a显示,或者从通知部18向用户通知。在推定的结果被赋予了需要再检查的意思的标签的情况下,用户能够使用操作部19b修改结果。此外,可以与推定结果一起进行类似度的值的显示或通知。
图10示出提取最类似的模式的处理的示例。图10示出在类似度计算中使用了Simpson系数的情况的示例。Simpson系数通过将集合X和集合Y的共通部分(intersection)的要素数除以集合X的要素数或集合Y的要素数的小的一方来计算。在计算处理中,可以使用例如表54那样的数据构造。
表54的第一行示出集合Cls(在分类定义数据中定义了的模式的集合)。表54的第一列示出集合S(第一数据中包含的模式的集合)。并且,在表54的各个字段中,储存了按模式pi和sk的每个组合计算出的相当于类似度的Simpson系数的值。
在图10的示例中,0.9被设定为类似度的阈值。因此,在Simpson系数的值小于0.9的情况下,赋予需要再检查的意思的标签。
接着,对包含类的阶层分类和形式描述的本体的示例进行说明。图11示出包含数据的阶层分类和形式描述的本体的示例。
图11上段示出类的阶层分类。在图11的示例中,作为根(ROOT)类(类40)的子类,规定了机器类(类41)、***类(类45)、位置类(类48)。机器类具有传感器机器类(类42)和发电机类(类43)作为子类。发电机类具有火力发电机类(类44)作为子类。此外,***类具有辅助电源***类(类46)以及控制和管理***类(类47)作为子类。
如上所述,类的阶层分类是将类设为节点的树构造。图11所示的类的名称、类的数量、树的形状仅仅为一例。因此,信息处理装置1可以使用与之不同名称的类,也可以定义与之不同数量的类。此外,图11的阶层分类涉及的树的深度为4,但实际的树的深度的值可以与之不同。在分类定义数据中依次追加类时,存在定义比图11的示例更多的种类的类、阶层分类的深度成为比4大的值的情况。
为了使得能够识别各个类,可以向各类分配代码。在图11的示例中,向机器类(类41)分配了代码“PW_E”。向发电机类(类43)分配了代码“G”。向火力发电机类(类44)分配了代码“GT”。代码“GT”包含代码“G”,所以可以推定代码“GT”的火力发电机类与代码“G”的发电机类之间存在子类的关系。
在图11下段示出包含数据的形式描述的实例的示例。例如,规定为对属于物理世界(PW)的类的实例赋予“+”作为前缀(Prefix),对属于信息数字化世界(CW)的类的实例赋予“=”作为前缀。
表49a涉及的实例分别示出温度传感器、流量传感器的测量值,都属于传感器机器类(代码“B”)。传感器机器类是机器类(代码“PW_E”)的子类,所以可知是物理世界(PW)的类。看到表49a的第一列时,可知作为实例的标识符使用了“+B001”和“+B002”。这些标识符是将序列号结合到形式描述“+B”而成的形式。另外,表49a所示的实例都相当于具体化图8的模式50的实际数据。
另一方面,表49b涉及的实例示出辅助电源***相关的信息,属于辅助电源类。辅助电源类是***类(代码“CW_S”)的子类,所以可知是信息数字化世界(CW)的类。看到表49b的第一列时,使用了“=B0001”作为实例的标识符。该标识符是将序列号结合到形式描述“=B”而成的形式。另外,表49b所示的实例相当于具体化图8的模式51的实际数据。
图11中所示的类的代码和形式描述仅仅为示例。因此,可以以与图11的示例不同的形式定义类的代码和形式描述。类的代码和形式描述例如可以由数值、文字、符号或这些的组合定义,或者可以由特定的位串定义。
图12是示出基于本体推定第一数据的类型的处理的流程图。图12是图7的步骤S105中执行的处理的详细说明。下面,参照图12说明处理。
首先,将第一数据中包含的形式描述信息(第1形式描述信息)与在本体数据库12中定义了的各个形式描述(第2形式描述信息)进行对照(步骤S301)。在由本体数据库12定义了与形式描述信息一致的形式描述(第二形式描述信息)的情况下(步骤S302的是),确定第一数据中包含的实例的数据的类型(子类)(步骤S303)。在由本体数据库12未定义与形式描述信息一致的形式描述(第二形式描述信息)的情况下(步骤S302的否),结束图12的处理,执行图7的步骤S106的处理。在对图11的表49a、49b的实例适用图12的处理的情况下,对照的形式描述成为去除了序列号后的“+B”、“=B”。
接着,对在图7的步骤S106中执行的处理的详细内容进行说明。在步骤S106中,基于类似度推定数据的类型。在基于类似度的数据的类型的推定处理中,存在基于文本的方法(第一方法)和机器学习手法(第二方法)。下面,在最初对第一方法进行说明之后,叙述第二方法。
图13是示出基于实例的类似度推定实例的数据的类型的处理的第一方法的流程图。下面,参照图13说明处理。
这里,对图13中使用的表述进行说明。将包含储存在日志数据库10中的m个实例的、实例的集合L表述为L=[a1、a2、a3、……、am]。当设为i=1、2、3、……、m时,各实例被表述为ai={g1、g2、g3、g4}。这里,当设为j=1、2、3、4时,gj是实例中的各个数据项目(item)的值。例如,在图11中的表49b的实例的情况下,“=B0001”、“3000w”、“直流”、“2分”相当于实例中的数据项目(item)的值。
数据收集部7获取的第一数据也能够使用同样的表述来表现。在第一数据中包含n个实例的情况下,实例的集合N被表述为N=[b1、b2、b3、……、bn]。当设为k=1、2、3、……、n时,各实例被表述为bk={h1、h2、h3、h4}。hj是实例中的各个数据项目(item)的值。另外,存在第一数据中包含数据的类型和值相同的实例的可能性,所以bk中可以存在重复。
另外,在本例中实例中包含的数据项目数为4,但不限定实例中包含的数据项目数。
首先,提取日志数据库10中包含的多个实例ai,设为实例的集合L(步骤S401)。然后,提取第一数据中包含的各实例bk,设为实例的集合N(步骤S402)。接着,计算集合L中包含的各个实例ai和集合N中包含的各个实例bk的类似度(步骤S403)。最后,将集合L中包含的实例ai中类似度最高的实例涉及的数据的类型(子类)推定为集合N中包含的各实例bk的数据的类型(子类)(步骤S404)。
接着,对使用了第一方法的情况下的具体的处理的示例进行说明。图14示出使用了实例的值的类似度的计算的第一方法。
在图14上段,作为保存在日志数据库10中的实例ai的具体示例,示出了实例60、61。另一方面,作为第一数据中包含的实例bk的具体示例,示出了实例62、63。
在图14的示例中,为了求实例彼此的类似度,计算了Simpson系数。另外,Simpson系数仅仅是计算类似度的方法的一例。例如,也可以使用WORDNET、TF-IDF等其它计算手法。
在图14下段,示出储存了Simpson系数的计算结果的表64、65。在表64示出对实例60和实例62的组合计算了Simpson系数的结果。另一方面,在表65示出对实例61和实例62的组合计算了Simpson系数的结果。也可以使得对类似度设定阈值,在计算出的类似度的值小于阈值的情况下,设定要求推定的数据的类型的再确认的标志。在设定了该标志的情况下,用户能够检查推定的数据的类型,根据需要对结果进行修改。
接着,对使用实例的类似度的第二方法进行说明。图15是示出基于实例的类似度推定实例的数据的类型的处理的第二方法的流程图。下面,参照图15说明处理。
这里,对图15中使用的表述进行说明。从在日志数据库10中储存的m个实例去除文字和符号,将仅作为数值的数据a’i的集合L’表述为L’=[a’1、a’2、a’3、……、a’m]。当设为i=1、2、3、……、m时,各数据被表述为a’i={g’1、g’2、g’3、g’4}。这里,当设为j=1、2、3、4时,g’j是数据a’i中的各个数据项目(item)的值。
数据收集部7获取的第一数据也可以使用同样的表述来表现。从第一数据中包含的n个实例去除文字和符号,将仅作为数值的数据b’k的集合N’表述为N’=[b’1,b’2,b’3,……,b’n]。当设为k=1、2、3、……、n时,各数据被表述为b’k={h’1、h’2、h’3、h’4}。h’j是数据b’k中的各个数据项目(item)的值。另外,bk的值中可以有重复。
另外,在该例子中数据b’k中包含的数据项目数为4,但不限定b’k中包含的数据项目数。
首先,准备从日志数据库10中储存的各实例去除文字和符号的仅数值的数据a’i的集合L’(步骤S501)。接着,准备从第一数据中包含的各实例去除文字和符号的仅数值的数据b’k的集合N’(步骤S502)。另外,在步骤S501及步骤S502的处理中,对实例的标识符(例如,形式描述+序列号),为了使得不损害识别性,可以例外地跳过文字和符号的去除处理。
然后,通过机器学习手法计算集合L’中包含的各个数据a’i和集合N’中包含的各个数据b’k的类似度(步骤S503)。最后,将与集合L’中包含的各个数据a’i中类似度最高的数据对应的数据的类型(子类)推定为与集合N’中包含的各个数据b’k对应的实例的数据的类型(子类)(步骤S504)。
接着,对使用第二方法的情况下的具体的处理的示例进行说明。图16示出使用了实例的值的类似度的计算的第二方法。
在图16上段,作为数据a’i的示例示出数据66、67。另外,作为数据b’k的示例示出数据68。数据66~68除了实例的标识符(形式描述+序列号)外从各数据项目(item)去除文字和符号的数据。
作为机器学***均法、最短距离法、最长距离法等,但可以是任何方法。除了聚类之外,存在计算数值的相关性的方法等,但对手法的种类不特别限定。
另外,在上述中,对类似度的计算在搜索最类似的模式时被执行的情况(例如,图9、图10)、和在搜索最类似的实例时被执行的情况(例如,图13~图16)进行了叙述。以下,在需要区分在前者的情况下计算的类似度和在后者的情况下计算的类似度的情况下,将前者称为第一类似度,后者称为第二类似度。
在图16的示例中,使用了阶层聚类,得到了标识符为“C002”的实例与标识符为“B002”的实例最类似的判定结果。
另外,在需要区分获取的第一数据中包含的实例和包含在日志数据库中、确定了数据的类型和被分类的子类的实例的情况下,将前者称为第一实例,后者称为第二实例。
在图7的流程图中,根据第一数据中包含的元数据(具体而言,模式信息和第一形式描述信息),在第一数据中包含的实例的数据的类型的推定中适用的处理不同。但是,图7的流程图仅仅为一例。因此,适用的处理的优先级可以不一定是步骤S104、步骤105、步骤S106的顺序。此外,适用这些处理的基准可以与图7的示例不同。信息处理装置1可以在数据的类型的推定处理中仅执行步骤S104、步骤S105和步骤S106的处理的一部分,也可以仅执行任一个步骤的处理。
接着,对本实施方式涉及的信息处理装置显示的画面的示例进行说明。首先,对表示推定了第一数据的分类的结果的画面的示例进行说明。
图17是在图7的步骤S108中在显示器(显示部19a)显示的画面的示例。图17的画面是示出第一数据中包含的实例的分类(数据的类型)的推定结果的GUI(图形用户接口,Graphical User Interface)的一例。
图17的画面,示出作为实例在第一数据包含火力发电厂的“第二燃气轮机入口处的燃烧气体温度”的情况。数据的类型的推定处理的结果是,该实例的类被推定为“燃气轮机”、模式为“温度”。此外,与“类:燃气轮机/模式:温度”相当的子类是“温度传感器”子类。“温度传感器”子类经由多个亲子关系成为物理世界(PW)类的子类。
此外,作为与“温度传感器”子类关联的子类,示出作为信息数字化世界(CW)类的子类的、“旋转速度设定”子类和“废气温度设定”子类。参照图17的画面可知在推定处理中使用了类似度、类似度的值在阈值以上。因此,在图17的示例中,不显示向用户要求确认推定结果的消息。
在图17的画面下部,配置有按钮90、91。当用户点击按钮90时,能够修改图17的画面所示的推定结果。作为修改推定结果的画面的示例,列举后面说明的图18。此外,当用户点击按钮91时,图17的画面所示的推定结果被保存到日志数据库10。
图18示出分类定义数据的编辑画面的示例。
图18是用于进行分类定义数据的编辑的GUI的一例。在图18的画面中,进行类的追加、类的删除、类的编辑的操作。当进行类的追加或编辑时,能够一起进行物理世界(PW)类和信息数字化世界(CW)类的切换、类的符号的设置、对应的模式的定义、对应的数据的类型名的输入等的操作。此外,在画面左上方的框中显示了类的阶层分类,所以用户能够一边确认分类定义数据的结构一边进行编辑的作业。
图18的画面,例如,在推定为获取的第一数据中包含的实例的数据的类型以及数据的类型的被分类的所述子类是未在分类定义数据中定义的数据的类型以及子类的情况下显示。但是,也可以在与之不同的定时显示图18的画面。
另外,图17、图18的画面是GUI,但是可以在命令行上(CLI)进行分类定义数据的编辑。此外,可以提供用于实现图18的画面提供的功能的API,利用API的外部的程序等进行分类定义数据的编辑操作。即,对本实施方式涉及的信息处理装置生成的画面的种类、内容,不特别限定。
此外,对显示图18的画面的装置,不特别限定。例如,可以在信息处理装置1内置的显示器显示画面,也可以在处于远程的个人电脑、智能手机、平板电脑等信息通信终端显示该画面。
在本实施方式涉及的信息处理装置及信息处理方法中,使物理世界的数据与信息数字化世界的数据中的不同反映于子类的定义。由此,能够获取收集的数据的源、性质、数据间的关联性相关的信息,正确地分类从大量的传感器、多个过程涉及的装置、***、装置收集的数据。
通过正确地分类从多个源收集的数据,得到数据的类、类间的关系相关的信息,变得容易进行多个***间的横向的数据的利用。由此,能够有效地活用多个过程涉及的数据,进行各种基础设施、工厂、发电所等的设备的操作的自动化、操作的全体最优化、统一化。通过操作方面的改善,实现各种成本的削减、安全性的提高、产品的高品质化等。
(第2实施方式)
在第2实施方式中,对信息处理装置的硬件结构进行说明。信息处理装置例如由计算机100构成。作为计算机100,包含服务器、客户终端、嵌入式机器的微电脑、平板电脑、智能手机、功能手机、个人电脑等各种信息处理装置。计算机100可以通过虚拟计算机(VM:Virtual Machine)、容器(container)等实现。
图19是表示计算机100的一例的图。图19的计算机100具备:处理器101、输入装置102、显示装置103、通信装置104、和存储装置105。处理器101、输入装置102、显示装置103、通信装置104、存储装置105通过总线106相互连接。
处理器101是包含计算机100的控制装置和运算装置的电子电路。作为处理器101,例如,可以使用通用目的处理器、中央处理装置(CPU)、微处理器、数字信号处理器(DSP)、控制器、微控制器、状态机、专用集成电路、现场可编程门阵列(FPGA)、可编程逻辑电路(PLD)或者它们的组合。
处理器101基于从经由总线106连接的各装置(例如,输入装置102、通信装置104、存储装置105)输入的数据、程序进行运算处理,将运算结果、控制信号输出到经由总线106连接的各装置(例如,显示装置103、通信装置104、存储装置105)。具体而言,处理器101执行计算机100的OS(操作***)、程序等,控制计算机100中包含的各个装置。
在计算机100中,能够安装第一实施方式中的信息处理装置1的各结构要素涉及的处理。程序存储在非临时的有形的计算机可读取的存储介质中。上述存储介质例如是光盘、光磁盘、磁盘、磁带、闪存、半导体存储器,但不限于此。通过处理器101执行程序,计算机100能够提供在第一实施方式中叙述的各种功能。
输入装置102是用于向计算机100输入信息的装置。输入装置102例如是键盘、鼠标、触摸面板等,但不限于此。用户通过使用输入装置102,能够输入元模型、类的阶层分类、类的代码、模式的定义、数据的类型的名称等。
显示装置103是用于显示图像、影像的装置。显示装置103例如是LCD(液晶显示器)、CRT(显像管)、有机EL(有机电致发光)显示器、投影仪、LED显示器等,但不限于此。在显示装置103中,显示推定了第一数据中包含的实例的数据的类型的结果、分类定义数据的编辑画面等。
通信装置104是用于计算机100与外部装置以无线或有线通信的装置。通信装置104例如是NIC(网络接口卡,Network Interface Card)、通信模块、调制解调器、集线器、路由器等,但不限于此。计算机100可以经由通信装置104收集遥远地的发电所、工厂、设施的测量数据、设定数据等。此外,在计算机100(信息处理装置1)是设置在数据中心、机房的服务器等的情况下,计算机100可以经由通信装置104,受理从远程的信息通信终端发送的指令,或者在远程的信息通信终端显示画面显示的内容。
存储装置105是存储计算机100的OS、程序、程序的执行所需的数据、由程序的执行生成的数据等的存储介质。在存储装置105中包含主存储装置和外部存储装置。主存储装置例如是RAM、DRAM、SRAM,但不限于此。此外,外部存储装置例如是硬盘、光盘、闪存、磁带等,但不限于此。上述日志数据库10、模式数据库11、本体数据库12、元模型数据库13可以构建在存储装置105上,也可以构建在外部的服务器、储存器上。
另外,计算机100可以分别一个或多个地具备处理器101、输入装置102、显示装置103、通信装置104、存储装置105。此外,可以将打印机、扫描仪等***设备连接到计算机100。
此外,信息处理装置可以由单个计算机100构成,也可以由多个计算机100相互连接的信息***构成。
此外,程序可以预先存储在计算机100的存储装置105,也可以存储在计算机100的外部的存储介质,也可以上传到因特网上。在哪一种情况下都能够通过将程序在计算机100安装并执行,实现第一实施方式涉及的信息处理装置的功能。
另外,可以将上述实施方式总结为以下技术方案。
技术方案1
一种信息处理方法,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类;使计算机执行:
获取包含所述实例的第一数据的步骤;以及
参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个,推定所述实例的被分类的所述子类的步骤。
技术方案2
技术方案1所述的信息处理方法,包含:参照在所述分类定义数据中定义了的所述子类间的关系,确定所述实例的被分类的所述子类与其它所述子类之间具有的关系的步骤。
技术方案3
技术方案1或2所述的信息处理方法,在所述第一数据包含规定了所述实例的形式的模式信息的情况下,计算所述模式信息、和按每个所述子类定义了所述实例的形式的模式定义信息之间的第一类似度,将与所述第一类似度最高的所述模式定义信息对应的所述子类推定为所述第一数据中包含的所述实例的所述子类。
技术方案4
技术方案3所述的信息处理方法,在所述第一类似度最高的所述模式定义信息中的所述第一类似度小于阈值的情况下,对用户通知要求确认与所述第一数据中包含的所述实例对应的所述子类的推定结果的消息。
技术方案5
技术方案1至4中任一项所述的信息处理方法,在所述第一数据包含作为所述子类的标识符的第一形式描述信息的情况下,对照所述第一形式记述信息、和作为所述分类定义数据中包含的所述子类的标识符的第二形式描述信息,在所述第一形式描述信息和所述第二形式描述信息一致的情况下,推定为与所述第一数据中包含的所述实例对应的所述子类是所述第二形式描述信息确定的所述子类。
技术方案6
技术方案1至5中任一项中记载的信息处理方法,计算作为获取的所述第一数据中包含的所述实例的第一实例、和作为所述日志数据中包含的所述实例的第二实例之间的第二类似度,将与所述第二类似度最高的所述第二实例对应的所述子类推定为所述第一实例的所述子类。
技术方案7
技术方案1或2中记载的信息处理方法,在所述第一数据不包含规定了所述实例的形式的模式信息但包含作为所述子类的标识符的第一形式描述信息的情况下,对照所述第一形式描述信息、和作为所述分类定义数据中包含的所述子类的标识符的第二形式描述信息,在所述第一形式描述信息和所述第二形式描述信息一致的情况下,推定为与所述第一数据中包含的所述实例对应的所述子类是所述第二形式描述信息确定的所述子类。
技术方案8
技术方案1或2中描述的信息处理方法,在所述第一数据不包含规定了所述实例的形式的模式信息、和作为与所述实例对应的所述子类的标识符的第一形式描述信息的每一个的情况下,计算作为获取的所述第一数据中包含的所述实例的第一实例、和作为所述日志数据中包含的所述实例的第二实例之间的第二类似度,将与所述第二类似度最高的所述第二实例对应的所述子类推定为所述第一实例的所述子类。
技术方案9
技术方案1到8中任一项所述的信息处理方法,包含:在推定为与获取的所述第一数据中包含的所述实例对应的所述子类是未在所述分类定义数据中定义的所述子类的情况下,向所述分类定义数据追加所述子类的定义和定义所述实例的形式的模式的定义的步骤。
技术方案10
技术方案9所述的信息处理方法,在向所述分类定义数据追加的所述子类与其它所述子类具有关系的情况下,向所述分类定义数据追加和所述子类具有的与其它所述子类的关系有关的信息。
技术方案11
技术方案1至10中任一项所述的信息处理方法,包含:在推定为与获取的所述第一数据中包含的所述实例对应的所述子类是未在所述分类定义数据中定义的所述子类的情况下,生成用户编辑所述分类定义数据的画面的步骤。
技术方案12
一种程序,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类,该程序使计算机执行:
获取包含所述实例的第一数据的步骤;
参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个,推定所述实例的被分类的所述子类的步骤;以及
参照在所述分类定义数据中定义了的所述子类间的关系,确定所述实例的被分类的所述子类与其它所述子类之间具有的关系的步骤。
技术方案13
技术方案12所述的程序,包含:在显示器显示对所述第一数据中包含的所述实例推定的所述子类、所述子类与其它所述子类之间具有的关系的步骤。
技术方案14
一种信息处理装置,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类,该信息处理装置具备:
数据收集部,获取包含所述实例的第一数据;
存储部,保存定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个;以及
数据处理部,参照所述分类定义数据或者所述日志数据的至少任一个,推定所述实例的被分类的所述子类。
技术方案15
技术方案14中记载的信息处理装置,所述分类定义数据定义所述子类间的关系,所述数据处理部参照所述分类定义数据,确定所述子类与其它所述子类之间具有的关系。
说明了本发明的几个实施方式,但是这些实施方式作为示例出示,不意图限定发明的范围。这些实施方式能够以其它各种各样的方式实施,在不脱离发明的要旨的范围内,能够进行各种省略、置换、变更。这些实施方式、其变形与包含于发明的范围、要旨同样地包含于权利要求书记载的发明及其均等的范围。

Claims (12)

1.一种信息处理方法,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类;使计算机执行:
获取包含所述实例的第一数据的步骤;
参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个,推定所述实例的被分类的所述子类的步骤;以及
参照在所述分类定义数据中定义了的所述子类间的关系,确定所述实例的被分类的所述子类与其它所述子类之间具有的关系的步骤,
在所述第一数据包含规定了所述实例的形式的模式信息的情况下,计算所述模式信息、和按每个所述子类定义了所述实例的形式的模式定义信息之间的第一类似度,将与所述第一类似度最高的所述模式定义信息对应的所述子类推定为所述第一数据中包含的所述实例的所述子类。
2.如权利要求1所述的信息处理方法,其中,
在所述第一类似度最高的所述模式定义信息中的所述第一类似度小于阈值的情况下,对用户通知要求确认与所述第一数据中包含的所述实例对应的所述子类的推定结果的消息。
3.如权利要求1或2所述的信息处理方法,其中,
在所述第一数据包含作为所述子类的标识符的第一形式描述信息的情况下,对照所述第一形式描述信息、和作为所述分类定义数据中包含的所述子类的标识符的第二形式描述信息,在所述第一形式描述信息和所述第二形式描述信息一致的情况下,推定为与所述第一数据中包含的所述实例对应的所述子类是所述第二形式描述信息确定的所述子类。
4.如权利要求1或2中所述的信息处理方法,其中,
计算作为获取的所述第一数据中包含的所述实例的第一实例、和作为所述日志数据中包含的所述实例的第二实例之间的第二类似度,将与所述第二类似度最高的所述第二实例对应的所述子类推定为所述第一实例的所述子类。
5.如权利要求1中所述的信息处理方法,其中,
在所述第一数据不包含规定了所述实例的形式的模式信息但包含作为所述子类的标识符的第一形式描述信息的情况下,对照所述第一形式描述信息、和作为所述分类定义数据中包含的所述子类的标识符的第二形式描述信息,在所述第一形式描述信息和所述第二形式描述信息一致的情况下,推定为与所述第一数据中包含的所述实例对应的所述子类是所述第二形式描述信息确定的所述子类。
6.如权利要求1中所述的信息处理方法,其中,
在所述第一数据不包含规定了所述实例的形式的模式信息、和作为与所述实例对应的所述子类的标识符的第一形式描述信息的每一个的情况下,计算作为获取的所述第一数据中包含的所述实例的第一实例、和作为所述日志数据中包含的所述实例的第二实例之间的第二类似度,将与所述第二类似度最高的所述第二实例对应的所述子类推定为所述第一实例的所述子类。
7.如权利要求1或2所述的信息处理方法,其中,
包含:在推定为与获取的所述第一数据中包含的所述实例对应的所述子类是未在所述分类定义数据中定义的所述子类的情况下,向所述分类定义数据追加所述子类的定义和定义所述实例的形式的模式的定义的步骤。
8.如权利要求7所述的信息处理方法,其中,
在向所述分类定义数据追加的所述子类与其它所述子类具有关系的情况下,向所述分类定义数据追加和所述子类具有的与其它所述子类的关系有关的信息。
9.如权利要求1或2所述的信息处理方法,其中,
包含:在推定为与获取的所述第一数据中包含的所述实例对应的所述子类是未在所述分类定义数据中定义的所述子类的情况下,生成用户编辑所述分类定义数据的画面的步骤。
10.一种记录有程序的计算机可读取的记录介质,该程序将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类,该程序使计算机执行:
获取包含所述实例的第一数据的步骤;
参照定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个,推定所述实例的被分类的所述子类的步骤;以及
参照在所述分类定义数据中定义了的所述子类间的关系,确定所述实例的被分类的所述子类与其它所述子类之间具有的关系的步骤,
在所述第一数据包含规定了所述实例的形式的模式信息的情况下,计算所述模式信息、和按每个所述子类定义了所述实例的形式的模式定义信息之间的第一类似度,将与所述第一类似度最高的所述模式定义信息对应的所述子类推定为所述第一数据中包含的所述实例的所述子类。
11.如权利要求10所述的记录有程序的计算机可读取的记录介质,其中,
该程序包含:在显示器显示关于在所述第一数据中包含的所述实例,推定的所述子类、所述子类与其它所述子类之间具有的关系的步骤。
12.一种信息处理装置,将作为多个数据项目的值的组合的实例分类为基于物理的实体定义的物理世界类或者概念定义的信息数字化世界类的任一个的子类,该信息处理装置具备:
数据收集部,获取包含所述实例的第一数据;
存储部,保存定义所述子类的分类定义数据或者作为过去获取的所述第一数据的集合的、由所述分类定义数据定义了所述第一数据中包含的所述实例的所述子类的日志数据的至少任一个;以及
数据处理部,参照所述分类定义数据或者所述日志数据的至少任一个,推定所述实例的被分类的所述子类,
所述分类定义数据定义所述子类间的关系,所述数据处理部参照所述分类定义数据,确定所述子类与其它所述子类之间具有的关系,
在所述第一数据包含规定了所述实例的形式的模式信息的情况下,计算所述模式信息、和按每个所述子类定义了所述实例的形式的模式定义信息之间的第一类似度,将与所述第一类似度最高的所述模式定义信息对应的所述子类推定为所述第一数据中包含的所述实例的所述子类。
CN201910195680.XA 2018-05-11 2019-03-15 信息处理方法、程序和信息处理装置 Active CN110471373B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018092431A JP7029347B2 (ja) 2018-05-11 2018-05-11 情報処理方法、プログラムおよび情報処理装置
JP2018-092431 2018-05-11

Publications (2)

Publication Number Publication Date
CN110471373A CN110471373A (zh) 2019-11-19
CN110471373B true CN110471373B (zh) 2023-03-07

Family

ID=65686716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910195680.XA Active CN110471373B (zh) 2018-05-11 2019-03-15 信息处理方法、程序和信息处理装置

Country Status (4)

Country Link
US (1) US11934963B2 (zh)
EP (1) EP3567492A1 (zh)
JP (1) JP7029347B2 (zh)
CN (1) CN110471373B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140357A (ja) * 2020-03-03 2021-09-16 富士通株式会社 情報処理装置、情報処理プログラム及び情報処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2011145374A1 (ja) * 2010-05-17 2013-07-22 株式会社日立製作所 計算機システム、及び、規則生成方法
WO2013137903A1 (en) * 2012-03-16 2013-09-19 Orbis Technologies, Inc. Systems and methods for semantic inference and reasoning
CN103430179A (zh) * 2011-02-07 2013-12-04 英特尔公司 在图像数据库中添加新图像和其相关信息的方法、***以及计算机可读存储介质
WO2017010506A1 (ja) * 2015-07-13 2017-01-19 帝人株式会社 情報処理装置、情報処理方法およびコンピュータプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1324216A1 (en) 2001-12-28 2003-07-02 Deutsche Thomson-Brandt Gmbh Machine for classification of metadata
JP5043735B2 (ja) * 2008-03-28 2012-10-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報分類システム、情報処理装置、情報分類方法およびプログラム
EP2618444A4 (en) * 2010-09-14 2015-02-18 Toshiba Kk INTELLIGENT ELECTRICAL NETWORK ONTOLOGY UPDATE DEVICE
US9076152B2 (en) * 2010-10-20 2015-07-07 Microsoft Technology Licensing, Llc Semantic analysis of information
JP6184167B2 (ja) 2013-05-21 2017-08-23 株式会社東芝 データ処理装置、方法およびプログラム
JP2017514256A (ja) * 2014-04-24 2017-06-01 セマンティック・テクノロジーズ・プロプライエタリー・リミテッド オントロジアライナ方法、セマンティックマッチング方法及び装置
US20150347467A1 (en) * 2014-05-27 2015-12-03 International Business Machines Corporation Dynamic creation of domain specific corpora
US20160224645A1 (en) 2015-02-03 2016-08-04 Siemens Aktiengesellschaft System and method for ontology-based data integration
WO2016145480A1 (en) * 2015-03-19 2016-09-22 Semantic Technologies Pty Ltd Semantic knowledge base
US20160335544A1 (en) 2015-05-12 2016-11-17 Claudia Bretschneider Method and Apparatus for Generating a Knowledge Data Model

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2011145374A1 (ja) * 2010-05-17 2013-07-22 株式会社日立製作所 計算機システム、及び、規則生成方法
CN103430179A (zh) * 2011-02-07 2013-12-04 英特尔公司 在图像数据库中添加新图像和其相关信息的方法、***以及计算机可读存储介质
WO2013137903A1 (en) * 2012-03-16 2013-09-19 Orbis Technologies, Inc. Systems and methods for semantic inference and reasoning
WO2017010506A1 (ja) * 2015-07-13 2017-01-19 帝人株式会社 情報処理装置、情報処理方法およびコンピュータプログラム

Also Published As

Publication number Publication date
JP7029347B2 (ja) 2022-03-03
JP2019197495A (ja) 2019-11-14
EP3567492A1 (en) 2019-11-13
US20190347561A1 (en) 2019-11-14
CN110471373A (zh) 2019-11-19
US11934963B2 (en) 2024-03-19

Similar Documents

Publication Publication Date Title
US11971898B2 (en) Method and system for implementing machine learning classifications
CN108628929B (zh) 用于智能存档和分析的方法和装置
US11645471B1 (en) Determining a relationship recommendation for a natural language request
US10237295B2 (en) Automated event ID field analysis on heterogeneous logs
US8782597B2 (en) Ontology updating apparatus, method and system
CN110869920B (zh) 多维工业知识图形
US20220374442A1 (en) Extract, transform, load monitoring platform
US20120239596A1 (en) Classification of stream-based data using machine learning
CN105760491B (zh) 基于设备功能的数据建模方法及装置
CN107870949B (zh) 数据分析作业依赖关系生成方法和***
US10459730B2 (en) Analysis system and analysis method for executing analysis process with at least portions of time series data and analysis data as input data
CN111258798A (zh) 监控数据的故障定位方法、装置、计算机设备及存储介质
US20150379112A1 (en) Creating an on-line job function ontology
CN110674231A (zh) 一种面向数据湖的用户id集成方法和***
CN110471373B (zh) 信息处理方法、程序和信息处理装置
CN109828965B (zh) 一种数据处理的方法及电子设备
CN114443437A (zh) 告警根因输出方法、装置、设备、介质和程序产品
US20130117245A1 (en) Method and system for identification of asset records in a version managed datastore
CN114556238A (zh) 用于在云计算环境中生成资产信息的数字表示的方法和***
EP4105813A1 (en) Method for analyzing data consisting of a large number of individual messages, computer program product and computer system
CN115329150A (zh) 生成搜索条件树的方法、装置、电子设备及存储介质
JP5922811B1 (ja) ログ情報分類装置、ログ情報分類方法、及びプログラム
JP7381290B2 (ja) 計算機システム及びデータの管理方法
CN104243201B (zh) 网络设备测试用例对应拓扑图的存储方法及***
US11394626B2 (en) Digital services framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant