CN113139817A - 数据分类方法、数据分类装置、介质及电子设备 - Google Patents

数据分类方法、数据分类装置、介质及电子设备 Download PDF

Info

Publication number
CN113139817A
CN113139817A CN202110468156.2A CN202110468156A CN113139817A CN 113139817 A CN113139817 A CN 113139817A CN 202110468156 A CN202110468156 A CN 202110468156A CN 113139817 A CN113139817 A CN 113139817A
Authority
CN
China
Prior art keywords
internet
things
data
abnormal
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110468156.2A
Other languages
English (en)
Inventor
吴昊
陈鹏
徐峰
崔海明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110468156.2A priority Critical patent/CN113139817A/zh
Publication of CN113139817A publication Critical patent/CN113139817A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)

Abstract

本公开涉及计算机领域,具体涉及一种数据分类方法、数据分类装置、计算机可读存储介质及电子设备,包括:获取物联网数据,其中,物联网数据包括物联网正常数据与物联网异常数据;将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据;将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。通过本公开实施例的技术方案,可以解决物联网数据分类错误的问题。

Description

数据分类方法、数据分类装置、介质及电子设备
技术领域
本公开涉及计算机领域,具体而言,涉及数据分类方法、数据分类装置、计算机可读存储介质及电子设备。
背景技术
随着信息化的高速发展与人们生活水平的提高,人们越来越关注商品溯源问题,更希望能够充分了解商品的生产信息和物流信息,可以通过二维码、条码、RFID等进行商品溯源。例如,人们可以通过扫描二维码,查看商品的网页静态信息。
在相关技术中,在需要查看商品的动态信息时,可以将物联网设备采集到的数据进行分类存储到数据库中,以此完成商品动态信息的存储,方便用户查看。
然而,随着物联网节点的不断增加,使得物联网节点之间的结构越来越复杂,导致物联网数据量不断增加,节点采集到的物联网数据具有高维性、复杂性、实时性等特征,容易出现数据异常的问题,导致数据分类错误。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种数据分类方法、数据分类装置、计算机可读存储介质及电子设备,可以解决物联网数据分类错误的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供了一种数据分类方法,包括:获取物联网数据,其中,所述物联网数据包括物联网正常数据与物联网异常数据;将所述物联网数据输入数据分类模型,检测所述物联网数据中的物联网异常数据;将所述物联网异常数据校正为物联网正常数据,并根据所述数据分类模型对所述物联网正常数据进行分类。
在本公开的一种示例性实施例中,基于前述方案,所述检测所述物联网数据中的物联网异常数据,包括:获取所述物联网数据对应的第一物联网正常数据;其中,第一物联网正常数据为所述物联网数据的前一个时间单位的物联网正常数据;根据所述第一物联网正常数据检测所述物联网数据中的物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,所述根据所述第一物联网正常数据检测所述物联网数据中的物联网异常数据,包括:获取物联网数据异常阈值;根据所述第一物联网正常数据以及所述物联网数据异常阈值检测所述物联网数据中的物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,所述根据所述第一物联网正常数据以及所述物联网数据异常阈值检测所述物联网数据中的物联网异常数据,包括:计算所述第一物联网正常数据与所述物联网数据的差值;根据所述差值与所述物联网数据异常阈值的大小关系确定所述物联网数据是否为物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,所述将所述物联网异常数据校正为物联网正常数据,包括:获取所述物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子;其中,所述第二物联网正常数据为所述物联网异常数据相邻时间单位区间内的物联网正常数据;根据所述第二物联网正常数据以及所述异常数据校正因子将所述物联网异常数据校正为物联网正常数据。
在本公开的一种示例性实施例中,基于前述方案,所述异常数据校正因子包括第一相关校正因子和第二相关校正因子,所述根据所述第二物联网正常数据以及所述异常数据校正因子将所述物联网异常数据校正为物联网正常数据,包括:根据所述第一相关校正因子和第二相关校正因子对所述第二物联网正常数据进行调整得到第二物联网预测数据;其中,所述第二物联网正常数据包括前相邻时间单位区间的物联网正常数据和后相邻时间单位区间的物联网正常数据;根据所述第二物联网预测数据将所述物联网异常数据校正为物联网正常数据。
在本公开的一种示例性实施例中,基于前述方案,所述数据分类模型包括异常处理长短记忆网络模型。
在本公开的一种示例性实施例中,基于前述方案,所述异常处理长短记忆网络模型包括遗忘门与输入门,所述方法还包括:根据所述遗忘门与输入门组成更新门;所述遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元;其中,所述第一记忆单元为前一个时间单位所述异常处理长短记忆网络模型生成的记忆单元;所述临时记忆单元为当前时间单位所述异常处理长短记忆网络模型生成的记忆单元;所述第二记忆单元为当前时间单位所述异常处理长短记忆网络模型生成的记忆单元。
在本公开的一种示例性实施例中,基于前述方案,获取所述异常处理长短记忆网络模型的第一隐含状态信息;根据所述第一隐含状态信息与所述第二记忆单元确定第二隐含状态信息;其中,所述第一隐含状态信息为前一个时间单位所述异常处理长短记忆网络模型生成的隐含状态信息;所述第二隐含状态信息为当前时间单位所述异常处理长短记忆网络模型生成的隐含状态信息。
根据本公开的第二方面,提供了一种数据分类装置,所述装置包括:物联网数据获取模块,用于获取物联网数据;其中,所述物联网数据包括物联网正常数据与物联网异常数据;异常数据监测模块,用于将所述物联网数据输入数据分类模型,检测所述物联网数据中的物联网异常数据;物联网数据分类模块,用于将所述物联网异常数据校正为物联网正常数据,并根据所述数据分类模型对所述物联网正常数据进行分类。
根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的数据分类方法。
根据本公开的第四方面,提供了一种电子设备,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述数据分类方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开的一种实施例所述提供的数据分类方法中,当获取物联网数据后,可以将所述物联网数据输入数据分类模型,检测所述物联网数据中的物联网异常数据,将所述物联网异常数据校正为物联网正常数据,并根据所述数据分类模型对所述物联网正常数据进行分类
本公开的实施例,可以将物联网数据中的异常数据校正为正常数据,并对物联网正常数据进行分类。一方面,可以对异常数据进行处理,提升数据分类的准确率,避免直接对异常数据进行分类存储,从而导致用户查询到异常数据,进而造成用户体验下降的问题;另一方面,对异常数据进行校正,而不是直接将物联网异常数据剔除,可以保证物联网数据的连续性,从而提高用户的产品信任度,进而增强用户的购买信心。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了本公开示例性实施例中数据分类方法示例性***架构的示意图;
图2示意性示出了本公开示例性实施例中数据分类方法的流程图;
图3示意性示出本公开示例性实施例中根据第一物联网正常数据检测物联网数据中的物联网异常数据的流程图;
图4示意性示出本公开示例性实施例中根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据的流程图;
图5示意性示出本公开示例性实施例中根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据的流程图;
图6示意性示出本公开示例性实施例中根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据的流程图;
图7示意性示出本公开示例性实施例中根据第二物联网预测数据将物联网异常数据校正为物联网正常数据的流程图;
图8示意性示出本公开示例性实施例中根据确定的遗忘门对物联网正常数据进行分类的流程图;
图9示意性示出本公开示例性实施例中遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元的流程图;
图10示意性示出本公开示例性实施例中根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息的流程图;
图11示意性示出本公开示例性实施例中异常处理长短记忆网络模型的结构的示意图;
图12示意性示出本公开示例性实施例中物联网正常数据搜索***的示意图;
图13示意性示出本公开示例性实施例中一种数据分类装置的组成示意图;
图14示意性示出了适于用来实现本公开示例性实施例的电子设备的计算机***的结构示意图。
具体实施方式
现在将参照附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的数据分类方法示例性***架构的示意图。
如图1所示,***架构1000可以包括终端设备1001、1002、1003中的一种或多种,网络1004和服务器1005。网络1004用以在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器1005可以是多个服务器组成的服务器集群等。
用户可以使用终端设备1001、1002、1003通过网络1004与服务器1005交互,以接收或发送消息等。终端设备1001、1002、1003可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。另外,服务器1005可以是提供各种服务的服务器。
在一种实施例中,本公开的数据分类方法的执行主体可以是服务器1005,服务器1005可以获取由终端设备1001、1002、1003发送的物联网数据,将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类,以完成数据分类的过程。此外,还可以通过终端设备1001、1002、1003等执行本公开的数据分类方法,以实现根据数据分类模型独一物联网数据进行分类的过程。
此外,本公开数据分类方法的实现过程还可以由终端设备1001、1002、1003和服务器1005共同实现。例如,终端设备1001、1002、1003可以获取物联网数据,然后获取到的物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据,再将得到的物联网异常数据以及物联网正常数据发送给服务器1005,以使服务器1005可以将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
随着人们的生活水平的不断提高,人们越来越关注商品溯源问题。针对于一些特殊商品,例如食品等,人们更希望了解商品的生产信息以及物流运输信息。在相关技术中,可以通过二维码。条码和RFID等方式进行商品溯源。例如,可以通过使用手机扫描商品上附带的二维码,二维码中保存了商品的一些静态信息(产地等)。然而,无法查看商品的生长、生产、运输等一系列的实时动态信息,因此,相关技术中的方案无法满足当前用户的商品溯源需求。
在需要实时查看商品的动态信息时,可以在商品的制作(生成)环境以及物流过程中设置多个物联网设备(例如传感器),利用互联网技术对采集到的物联网数据进行传输,并将获取到的数据进行分类以便用户查看。然而,随着物联网的节点不断增加,物联网的网络结构也越来越复杂,传输的物联网数据量也越来越多,这些数据具有高维性、复杂性、实时性等特征,由于网络传输的不稳定性等因素,容易造成数据异常的问题,如果将这些异常数据按照正常数据进行处理,就会极大的影响用户的使用体验。
根据本示例性实施例中所提供的数据分类的方法中,当获取物联网数据后,可以将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。如图2所示,该数据分类方法可以包括以下步骤:
步骤S210,获取物联网数据,其中,物联网数据包括物联网正常数据与物联网异常数据;
步骤S220,将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据;
步骤S230,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
在本示例实施方式所提供的数据分类方法中,获取物联网数据后,可以将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
本公开的实施例,可以将物联网数据中的异常数据校正为正常数据,并对物联网正常数据进行分类。一方面,可以对异常数据进行处理,提升数据分类的准确率,避免直接对异常数据进行分类存储,从而导致用户查询到异常数据,进而造成用户体验下降的问题;另一方面,对异常数据进行校正,而不是直接将物联网异常数据剔除,可以保证物联网数据的连续性,从而提高用户的产品信任度,进而增强用户的购买信心。
下面,将结合附图及实施例对本示例性实施例中的数据分类的步骤S210~S230进行更详细的说明。
步骤S210,获取物联网数据,其中,物联网数据包括物联网正常数据与物联网异常数据;
在本公开的一种示例实施例中,物联网是互联网基础上的延伸和扩展的网络,将各种信息传感设备与网络结合起来而形成的一个巨大网络,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。物联网可以通过射频识别、红外感应器、全球定位***、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交换和通信,以实现对物品的智能化识别、定位、跟踪、监控和管理的一种网络。
在本公开的一种示例实施例中,可以获取物联网数据。具体的,物联网数据可以包括状态数据,状态数据可以表示供应商和消费者关于物联网的实时动态数据。举例而言,状态数据可以表示冷库中的压缩机是否正常运行;物联网数据还可以包括可供行为参考数据,可供行为参考数据可以表示有后续计划的状态数据,依赖于能够改变***实时状态的自动化技术,以及能够使人们改变行为***的隐私、安全以及匿名性来检验产品的实际表现,并鼓励持续的产品改进和创新;物联网数据还可以包括定位数据,可以通过定位数据确定当前物品的位置;物联网数据还可以包括个性化数据,个性化数据指的是个人偏好资料。需要说明的是,本公开对于物联网数据的具体类型并不做特殊限定。
在本公开的一种示例实施例中,可以通过多种传感器采集物联网数据。举例而言,针对于牛奶商品而言,用户更关注奶牛的实时生长环境信息,如土壤信息、温度信息、湿度信息等,此时可以通过土壤传感器、温度传感器、湿度传感器采集这些用户感兴趣的数据。需要说明的是,本公开对于采集物联网数据的方式并不做特殊限定。
进一步的,在通过传感器获取到物联网数据之后,可以对这些物联网数据进行处理。具体的,由于这些物联网数据通常来自于不同的物联网设备,因此可能具有不同的格式,因此,在对这些物联网数据进行使用或处理之前,可以将这些物联网数据标准化或转换为统一格式,确保标准化或转换的格式与物联网数据分析或处理的应用程序兼容。
在本公开的一种示例实施例中,可以获取物联网数据,物联网数据包括物联网正常数据与物联网异常数据。举例而言,由于物联网设备所处的环境复杂,容易出向短暂性的故障,此时会采集到一些异常数据,或者由于物联网的网络结构较为复杂且网络传输的不稳定性,在进行数据传输的过程中,也会出现数据异常的问题。此时,得到的物联网数据就会包括物联网正常数据与物联网异常数据,物联网异常数据会影响数据分类的准确率,极大的影响用户体验。
步骤S220,将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据;
在本公开的一种示例实施例中,可以将物联网数据输入数据分类模型。具体的,数据分类模型可以用于检测所输入的物联网数据为物联网正常数据还是物联网异常数据,并对物联网异常数据进行校正,将校正后的物联网正常数据和原本的物联网正常数据进行分类。需要说明的是,本公开对于数据分类模型的具体形式并不做特殊限定。
在本公开的一种示例实施例中,可以通过数据分类模型检测物联网数据中的物联网异常数据。具体的,可以将明显不符合当前场景的物联网数据确定为物联网确定为物联网异常数据,物联网异常数据检测的规则或方法集成在数据分类模型中。举例而言,针对于奶牛的生长环境信息而言,14:00、14:10、14:20、14:30获取到的温度信息分别为20℃、21℃、35℃、19℃,此时14:20对应的35℃明显不符合当前的温度场景,此时,可以将14:20对应的35℃确定为物联网异常数据,14:00、14:10、14:20、14:30获取到的湿度信息分别为45%、50%、20%、50%,此时14:20对应的20%明显不符合当前的湿度场景,此时,可以将14:20对应的20%确定为物联网异常数据。也可以设置正常数据范围,当某个物联网数据超出正常数据范围时,将这个物联网数据确定为物联网异常数据。当需要说明的是,本公开对于物联网异常数据的检测方法并不做特殊限定。
在本公开的一种示例实施例中,可以获取物联网数据对应的第一物联网正常数据;其中,第一物联网正常数据为物联网数据的前一个时间单位的物联网正常数据,可以根据第一物联网正常数据检测物联网数据中的物联网异常数据。参照图3所示,根据第一物联网正常数据检测物联网数据中的物联网异常数据,可以包括以下步骤S310~S320:
步骤S310,获取物联网数据对应的第一物联网正常数据;其中,第一物联网正常数据为物联网数据的前一个时间单位的物联网正常数据;
在本公开的一种示例实施例中,可以获取物联网数据对应的第一物联网正常数据。具体的,在获取物联网数据时,可以根据时间单位获取物联网数据。例如,可以每隔10分钟获取一次物联网数据,也可以将每10分钟采集到的数据进行处理后进行获取。当获取到当前的物联网数据之后,可以获取前一个时间单位的物联网正常数据,该前一个时间单位的物联网正常数据为第一物联网正常数据。需要说明的是,本公开对于获取物联网数据的时间单位并不做特殊限定。
步骤S320,根据第一物联网正常数据检测物联网数据中的物联网异常数据。
在本公开的一种示例实施例中,在获取到第一物联网正常数据之后,可以根据第一物联网正常数据检测物联网数据中的物联网异常数据。具体的,由于物联网数据随着时间的变化,变化幅度较小,因此可以将当前的物联网数据与第一物联网正常数据进行比较,当第一物联网正常数据与当前的物联网数据的差值较大时,将当前的物联网数据确定为物联网异常数据。进一步的,可以计算物联网数据中的每两个物联网正常数据之间的差值,并计算这些差值的平均值,以差值的平均值作为评价第一物联网正常数据与当前的物联网数据的差值是否较大的标准。需要说明的是,本公开对于根据第一物联网正常数据确定物联网异常数据的方式并不做特殊限定。
通过上述步骤S310~S320,可以获取物联网数据对应的第一物联网正常数据,并根据第一物联网正常数据检测物联网数据中的物联网异常数据。
在本公开的一种示例实施例中,可以获取物联网数据异常阈值,并根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据。参照图4所示,根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据,可以包括以下步骤S410~S420:
步骤S410,获取物联网数据异常阈值;
在本公开的一种示例实施例中,可以设置物联网数据异常阈值,物联网数据异常阈值可以表示当获取到的数据超出物联网数据异常阈值时,则将当前的物联网数据确定为物联网异常数据。具体的,在设置物联网数据异常阈值时,可以根据具体的业务场景,设置合适的物联网数据异常阈值,也可以通过数学运算的方式确定物联网数据异常阈值,例如可以获取某段时间的5个最大的物联网正常数据,并对这5个物联网正常数据计算平均数,将这个平均数作为物联网数据异常阈值。具体的,可以将物联网数据异常阈值存储在服务期间或终端设备的存储器中,在需要使用物联网数据异常阈值时,可以从服务器或存储器中调用物联网数据异常阈值。需要说明的是,本公开对于物联网数据异常阈值的设定方式并不做特殊限定。
步骤S420,根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据。
在本公开的一种示例实施例中,在通过上述步骤获取到物联网数据异常阈值之后,可以根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据。具体的,当获取到的物联网数据超出物联网数据异常阈值限定的区间之后,则将这个物联网数据确定为物联网异常数据。举例而言,针对于奶牛的温度信息而言,可以以日为单位设置物联网数据异常阈值,如夏季的某一天设置的物联网数据异常阈值为20℃、43℃,当获取到的温度为10℃时,此时10℃小于物联网数据异常阈值20℃,可以将这个10℃确定为物联网异常数据。
通过上述步骤S410~S420,可以获取物联网数据异常阈值,并根据第一物联网正常数据、物联网数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据。
在本公开的一种示例实施例中,可以计算第一物联网正常数据与物联网数据的差值,并根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据。参照图5所示,根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据,可以包括以下步骤S510~S520:
步骤S510,计算第一物联网正常数据与物联网数据的差值;
在本公开的一种示例实施例中,在获取到第一物联网正常数据之后,可以计算第一物联网正常数据与物联网数据的差值。具体的,可以实时获取物联网数据,将这个物联网数据与其对应的第一物联网正常数据做差值。
步骤S520,根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据。
在本公开的一种示例实施例中,在获取到第一物联网正常数据与物联网数据的差值之后,可以根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据。具体的,物联网数据异常阈值可以表示物联网数据的偏差程度,可以提前设置好物联网数据异常阈值,并将物联网数据异常阈值存储在服务器或终端设备的存储器中,在需要使用物联网数据异常阈值时,可以在服务器或终端设备的存储器中调用。在获取到物联网数据异常阈值时,可以比较物联网数据异常阈值与差值的大小,当差值大于物联网数据异常阈值时,将差值对应的物联网数据确定为物联网异常数据。
在本公开的一种示例实施例中,还可以设置物联网数据xt与第一物联网正常数据xt-1的差值的平方大于物联网数据异常阈值m时,将物联网数据确定为物联网异常数据,具体表达式如下:
|xt-xt-1|22
|xt-xt-1|2>m
通过上述步骤S510~S520,可以计算第一物联网正常数据与物联网数据的差值,并根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据。
步骤S230,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
在本公开的一种示例实施例中,在获取到物联网异常数据后,可以将物联网数据校正为物联网正常数据。具体的,在确定获取到的物联网数据为物联网异常数据时,此时可以表示物联网的数据采集端(如传感器)或物联网数据在传输的过程中发生了错误,此时需要将物联网异常数据校正为物联网正常数据,以保证物联网数据的准确性与连贯性。举例而言,可以将物联网异常数据校正为与物联网数据对应的前一个时间单位的物联网数据,或者,可以获取某一段时间内与该物联网异常数据对应的物联网正常数据,并以这些物联网正常数据的平均值作为校正后的物联网正常数据,或者,可以根据前一日对应时间单位的物联网正常数据作为校正后的物联网正常数据。需要说明的是,本公开对于将物联网异常数据校正为正常数据的方式并不做特殊限定。
在本公开的一种示例实施例中,可以获取物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子,并根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据。参照图6所示,根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据,可以包括以下步骤S610~S620:
步骤S610,获取物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子;其中,第二物联网正常数据为物联网异常数据相邻时间单位区间内的物联网正常数据;
在本公开的一种示例实施例中,可以获取物联网异常数据对应的一个或多个第二物联网正常数据。具体的,第二物联网正常数据可以包括物联网异常数据相邻时间单位区间内的物联网正常数据。举例而言,针对于湿度信息而言,获取到的物联网异常数据为48℃,对应的时间为10:20,此时可以获取物联网异常数据相邻时间单位区间内的物联网正常数据,假设每隔10分钟获取一次温度信息,此时可以确定一个相邻时间单位区间如30分钟,则在相邻时间单位区间内,共采集到了6次物联网正常数据(相对于物联网异常数据前三个时间单位采集了三次,相对于物联网异常数据后三个时间单位采集了三次)。还可以获取异常数据校正因子,具体的,异常数据校正因子可以用于对物联网异常数据进行校正,异常数据校正因子的具体数值可以根据业务场景进行调整。需要说明的是,本公开对于异常数据校正因子的具体形式以及具体数值并不做特殊限定。
步骤S620,根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据。
在本公开的一种示例实施例中,在获取到第二物联网正常数据以及异常数据校正因子之后,可以根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据。具体的,可以将多个第二物联网正常数据分别与异常数据校正因子相乘,再对相乘后的结果进行适应性调整,将调整后的物联网数据作为校正后的物联网正常数据。
通过上述步骤S610~S620,可以获取物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子,并根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据。
在本公开的一种示例实施例中,可以根据第一相关校正因子和第二相关校正因子对第二物联网正常数据进行调整得到第二物联网预测数据,根据第二物联网预测数据将物联网异常数据校正为物联网正常数据。参照图7所示,根据第二物联网预测数据将物联网异常数据校正为物联网正常数据,可以包括以下步骤S710~S720:
步骤S710,根据第一相关校正因子和第二相关校正因子对第二物联网正常数据进行调整得到第二物联网预测数据;其中,第二物联网正常数据包括前相邻时间单位区间的物联网正常数据和后相邻时间单位区间的物联网正常数据;
在本公开的一种示例实施例中,根据第一相关校正因子和第二相关校正因子分别对多个第二物联网正常数据进行调整,并将调整后的结果相加得到第二物联网预测数据。具体的,可以根据第一相关校正因子对物联网异常数据的前相邻时间单位区间的物联网正常数据进行调整,根据第二相关校正因子对物联网异常数据的后相邻时间单位区间的物联网正常数据进行调整,并将调整后的数据相加得到第二物联网预测数据。
举例而言,物联网异常数据对应的时间为11:00,每隔10分钟采集一次物联网数据,假设相邻时间单位区间为30分钟,这个物联网异常数据的前相邻时间单位区间的第二物联网正常数据分别为10:30的物联网正常数据、10:40的物联网正常数据、10:40的物联网正常数据,可以根据第一相关校正因子对10:30的物联网正常数据、10:40的物联网正常数据、10:40的物联网正常数据的数据进行调整,这个物联网异常数据的后相邻时间单位区间的第二物联网正常数据分别为11:10的物联网正常数据、11:20的物联网正常数据、11:30的物联网正常数据,可以根据第二相关校正因子对11:10的物联网正常数据、11:20的物联网正常数据、11:30的物联网正常数据进行调整,并将上述调整后的相加得到第二物联网预测数据。
步骤S720,根据第二物联网预测数据将物联网异常数据校正为物联网正常数据。
在本公开的一种示例实施例中,在通过上述步骤获取到第二物联网预测数据之后,可以根据第二物联网预测数据将物联网异常数据校正为物联网正常数据。具体的,可以对第二物联网预测数据求平均值,将平均之后的数据作为校正后的物联网正常数据。
进一步的,在对第二物联网预测数据求平均值时,需要考虑上述第一相关校正因子和第二相关校正因子的影响。举例而言,第一相关校正因子β取值范围为(0,0.5),第二相关校正因子γ为一个无穷的靠近于1的常数,前相邻时间单位区间的第二物联网正常数据分别为xt-1和xt-2,后相邻时间单位区间的第二物联网正常数据分别为xt+1和xt+2,获取到的物联网异常数据为xt,此时,校正后的物联网正常数据xin的表达式如下:
Figure BDA0003044167620000161
通过上述步骤S710~S720,可以根据第一相关校正因子和第二相关校正因子对第二物联网正常数据进行调整得到第二物联网预测数据,根据第二物联网预测数据将物联网异常数据校正为物联网正常数据。
在本公开的一种示例实施例中,数据分类模型可以包括异常处理长短记忆网络模型,异常处理长短记忆网络模型可以检测输入的物联网数据是否为物联网异常数据,若是物联网异常数据,将物联网异常数据校正为物联网正常数据。异常处理长短记忆网络模型可以包括长短期记忆网络(Long Short-Term Memory,LSTM),LSTM网络包括遗忘门、输入门以及输出门,其中,遗忘门决定什么信息应该被遗忘,输入门表示保存什么信息,输出门决定哪一部分需要被输出。
在本公开的一种示例实施例中,遗忘门用于决定从前一个时间单位的记忆单元丢弃多少信息,可以映射为0到1之间的数值。其中,0表示完全舍弃,1表示完全保留。ft表示遗忘门,它是根据输入的物联网数据xt和前一个时间单位的隐含状态信息ht-1来判断前一个时间单位的记忆单元保留状态,其中σ表示的是sigmod函数,W(f)表示遗忘门的权重矩阵,U(f)表示遗忘门的前一时间单位遗忘门的权重矩阵,在本公开的方案中,物联网正常数据包括将物联网异常数据校正为物联网正常数据xtn以及原来的物联网正常数据xt,此时,遗忘门的表达式如下:
Figure BDA0003044167620000162
在本公开的一种示例实施例中,在获取物联网数据之后,判断物联网数据与第一物联网正常数据的差值的绝对值的平方是否小于等于物联网数据异常阈值,在物联网数据与第一物联网正常数据的差值的绝对值的平方大于物联网数据异常阈值时,表示物联网数据为物联网异常数据,此时可以将物联网异常数据校正为物联网正常数据,并根据校正后的物联网正常数据确定遗忘门,在物联网数据与第一物联网正常数据的差值的绝对值的平方小于等于物联网数据异常阈值时,表示物联网数据为物联网正常数据,可以直接根据物联网正常数据确定遗忘门,最后根据确定的遗忘门对物联网正常数据进行分类。如图8所示,根据确定的遗忘门对物联网正常数据进行分类,可以包括以下步骤S810~S860:步骤S810,获取物联网数据;步骤S820,判断物联网数据是否为物联网正常数据;步骤S830,在物联网数据为物联网异常数据时,将物联网异常数据校正为物联网正常数据;步骤S840,根据校正后的物联网正常数据确定遗忘门;步骤S850,在物联网数据为物联网正常数据时,根据物联网正常数据确定遗忘门;步骤S860,根据确定的遗忘门对物联网正常数据进行分类。
在本公开的一种示例实施例中,可以根据遗忘门与输入门组成更新门,遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元。如图9所示,遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元,可以包括以下步骤S910~S920:
步骤S910,根据遗忘门与输入门组成更新门;
步骤S920,遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元。
在本公开的一种示例实施例中,第一记忆单元为前一个时间单位异常处理长短记忆网络模型生成的记忆单元,临时记忆单元为当前时间单位异常处理长短记忆网络模型生成的记忆单元,第二记忆单元为当前时间单位异常处理长短记忆网络模型生成的记忆单元。具体的,可以将遗忘门与输入门组成更新门,通过更新门控制临时记忆单元,根据遗忘门控制第一记忆单元。举例而言,在异常处理长短记忆网络模型中,遗忘门为ft,临时记忆单元为C′t,第一记忆单元为Ct-1,第二记忆单元Ct的表达式为:
Ct=(1-ft)·C′t+ft·Ct-1
通过上述步骤S910~S920,可以根据遗忘门与输入门组成更新门,遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元。
在本公开的一种示例实施例中,可以获取异常处理长短记忆网络模型的第一隐含状态信息,根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息。参照图10所示,根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息,可以包括以下步骤S1010~S1020:
步骤S1010,获取异常处理长短记忆网络模型的第一隐含状态信息;
步骤S1020,根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息。
在本公开的一种示例实施例中,可以获取异常处理长短记忆网络模型的第一隐含状态信息。第一隐含状态信息为前一个时间单位异常处理长短记忆网络模型生成的隐含状态信息,第二隐含状态信息为当前时间单位异常处理长短记忆网络模型生成的隐含状态信息。具体的,可以根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息,由于在物联网环境中,前一个时间单位的物联网数据和后一个时间单位的物联网数据的差别较小,因此可以增强第一隐含状态信息的作用,使得异常处理长短记忆网络模型对数据分类的准确率更高。例如,第一隐含状态信息为ht-1,第二记忆单元为ct,候选记忆单元为ot,tanh表示激活函数,在需要生成候选记忆单元时需要使用tanh,是一种正曲双切函数,第二隐含状态信息ht的表达式为:
ht=ottanh(ct)+xttanh(ht-1)
通过上述步骤S1010~S1020,可以获取异常处理长短记忆网络模型的第一隐含状态信息,根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息。
在本公开的一种示例实施例中,可以将判断输入的物联网数据是否为物联网异常数据,若是则将物联网异常数据校正为物联网正常数据,将所有的物联网正常数据输入,在异常处理长短记忆网络模型中设置更新门,并且在确定第二隐含状态信息时增大第一隐含状态信息的作用。具体的,异常处理长短记忆网络模型的结构如图11所示。
在本公开的一种示例实施例中,可以将物联网正常数据分为不同的种类保存在数据库中。具体的,物联网正常数据可以包括多个种类,例如温度、湿度、定位、重量、土壤信息等类别。可以按照类别将物联网正常数据存储在对应的数据库中,可以向用户提供物联网正常数据搜索***,方便用户查询物物联网正常数据,如图12所示,是一种物联网正常数据搜索***示意图,可以在物理世界中安装多个传感器,将传感器采集到的物联网数据存储到边缘节点中,再输入异常处理长短记忆网络模型进行分类,按照不同的类别将物联网正常数据输入对应类别的数据库中,用户可以通过情景感知,获取到物联网传感器采集到的物联网数据,并对数据进行分析、统计,建立查询匹配功能,再将查询匹配与搜索引擎链接,还可以对数据库中保存的物联网正常数据进行融合分析,在数据挖掘的基础上构建知识库,这样可以对用户进行个性化推荐与常用功能推荐,并建立索引加快搜索速度,将索引与搜索引擎链接,用户可以通过手机软件或网页前端的搜索引擎进行物联网正常数据的监控与查看。
进一步的,由于物联网数据通常与时间对应,因此,可以采用带有时间戳的InfluxDB数据库存储物联网正常数据。具体的,InfluxDB是开源时间序列数据库,旨在处理较高的写入和查询负载,并提供一种称为InfluxQL的类似于SQL的查询语言,用于与数据进行交互。InfluxDB支持物联网***的原因在于每秒可以进行数百万次的读入,可以满足最大的监控和IoT部署的需求。采用InfluxDB数据库存储物联网正常数据,可以直接利用数据库自带的与时间相关的函数对物联网数据进行处理(如最小、均值、求和等)。
在本示例实施方式所提供的数据分类方法中,获取物联网数据后,可以将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
本公开的实施例,可以将物联网数据中的异常数据校正为正常数据,并对物联网正常数据进行分类。一方面,可以对异常数据进行处理,提升数据分类的准确率,避免直接对异常数据进行分类存储,从而导致用户查询到异常数据,进而造成用户体验下降的问题;另一方面,对异常数据进行校正,而不是直接将物联网异常数据剔除,可以保证物联网数据的连续性,从而提高用户的产品信任度,进而增强用户的购买信心。
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
此外,在本公开的示例性实施方式中,还提供了一种数据分类装置。参照图13所示,一种数据分类装置1300包括:物联网数据获取模块1310,异常数据监测模块1320、物联网数据分类模块1330。
其中,物联网数据获取模块,用于获取物联网数据;其中,物联网数据包括物联网正常数据与物联网异常数据;异常数据监测模块,用于将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据;物联网数据分类模块,用于将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
在本公开的一种示例性实施例中,基于前述方案,检测物联网数据中的物联网异常数据,装置包括:第一物联网正常数据获取单元,用于获取物联网数据对应的第一物联网正常数据;其中,第一物联网正常数据为物联网数据的前一个时间单位的物联网正常数据;异常数据检测单元,用于根据第一物联网正常数据检测物联网数据中的物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,根据第一物联网正常数据检测物联网数据中的物联网异常数据,装置包括:物联网数据异常阈值获取单元,用于获取物联网数据异常阈值;异常阈值检测单元,用于根据第一物联网正常数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,根据第一物联网正常数据以及物联网数据异常阈值检测物联网数据中的物联网异常数据,装置包括:差值计算单元,用于计算第一物联网正常数据与物联网数据的差值;异常数据确定单元,用于根据差值与物联网数据异常阈值的大小关系确定物联网数据是否为物联网异常数据。
在本公开的一种示例性实施例中,基于前述方案,将物联网异常数据校正为物联网正常数据,装置包括:第二物联网正常数据获取单元,用于获取物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子;其中,第二物联网正常数据为物联网异常数据相邻时间单位区间内的物联网正常数据;第一异常数据校正单元,用于根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据。
在本公开的一种示例性实施例中,基于前述方案,异常数据校正因子包括第一相关校正因子和第二相关校正因子,根据第二物联网正常数据以及异常数据校正因子将物联网异常数据校正为物联网正常数据,装置包括:第二物联网预测数据获取单元,用于根据第一相关校正因子和第二相关校正因子对第二物联网正常数据进行调整得到第二物联网预测数据;其中,第二物联网正常数据包括前相邻时间单位区间的物联网正常数据和后相邻时间单位区间的物联网正常数据;第二异常数据校正单元,用于根据第二物联网预测数据将物联网异常数据校正为物联网正常数据。
在本公开的一种示例性实施例中,基于前述方案,数据分类模型包括异常处理长短记忆网络模型。
在本公开的一种示例性实施例中,基于前述方案,异常处理长短记忆网络模型包括遗忘门与输入门,装置还包括:更新门确定单元,用于根据遗忘门与输入门组成更新门;第二记忆单元确定单元,用于遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元;其中,第一记忆单元为前一个时间单位异常处理长短记忆网络模型生成的记忆单元;临时记忆单元为当前时间单位异常处理长短记忆网络模型生成的记忆单元;第二记忆单元为当前时间单位异常处理长短记忆网络模型生成的记忆单元。
在本公开的一种示例性实施例中,基于前述方案,装置还包括:第一隐含状态信息获取单元,用于获取异常处理长短记忆网络模型的第一隐含状态信息;第二隐含状态信息确定单元,用于根据第一隐含状态信息与第二记忆单元确定第二隐含状态信息;其中,第一隐含状态信息为前一个时间单位异常处理长短记忆网络模型生成的隐含状态信息;第二隐含状态信息为当前时间单位异常处理长短记忆网络模型生成的隐含状态信息。
由于本公开的示例实施例的数据分类装置的各个功能模块与上述数据分类方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的数据分类方法的实施例。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述数据分类方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为***、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“***”。
下面参照图14来描述根据本公开的这种实施例的电子设备1400。图14显示的电子设备1400仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图14所示,电子设备1400以通用计算设备的形式表现。电子设备1400的组件可以包括但不限于:上述至少一个处理单元1410、上述至少一个存储单元1420、连接不同***组件(包括存储单元1420和处理单元1410)的总线1430、显示单元1440。
其中,存储单元存储有程序代码,程序代码可以被处理单元1410执行,使得处理单元1410执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,处理单元1410可以执行如图2中所示的步骤S210,获取物联网数据,其中,物联网数据包括物联网正常数据与物联网异常数据;步骤S220,将物联网数据输入数据分类模型,检测物联网数据中的物联网异常数据;步骤S230,将物联网异常数据校正为物联网正常数据,并根据数据分类模型对物联网正常数据进行分类。
又如,电子设备可以实现如图2所示的各个步骤。
存储单元1420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1421和/或高速缓存存储单元1422,还可以进一步包括只读存储单元(ROM)1423。
存储单元1420还可以包括具有一组(至少一个)程序模块1425的程序/实用工具1424,这样的程序模块1425包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1400也可以与一个或多个外部设备1470(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1400交互的设备通信,和/或与使得该电子设备1400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1450进行。并且,电子设备1400还可以通过网络适配器1460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1460通过总线1430与电子设备1400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (12)

1.一种数据分类方法,其特征在于,包括:
获取物联网数据,其中,所述物联网数据包括物联网正常数据与物联网异常数据;
将所述物联网数据输入数据分类模型,检测所述物联网数据中的物联网异常数据;
将所述物联网异常数据校正为物联网正常数据,并根据所述数据分类模型对所述物联网正常数据进行分类。
2.根据权利要求1所述的方法,其特征在于,所述检测所述物联网数据中的物联网异常数据,包括:
获取所述物联网数据对应的第一物联网正常数据;其中,第一物联网正常数据为所述物联网数据的前一个时间单位的物联网正常数据;
根据所述第一物联网正常数据检测所述物联网数据中的物联网异常数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一物联网正常数据检测所述物联网数据中的物联网异常数据,包括:
获取物联网数据异常阈值;
根据所述第一物联网正常数据以及所述物联网数据异常阈值检测所述物联网数据中的物联网异常数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一物联网正常数据以及所述物联网数据异常阈值检测所述物联网数据中的物联网异常数据,包括:
计算所述第一物联网正常数据与所述物联网数据的差值;
根据所述差值与所述物联网数据异常阈值的大小关系确定所述物联网数据是否为物联网异常数据。
5.根据权利要求1所述的方法,其特征在于,所述将所述物联网异常数据校正为物联网正常数据,包括:
获取所述物联网异常数据对应的一个或多个第二物联网正常数据,并获取异常数据校正因子;其中,所述第二物联网正常数据为所述物联网异常数据相邻时间单位区间内的物联网正常数据;
根据所述第二物联网正常数据以及所述异常数据校正因子将所述物联网异常数据校正为物联网正常数据。
6.根据权利要求5所述的方法,其特征在于,所述异常数据校正因子包括第一相关校正因子和第二相关校正因子,所述根据所述第二物联网正常数据以及所述异常数据校正因子将所述物联网异常数据校正为物联网正常数据,包括:
根据所述第一相关校正因子和第二相关校正因子对所述第二物联网正常数据进行调整得到第二物联网预测数据;其中,所述第二物联网正常数据包括前相邻时间单位区间的物联网正常数据和后相邻时间单位区间的物联网正常数据;
根据所述第二物联网预测数据将所述物联网异常数据校正为物联网正常数据。
7.根据权利要求1所述的方法,其特征在于,所述数据分类模型包括异常处理长短记忆网络模型。
8.根据权利要求7所述的方法,其特征在于,所述异常处理长短记忆网络模型包括遗忘门与输入门,所述方法还包括:
根据所述遗忘门与输入门组成更新门;
所述遗忘门与更新门分别控制临时记忆单元与第一记忆单元以确定第二记忆单元;
其中,所述第一记忆单元为前一个时间单位所述异常处理长短记忆网络模型生成的记忆单元;所述临时记忆单元为当前时间单位所述异常处理长短记忆网络模型生成的记忆单元;所述第二记忆单元为当前时间单位所述异常处理长短记忆网络模型生成的记忆单元。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获取所述异常处理长短记忆网络模型的第一隐含状态信息;
根据所述第一隐含状态信息与所述第二记忆单元确定第二隐含状态信息;
其中,所述第一隐含状态信息为前一个时间单位所述异常处理长短记忆网络模型生成的隐含状态信息;所述第二隐含状态信息为当前时间单位所述异常处理长短记忆网络模型生成的隐含状态信息。
10.一种数据分类装置,其特征在于,所述装置包括:
物联网数据获取模块,用于获取物联网数据;其中,所述物联网数据包括物联网正常数据与物联网异常数据;
异常数据监测模块,用于将所述物联网数据输入数据分类模型,检测所述物联网数据中的物联网异常数据;
物联网数据分类模块,用于将所述物联网异常数据校正为物联网正常数据,并根据所述数据分类模型对所述物联网正常数据进行分类。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~9中任一项所述的方法。
12.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1~9中任一项所述的方法。
CN202110468156.2A 2021-04-28 2021-04-28 数据分类方法、数据分类装置、介质及电子设备 Pending CN113139817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110468156.2A CN113139817A (zh) 2021-04-28 2021-04-28 数据分类方法、数据分类装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110468156.2A CN113139817A (zh) 2021-04-28 2021-04-28 数据分类方法、数据分类装置、介质及电子设备

Publications (1)

Publication Number Publication Date
CN113139817A true CN113139817A (zh) 2021-07-20

Family

ID=76816304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110468156.2A Pending CN113139817A (zh) 2021-04-28 2021-04-28 数据分类方法、数据分类装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN113139817A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118075782A (zh) * 2024-04-17 2024-05-24 沈阳松陵三航机械制造有限公司 基于ai驱动的5g物联网数据处理***

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109379228A (zh) * 2018-11-02 2019-02-22 平安科技(深圳)有限公司 误告警信息识别方法及装置、存储介质、电子终端
CN109753049A (zh) * 2018-12-21 2019-05-14 国网江苏省电力有限公司南京供电分公司 一种源网荷互动工控***的异常指令检测方法
CN109947079A (zh) * 2019-03-20 2019-06-28 阿里巴巴集团控股有限公司 基于边缘计算的区域异常检测方法和边缘计算设备
CN110377447A (zh) * 2019-07-17 2019-10-25 腾讯科技(深圳)有限公司 一种异常数据检测方法、装置及服务器
CN110375787A (zh) * 2019-07-25 2019-10-25 重庆市计量质量检测研究院 一种计量仪表运行状态在线评价方法
CN110457550A (zh) * 2019-07-05 2019-11-15 中国地质大学(武汉) 一种烧结过程中异常运行数据的校正方法
CN110505196A (zh) * 2019-07-02 2019-11-26 中国联合网络通信集团有限公司 物联网卡异常检测方法及装置
CN111143102A (zh) * 2019-12-13 2020-05-12 东软集团股份有限公司 异常数据检测方法、装置、存储介质及电子设备
CN111476212A (zh) * 2020-05-18 2020-07-31 哈尔滨理工大学 一种基于长短时记忆法的电机故障检测***
CN111767930A (zh) * 2019-04-01 2020-10-13 北京百度网讯科技有限公司 物联网时序数据异常检测方法及其相关设备
CN112085384A (zh) * 2020-09-08 2020-12-15 华侨大学 一种基于模糊推理与lstm结合的邮寄物风险评价方法与***
CN112202736A (zh) * 2020-09-15 2021-01-08 浙江大学 基于统计学习和深度学习的工业控制***通信网络异常分类方法
CN112270434A (zh) * 2020-10-22 2021-01-26 国网山西省电力公司电力科学研究院 一种风光一体化功率预测方法
CN112373253A (zh) * 2020-04-26 2021-02-19 青岛慧拓智能机器有限公司 一种无人车爆胎、欠压自动检测***和方法
CN112396225A (zh) * 2020-11-13 2021-02-23 浙江电力交易中心有限公司 一种基于长短期记忆网络的短期电价预测方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109379228A (zh) * 2018-11-02 2019-02-22 平安科技(深圳)有限公司 误告警信息识别方法及装置、存储介质、电子终端
CN109753049A (zh) * 2018-12-21 2019-05-14 国网江苏省电力有限公司南京供电分公司 一种源网荷互动工控***的异常指令检测方法
CN109947079A (zh) * 2019-03-20 2019-06-28 阿里巴巴集团控股有限公司 基于边缘计算的区域异常检测方法和边缘计算设备
CN111767930A (zh) * 2019-04-01 2020-10-13 北京百度网讯科技有限公司 物联网时序数据异常检测方法及其相关设备
CN110505196A (zh) * 2019-07-02 2019-11-26 中国联合网络通信集团有限公司 物联网卡异常检测方法及装置
CN110457550A (zh) * 2019-07-05 2019-11-15 中国地质大学(武汉) 一种烧结过程中异常运行数据的校正方法
CN110377447A (zh) * 2019-07-17 2019-10-25 腾讯科技(深圳)有限公司 一种异常数据检测方法、装置及服务器
CN110375787A (zh) * 2019-07-25 2019-10-25 重庆市计量质量检测研究院 一种计量仪表运行状态在线评价方法
CN111143102A (zh) * 2019-12-13 2020-05-12 东软集团股份有限公司 异常数据检测方法、装置、存储介质及电子设备
CN112373253A (zh) * 2020-04-26 2021-02-19 青岛慧拓智能机器有限公司 一种无人车爆胎、欠压自动检测***和方法
CN111476212A (zh) * 2020-05-18 2020-07-31 哈尔滨理工大学 一种基于长短时记忆法的电机故障检测***
CN112085384A (zh) * 2020-09-08 2020-12-15 华侨大学 一种基于模糊推理与lstm结合的邮寄物风险评价方法与***
CN112202736A (zh) * 2020-09-15 2021-01-08 浙江大学 基于统计学习和深度学习的工业控制***通信网络异常分类方法
CN112270434A (zh) * 2020-10-22 2021-01-26 国网山西省电力公司电力科学研究院 一种风光一体化功率预测方法
CN112396225A (zh) * 2020-11-13 2021-02-23 浙江电力交易中心有限公司 一种基于长短期记忆网络的短期电价预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周建华;吕鹏远;王春;: "一种适用于海上风机监测数据实时处理的方法研究", 中国水利水电科学研究院学报, no. 04 *
张晶晶;黄浩;胡英;吾守尔・斯拉木;: "循环神经网络中基于特征融合的口语理解", 现代电子技术, no. 20 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118075782A (zh) * 2024-04-17 2024-05-24 沈阳松陵三航机械制造有限公司 基于ai驱动的5g物联网数据处理***

Similar Documents

Publication Publication Date Title
US11449712B2 (en) Anomaly detection and reporting for machine learning models
US10915602B2 (en) Automatic detection of outliers in multivariate data
US20200380309A1 (en) Method and System of Correcting Data Imbalance in a Dataset Used in Machine-Learning
US20160132904A1 (en) Influence score of a brand
US9141966B2 (en) Opinion aggregation system
JP2019519027A (ja) 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨
US20210073627A1 (en) Detection of machine learning model degradation
JP2023514465A (ja) 機械学習プラットフォーム
US11621892B2 (en) Temporal-based network embedding and prediction
US20210081386A1 (en) Insights for multi-dimensional planning data
US20220222688A1 (en) Methodology of analyzing consumer intent from user interaction with digital environments
CN113139817A (zh) 数据分类方法、数据分类装置、介质及电子设备
US10503575B2 (en) Computer systems monitoring using beat frequency analysis
US20230259569A1 (en) Systems and methods for automatic and adaptive browser bookmarks
US20190065987A1 (en) Capturing knowledge coverage of machine learning models
KR20190061317A (ko) 주식 정보 제공 방법
CN111767290B (zh) 用于更新用户画像的方法和装置
CN113094584A (zh) 推荐学习资源的确定方法和装置
CN112148976A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN113159877A (zh) 数据处理方法、装置、***、计算机可读存储介质
US11669424B2 (en) System and apparatus for automated evaluation of compatibility of data structures and user devices based on explicit user feedback
US11907508B1 (en) Content analytics as part of content creation
US11830081B2 (en) Automated return evaluation with anomoly detection
US11973657B2 (en) Enterprise management system using artificial intelligence and machine learning for technology analysis and integration
US11836656B2 (en) Cognitive enabled blockchain based resource prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination