CN107704594B - 基于SparkStreaming的电力***日志数据实时处理方法 - Google Patents

基于SparkStreaming的电力***日志数据实时处理方法 Download PDF

Info

Publication number
CN107704594B
CN107704594B CN201710951969.0A CN201710951969A CN107704594B CN 107704594 B CN107704594 B CN 107704594B CN 201710951969 A CN201710951969 A CN 201710951969A CN 107704594 B CN107704594 B CN 107704594B
Authority
CN
China
Prior art keywords
time
batch
interval
block interval
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710951969.0A
Other languages
English (en)
Other versions
CN107704594A (zh
Inventor
宋爱波
涂金林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201710951969.0A priority Critical patent/CN107704594B/zh
Publication of CN107704594A publication Critical patent/CN107704594A/zh
Application granted granted Critical
Publication of CN107704594B publication Critical patent/CN107704594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Spark Streaming的电力***日志数据实时处理方法,首先针对全网日志数据流急剧增长,处理***获取的日志数据的类别以及相关属性变化多样的问题,预定义统计模型,降低处理***预处理的时间;然后通过对块间隔和处理时间关系的分析,发现基于块间隔的动态调整,能够使查询任务的处理时间达到最优;最后基于该方法设计了高效的动态调整策略,及时探寻到最优的块间隔,减少查询任务的处理时间,借此分析电力调度自动化***的运行状态和轨迹,实现电力***健康状况定性到定量的分析转换。本发明从而为电力***日志数据的有效管理提供了一种高效、易用的实时处理方法。

Description

基于SparkStreaming的电力***日志数据实时处理方法
技术领域
本发明涉及一种电力***日志数据实时处理方法,尤其涉及一种基于SparkStreaming的电力***日志数据实时处理方法。
背景技术
电力是现代化社会运转和发展的基础产业,电力***的安全和稳定关系到人类社会生活的方方面面。电力调度自动化***作为一种数据处理***,其包含电力***运行信息、分析决策工具和控制手段。电力调度自动化***在运行过程中会产生状态、调试、错误等数据,这类数据统称为日志数据。日志数据作为电力***运行信息的一种表现形式,对其进行快速、准确的分析,对于电力***安全稳定运行具有重要的保障作用。
随着调度自动化***规模的不断扩大,电力***需要实时处理的日志数据量急剧增加。面对全网实时日志数据呈现出大数据量,增长迅速的特点,对其计算、分析、仿真以及优化等需求远远超过普通计算***的承受能力,传统的日志管理手段已无法满足海量日志数据的管理和分析需求。早先的流式处理***通过丢弃一部分输入数据流(例如分级卸载),选择具有鲜明特点的数据进行处理,或者通过灵活的增加额外的资源。但通常来说,丢弃数据不是一个很好的选择,很有可能丢弃的数据非常重要,因而影响结果的正确性;而且对于高吞吐率的实时数据流,预先的获取相关资源,这种代价是巨大的。
为了确定***运行的趋势和模式、查明故障等,分析电力调度自动化***的运行状态和轨迹,需要做到在线实时分析。受到磁盘性能的影响,日志数据未能及时处理导致数据丢失,必须借助内存的快速处理能力。同时,面对***资源和状态的不断变化,处理***要能够及时的做出调整,确保***的处理时间达到最优。
针对以上问题,研究者们开始关注如何利用内存资源突破I/O瓶颈,提高数据吞吐率,加快数据的处理速度。Apache Spark就是其中脱颖而出的开源计算框架。Spark基于内存的迭代计算框架能够在内存中多次操作特定数据集,实现大数据的快速分析处理。SparkStreaming作为其上层工具,提供基于间隔的实时处理功能。数据流划分成若干数据块的时间称为块间隔,若干数据块组合成一个批次的时间称为批间隔。这种方式能够很好的满足电力调度自动化***对某个时间段内数据的实时处理需求。
一般情况下,如果Spark Streaming处理数据的并行度(一个批次中包含数据块的数量=批间隔/块间隔)越低,那么资源的开销和利用率将会越小,例如任务的创建、交互等。而大规模的并行计算将会导致大量的资源开销,同时伴随着极高的资源利用率。为了及时的了解电力调度自动化***的运行状态和轨迹,实现电力***健康状况定性到定量的分析转换,这就需要确保查询任务能够达到较低的资源开销和更高的资源利用率。为了权衡资源的开销和利用率,在面对不同的***状态和资源变化时,处理的并行度需要及时调整。
近些年来,实时数据流的处理需求促进了分布式实时计算框架的发展。例如:文献“High-Throughput Robust Architecture for Log Analysis and Data Stream Mining”采用Apache Storm作为实时计算框架,接收实时数据然后进行分析。Spark Streaming作为Spark的上层高级工具,与Storm***不同的是:Spark Streaming不是一条记录接着一条记录的处理数据流,而是按照时间间隔预先将数据流划分成多个时间段的批作业进行处理。Storm是基于事件级别的实时计算框架,电力调度自动化***更多的是对某个时间段内的数据流有状态批处理的计算分析。而且Storm对于每条记录至少会处理一次,当节点从错误中恢复过来,记录会重新计算,这就不满足电力调度自动化***安全可靠的需求。
通过动态调整批间隔或者动态调整数据块大小,确实能够保证在没有预先了解数据流状态和运行环境的情况下,***可以稳定的运行。然而这些方式关注更多的在于数据的读写吞吐率和资源利用率。而且对于复杂计算,动态调整也未能选择更优的批间隔或数据块大小,导致处理时间越来越长,完全忽视了调度自动化***快速处理的需求。
发明内容
发明目的:针对以上问题,本发明提出一种基于Spark Streaming的电力***日志数据实时处理方法。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于SparkStreaming的电力***日志数据实时处理方法,包括以下步骤:
(1)定义不同日志类别的统计模型;
(2)构建Spark Streaming块间隔与数据流处理时间的关系模型;
(3)动态调整块间隔,探寻最优块间隔。
进一步地,所述步骤(1)中,统计模型包括元素:数据集、结果集、分组条件、分组过滤器和规则动作。
进一步地,所述步骤(2)中,将数据流划分成若干数据块的时间,即块间隔;若干数据块组合成一个批次的时间,即批间隔。
关系模型构建步骤:
(1)分批模块将接收的数据流根据块间隔划分成独立的数据块;
(2)将一个批间隔时间内的数据块包裹成一个批次,进入批队列中排队等待被处理;
(3)一个批间隔时间内的所有块间隔的数据并行处理。
进一步地,所述步骤(3)中,给定批间隔,利用贪心算法,动态调整块间隔,探寻最优块间隔。
所述贪心算法步骤为:
(1)初始块间隔表示为β,调整步长为i;
(2)如果块间隔为β的批处理时间小于块间隔为β+i的批处理时间,则最优的块间隔在初始块间隔的左侧;如果块间隔为β的批处理时间小于块间隔为β-i的批处理时间,则最优的块间隔在初始块间隔的右侧;
(3)当探寻到最优块间隔的方向,继续循环探索,直到处理时间不能再次减小。
有益效果:本方法综合考虑电力***日志数据的特点,面对***资源和状态的不断变化,处理***无需根据数据流的变化重新定义统计函数和模型,并能够快速及时的动态调整,从而达到较高的资源利用率和更短的处理时间。
附图说明
图1是块间隔示意图;
图2是块间隔对处理时间的影响曲线图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
本发明针对现有的实时计算框架处理日志数据流存在的不足,综合考虑块间隔和数据流处理时间的关系,提出一种基于Spark Streaming的电力***日志数据实时处理方法,旨在保证Spark Streaming块间隔能够随着***资源和状态的不断变化而动态调整,加快实时数据流的处理速度,借此分析电力调度自动化***的运行状态和轨迹,实现电力***健康状况定性到定量的分析转换。
本发明首先针对全网日志数据流急剧增长,处理***获取的日志数据的类别以及相关属性变化多样的问题,预先对不同的日志类别定义统计模型,从而降低处理***预处理的时间;然后通过对处理***块间隔和处理时间关系的分析,发现基于块间隔的动态调整能够有效地降低***的处理时间;最后基于上述分析,设计了基于贪心算法的动态调整策略,及时探寻到最优的块间隔,加快日志数据流的处理速度,减少查询任务的处理时间。
基于Spark Streaming的电力***日志数据实时处理方法,包括以下步骤:
步骤1:定义不同日志类别的统计模型,根据统计模型,快速实时分析;
当处理***获取的日志数据的类别以及相关属性不断变化,预先针对不同日志类别处理分析时的各个字段,定义统计模型,降低处理***预处理的时间。
统计模型描述的是在一个实时分析过程中,需要的各个元素的集合。按照结构化查询语言中SELECT的语句格式,一个统计模型需要包含如下元素:
(1)数据集:相当于FROM和WHERE子句。在数据集中,需要指明订阅的日志类别、统计的时间窗口等,对于属于某类别的日志数据如果需要进一步筛选,则支持基于布局元素的逻辑表达式。
(2)结果集:相当于SELECT子句。在结果集中,需要指明当前分析过程中最终将产生的结果字段,主要包括布局元素和统计字段。统计字段支持多个的统计函数:COUNT、SUM、MAX、MIN、TOP(N)、ASSERT。
(3)分组条件:相当于GROUP BY子句。分组条件只能包含在结果集中定义的字段。
(4)分组过滤器:分组过滤器只能包含结果集中的统计字段,对于数字型的元素支持的操作符有:=、>、>=、<、<=、!=,字符型的元素支持的操作符有:EQUAL、CONTAIN、BEGINWITH、ENDWITH。
(5)规则动作:根据结果集的内容匹配规则:入库、告警。入库是指将计算结果存储到外部***中;告警是指为统计操作的结果设置一个阈值,当结果超出阈值时,发送告警信息。
分析目标与统计模型示例如表1所示:
表1
Figure BDA0001433060500000041
步骤2:构建Spark Streaming块间隔与数据流处理时间的关系模型;
分析Spark Streaming块间隔与数据流处理时间的关系,探寻使数据流处理时间达到最小的块间隔的条件。
如图1所示,图中的分批模块即为Spark Streaming的分批模块,其作用是将接收的数据流划分成多个批次,然后对每个批次分别处理。分批模块形成一个批次,需要两个重要的参数:块间隔和批间隔。数据流划分成若干数据块的时间称为块间隔,若干数据块组合成一个批次的时间称为批间隔。
因此,分批模块将接收到的数据流首先根据块间隔(块间隔<批间隔)划分成各个独立的数据块,然后经过一个批间隔的时间,这段时间内的所有的数据块会包裹成一个批次,最后这个批次进入批队列中排队等待被处理。
从中可以看出,批次的执行并行度是由批间隔/块间隔(batch interval/blockinterval)决定,表示一个批次中数据块的个数。在同等资源分配下,如果处理的并行度越低,那么资源的开销和利用率将会越小,比如任务的创建、交互等;而大规模的并行计算则会导致大量的资源开销,同时伴随着极高的资源利用率。为了权衡资源的开销和利用率,在面对不同的***状态和资源变化时,处理的并行度需要及时调整。了解电力调度自动化***的运行状态和轨迹,实现电力***健康状况定性到定量的分析转换,意味着批间隔需要保持相对恒定。因此,处理***的执行并行度主要受到块间隔的影响。
根据以上分析,块间隔决定了处理***的执行并行度,同时也就影响到***的处理性能。如图2所示,Reduce工作流的批间隔恒定在3秒,而Join工作流的批间隔恒定在1秒,分别在2MB/S和4MB/S的数据流接收速率下,块间隔对处理时间的影响。可以看出,不同的数据流接收速率,得到的曲线近似于抛物线,那么使处理时间达到最小的最优块间隔就是抛物线的顶点。事实上,受到操作环境的变化以及噪音的干扰等,块间隔和处理时间的关系并非是真正意义上的抛物线。但有一点不用怀疑,最优的块间隔一定随着数据接收速率的变化而变化,因为数据接收速率越快,块间隔中的数据越多;数据接收速率越慢,块间隔中的数据越少,数据的多少将直接影响处理***的处理时间。
基于以上观察,对于一个给定的批间隔,就可以通过调整块间隔的大小,使查询任务的处理时间达到最优。
步骤3:在日志数据流实时分析时,根据步骤2中的关系模型,利用SparkStreaming块间隔的动态调整,减少查询任务的处理时间。
根据数据流处理时间达到最小的块间隔的条件,通过贪心的方法,及时探寻到最优的块间隔;并且根据处理***资源和状态的不断变化而动态调整,减少查询任务的处理时间。
本发明的优化目标是保证处理***每处理完一个批次,下一批数据接收的块间隔已经决定好了。图2中可以看出,如果选定的初始块间隔过小或者过大,探索最优块间隔的时间将会很长。折中的方案则是选择块间隔/2作为初始的块间隔,而不用频繁的探索,然后通过逐渐增加或者减小块间隔,直到处理时间不能再次减小。
表2给出了计算下一个块间隔的算法。初始块间隔表示为β,调整步长为i,计算过程中,β则表示下一个块间隔。P1和P2表示前两个批次的处理时间。
基于贪心算法的动态调整策略如表2所示:
表2
Figure BDA0001433060500000051
Figure BDA0001433060500000061
计算过程主要包括两个部分:如果块间隔为β的批处理时间小于块间隔为β+i的批处理时间,则最优的块间隔在初始块间隔的左侧;如果块间隔为β的批处理时间小于块间隔为β-i的批处理时间,则最优的块间隔在初始块间隔的右侧。当探寻到最优块间隔的方向,继续循环探索,直到处理时间不能再次减小。
如果数据接收速率以及***运行环境保持不变,那么最优的块间隔将保持稳定。但是当运行环境发生变化时,那么最优的块间隔将发生变化,此时正确的算法需要及时做出调整来适应最新的环境。然而从头开始将会延长收敛的时间,因此本发明选择运行环境变化前的块间隔作为初始块间隔,重新开始贪心调整。

Claims (2)

1.一种基于Spark Streaming的电力***日志数据实时处理方法,其特征在于:包括以下步骤:
(1)定义不同日志类别的统计模型,统计模型包括元素:数据集、结果集、分组条件、分组过滤器和规则动作;
(2)构建Spark Streaming块间隔与数据流处理时间的关系模型,将数据流划分成若干数据块的时间,即块间隔;若干数据块组合成一个批次的时间,即批间隔;
(3)给定批间隔,利用贪心算法,动态调整块间隔,探寻最优块间隔;
所述贪心算法步骤为:
(3.1)初始块间隔表示为β,调整步长为i;
(3.2)如果块间隔为β的批处理时间小于块间隔为β+i的批处理时间,则最优的块间隔在初始块间隔的左侧;如果块间隔为β的批处理时间小于块间隔为β-i的批处理时间,则最优的块间隔在初始块间隔的右侧;
(3.3)当探寻到最优块间隔的方向,继续循环探索,直到处理时间不能再次减小。
2.根据权利要求1所述的基于Spark Streaming的电力***日志数据实时处理方法,其特征在于:所述步骤(2)中关系模型构建步骤:
(2.1)分批模块将接收的数据流根据块间隔划分成独立的数据块;
(2.2)将一个批间隔时间内的数据块包裹成一个批次,进入批队列中排队等待被处理;
(2.3)一个批间隔时间内的所有块间隔的数据并行处理。
CN201710951969.0A 2017-10-13 2017-10-13 基于SparkStreaming的电力***日志数据实时处理方法 Active CN107704594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710951969.0A CN107704594B (zh) 2017-10-13 2017-10-13 基于SparkStreaming的电力***日志数据实时处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710951969.0A CN107704594B (zh) 2017-10-13 2017-10-13 基于SparkStreaming的电力***日志数据实时处理方法

Publications (2)

Publication Number Publication Date
CN107704594A CN107704594A (zh) 2018-02-16
CN107704594B true CN107704594B (zh) 2021-02-09

Family

ID=61183445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710951969.0A Active CN107704594B (zh) 2017-10-13 2017-10-13 基于SparkStreaming的电力***日志数据实时处理方法

Country Status (1)

Country Link
CN (1) CN107704594B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109831316A (zh) * 2018-12-17 2019-05-31 国网浙江省电力有限公司 海量日志实时分析***、实时分析方法及可读存储介质
CN112632020B (zh) * 2020-12-25 2022-03-18 中国电子科技集团公司第三十研究所 基于spark大数据平台的日志信息类型提取方法、挖掘方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616205A (zh) * 2014-11-24 2015-05-13 北京科东电力控制***有限责任公司 一种基于分布式日志分析的电力***运行状态监视方法
CN105005585A (zh) * 2015-06-24 2015-10-28 上海卓悠网络科技有限公司 一种日志数据的处理方法和装置
CN105677489A (zh) * 2016-03-04 2016-06-15 山东大学 离散流处理模型下批次间隔大小的动态设置***及方法
CN106168909A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 一种日志的处理方法和装置
CN106227832A (zh) * 2016-07-26 2016-12-14 浪潮软件股份有限公司 互联网大数据技术架构在企业内业务分析中的应用方法
CN106778033A (zh) * 2017-01-10 2017-05-31 南京邮电大学 一种基于Spark平台的Spark Streaming异常温度数据报警方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2358266A4 (en) * 2008-11-20 2012-10-03 Bodymedia Inc METHOD AND APPARATUS FOR DETERMINING CRITICAL CARE PARAMETERS
US8826218B2 (en) * 2012-07-30 2014-09-02 Synopsys, Inc. Accurate approximation of the objective function for solving the gate-sizing problem using a numerical solver
WO2015149885A1 (en) * 2014-04-01 2015-10-08 Huawei Technologies Co.,Ltd Method for querying and updating entries in a data base
US9699205B2 (en) * 2015-08-31 2017-07-04 Splunk Inc. Network security system
CN105868019B (zh) * 2016-02-01 2019-05-21 中国科学院大学 一种Spark平台性能自动优化方法
CN106547854B (zh) * 2016-10-20 2020-12-15 天津大学 基于贪心萤火虫算法的分布式文件***存储优化节能方法
CN106599182B (zh) * 2016-12-13 2019-10-11 飞狐信息技术(天津)有限公司 基于spark streaming实时流的特征工程推荐方法及装置、视频网站
CN106936812B (zh) * 2017-01-10 2019-12-20 南京邮电大学 一种云环境下基于Petri网的文件隐私泄露检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616205A (zh) * 2014-11-24 2015-05-13 北京科东电力控制***有限责任公司 一种基于分布式日志分析的电力***运行状态监视方法
CN105005585A (zh) * 2015-06-24 2015-10-28 上海卓悠网络科技有限公司 一种日志数据的处理方法和装置
CN105677489A (zh) * 2016-03-04 2016-06-15 山东大学 离散流处理模型下批次间隔大小的动态设置***及方法
CN106168909A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 一种日志的处理方法和装置
CN106227832A (zh) * 2016-07-26 2016-12-14 浪潮软件股份有限公司 互联网大数据技术架构在企业内业务分析中的应用方法
CN106778033A (zh) * 2017-01-10 2017-05-31 南京邮电大学 一种基于Spark平台的Spark Streaming异常温度数据报警方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Faster Stateful Stream Processing in Apache Spark Streaming;weiqing687;《https://blog.csdn.net/qq_26222859/article/details/54836445》;20170202;1-4页 *
Spark Streaming场景应用- Spark Streaming计算模型及监控;javastart;《https://blog.csdn.net/javastart/article/details/77510886》;20170823;1-4页 *
Spark Streaming性能调优详解Spark;w397090770;《https://www.iteblog.com/archives/1333.html》;20150428;1-3页 *
基于ELK Stack和Spark Streaming的日志处理平台设计与实现;村里的intern;《https://blog.csdn.net/bigstar863/article/details/49099531》;20151013;1-7页 *
基于Spark大数据平台日志审计***的设计与实现;张彬;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160415(第4期);I138-360页 *
基于Spark的电力***日志数据的分析处理;涂金林;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20180415(第4期);C042-741页 *

Also Published As

Publication number Publication date
CN107704594A (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
CN106648904B (zh) 一种流式数据处理自适应速率控制方法
CN106844161B (zh) 一种带状态流计算***中的异常监控及预测方法和***
US9256640B2 (en) Streaming delay patterns in a streaming environment
US9092270B2 (en) Method of SOA performance tuning
US20230146912A1 (en) Method, Apparatus, and Computing Device for Constructing Prediction Model, and Storage Medium
US20070143246A1 (en) Method and apparatus for analyzing the effect of different execution parameters on the performance of a database query
CN103345514A (zh) 大数据环境下的流式数据处理方法
WO2023011236A1 (zh) 一种程序源码的编译优化方法及相关产品
CN107704594B (zh) 基于SparkStreaming的电力***日志数据实时处理方法
CN111556057A (zh) 一种流量异常检测方法、装置、电子设备及存储介质
WO2021169271A1 (zh) 雷雨天气预测模型的训练方法及雷雨天气预测方法
CN103559300A (zh) 数据的查询方法和查询装置
CN112631754A (zh) 数据处理方法、装置、存储介质及电子装置
CN110413927B (zh) 在发布订阅***中基于匹配实时性的优化方法及***
CN114185885A (zh) 一种基于列存数据库的流式数据处理方法及***
CN114157731A (zh) 一种基于FHP-trie树和动态优先级调度的FC-AE协议解析仪
CN117687884A (zh) 一种电网调度自动化主站运维操作票智能优化方法及***
CN113360576A (zh) 一种基于Flink Streaming的电网海量数据实时处理方法及装置
CN116501805A (zh) 一种流数据***、计算机设备及介质
CN111930484A (zh) 一种电网信息通信服务器线程池性能优化方法与***
CN111352820A (zh) 一种高性能应用运行状态预测和监控方法、设备和装置
Gupta et al. An approach for optimizing the performance for apache spark applications
KR20170130178A (ko) 분산 환경 기반 빅데이터 실시간 분석을 위한 인-메모리 db 연결 지원형 스케줄링 방법 및 시스템
CN112783740B (zh) 一种基于时间序列特征的服务器性能预测方法及***
CN114257618A (zh) 一种基于车联网平台的车辆运行数据实时分析***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant