CN104915846A - 一种电子商务时间序列数据的异常检测方法及*** - Google Patents

一种电子商务时间序列数据的异常检测方法及*** Download PDF

Info

Publication number
CN104915846A
CN104915846A CN201510342240.4A CN201510342240A CN104915846A CN 104915846 A CN104915846 A CN 104915846A CN 201510342240 A CN201510342240 A CN 201510342240A CN 104915846 A CN104915846 A CN 104915846A
Authority
CN
China
Prior art keywords
data
electronic commerce
abnormal
normal value
statistics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510342240.4A
Other languages
English (en)
Inventor
刘朋飞
牟川
李亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201510342240.4A priority Critical patent/CN104915846A/zh
Publication of CN104915846A publication Critical patent/CN104915846A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明公开一种电子商务时间序列数据的异常检测方法及***,方法包括:获取基于时间序列的电子商务数据;选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据;把异常数据作为应用接口提供给需求方调用。本发明通过基准检测,基于稳健统计方法实现时序波动识别,适用于各种分布情况。本发明能够针对电子商务不同业务场景、不同数据分布形式,自动发现数据异常。

Description

一种电子商务时间序列数据的异常检测方法及***
技术领域
本发明涉及电子商务相关技术领域,特别是一种电子商务时间序列数据的异常检测方法及***。
背景技术
时间序列是按时间先后顺序排列的各个观测记录的有序集合。在电子商务业务中,随着时间的推移,时间序列通常包含大量的数据,对于时间序列的分析,可以揭示电子商务业务运动、变化和发展的内在规律,尤其对于数据异常的来说,往往包含着更多重要的信息和知识,因此,如何快速有效地检测出这些异常是一项具有重要意义的工作,例如有时候订单数据异常地大,背后可能意味着巨大的市场机会;利润数据的异常增长,可能意味着有降低产品成本或提升利润的地方有待定位和挖掘;而用户数的异常减少,可能意味着某种市场风险或运营效率低下等问题的发生,等等异常数据在电子商务业务运营中需要及时地发现和定位原因,而电子商务业务的多变性、复杂性和大数据量等特征,为异常数据的检测带来了不小的挑战。
对于时间序列数据的异常检测,现有的技术方案通常利用业务逻辑和强假设的统计模型,大致采用两种方法:
(1)业务逻辑主观阈值法
采用移动平均值或环比、同比作为基准值,把待判断数据域基准值的变化率计算出来,然后与阈值比较,超过阈值则判定为异常,通常这个阈值是主观确定的。这样做有两个缺点,一个是阈值是业务人员主观确定,不同的人对业务的理解程度不一样可能产生不同的阈值,而且可解释性较差;另一方面通过环比、同比数据作为基准值的时候,当多个异常数据同时出现的时候,由于前面的异常数据过大或过小会使后面异常数据的环比或同比数据趋于平稳,从而无法发现后面连续的异常数据,就像被“屏蔽”一样。如图1所示:
例如6月18日前后三天的数据都异常变大,但是用环比数据计算的时候,后面两天由于第一天数据特别大,计算的环比变化就会很小,这样就只能发现第一天的数据点异常,后面两天的异常数据就会被第一天数据“屏蔽”掉而检测不出来。
(2)强假设统计模型判别法
统计模型经常会有数据满足某种特定分布的假设条件,常用的是满足正态分布,在正态分布假设下,正常值区间范围为:均值n倍标准差,n取1-3的时候,落在此区域的概率分别为68.29%、95.45%和99.73%,数据在正常值区间外的情况属于小概率事件,定义为异常值。
目前上述发现时间序列数据异常的方法中,第一种业务逻辑主观阈值法存在阈值定义主观、存在“屏蔽”效应等多种条件,在检测可解释性和精度上都存在较大问题;另一种强假设统计模型判断法则存在假设依赖太强的问题,实际的电子商务数据是非常复杂的,很少有符合某种特定分布的情况,这就使得统计模型的使用范围受到限制,模型效力也大大削弱。
发明内容
基于此,有必要针对现有技术并不能很好地检验出电子商务数据的异常数据,提供一种电子商务时间序列数据的异常检测方法及***。
一种电子商务时间序列数据的异常检测方法,包括:
数据获取步骤,包括:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行基准检测步骤,执行基准检测步骤的数据为待检测数据;
基准检测步骤,包括:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行异常调用步骤,其中,所述N为预设的大于1的自然数;
异常调用步骤,包括:把异常数据作为应用接口提供给需求方调用。
一种电子商务时间序列数据的异常检测***,包括:
数据获取模块,用于:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行基准检测模块,执行基准检测模块的数据为待检测数据;
基准检测模块,用于:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行异常调用模块,其中,所述N为预设的大于1的自然数;
异常调用模块,用于:把异常数据作为应用接口提供给需求方调用。
本发明通过基准检测,基于稳健统计方法实现时序波动识别,适用于各种分布情况。本发明能够针对电子商务不同业务场景、不同数据分布形式,自动发现数据异常。
附图说明
图1为现有技术环比指标屏蔽效应示意图;
图2为本发明一种电子商务时间序列数据的异常检测方法的工作流程图;
图3为分位数异常点示意图;
图4为正态分布与分位数值对比图;
图5为本发明的最佳实施例的***结构图;
图6为本发明最佳实施例的工作流程图;
图7为本发明一种电子商务时间序列数据的异常检测***的结构模块图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
如图2所示为本发明一种电子商务时间序列数据的异常检测方法的工作流程图,包括:
步骤S201,包括:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行步骤S202,执行步骤S202的数据为待检测数据;
步骤S202,包括:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行步骤S203,其中,所述N为预设的大于1的自然数;
步骤S203,包括:把异常数据作为应用接口提供给需求方调用。
步骤S201所获取的电子商务数据是基于时间序列的数据,一般来说,电子商务数据并不能完全符合现有的统计分布模型,从而导致现有的统计检测异常数据的方法不能使用。本发明在步骤S202中,采用了分位数的统计方法,分位数的方法对于任何分布,甚至包含错误值或多个异常数据的统计计算都很稳健,基本原理是计算数据在该统计窗口的所有数据中所占的位置从而确定正常值范围。
步骤S203,具体来说,将异常数据结果加工成标准的结构化数据,例如hdfs文件、hbase文件、xml或文本文件等形式,存入MySQL或分布式数据库,通过数据库***直接调用、API调用或者通过标准的互联网数据传输协议,供下游需求方使用
本发明通过采用分位数的统计方法确定出异常数据后,由步骤S203将异常数据提供给需求方调用,例如进行异常报警等后续操作。
本发明根据电子商务业务复杂数据的特点,不依赖主观判断和强假设条件,进行通用稳健的异常数据检测,克服了现有技术的缺点,从而大大提高整体异常检测方案的适用范围和检测效果。
在其中一个实施例中,还包括:如果所述电子商务数据连续M期的数据执行步骤S202未检测出异常数据,则将所述电子商务数据连续M期的数据作为组合检测数据,执行组合检测步骤,其中M为预设的大于1的自然数,所述组合检测步骤,对所述组合检测数据进行包括时序趋势分析或时序因果推断,并将时序趋势分析或时序因果推断得到的异常数据进行回溯性断点分析。
本实施例将普适性通用模型与特定业务场景的其他模型融合起来,大大提高了异常数据检测的效果和精度,使得电子商务业务时间序列数据的异常检测更为智能化和高效化。
在其中一个实施例中,
所述时序趋势分析包括:将所述组合检测数据基于时间序列分解为线性增长趋势、高速增长趋势、周期性增长趋势,从所述电子商务数据中选取不满足所述线性增长趋势、高速增长趋势、周期性增长趋势的数据作为异常数据;
所述时序因果推断包括:从所述组合检测数据中选择第一数据组和第二数据组,所述第一数据组和第二数据组具有相同类型的概率分布,计算第一数据组的数据变化范围作为正常数据变化范围,将第二数据组中超过所述正常数据变化范围的数据作为异常数据。
本实施例增加了时序趋势分析和时序因果推断,其中:
时序趋势分析:时间序列往往是各种因素的叠加,比如订单量与整个公司的所处环境、整体增长速度、周期性、季节性等因素有关,趋势分析的思路就是把复杂的整体数据分解成简单可量化解释的单个因子,比如总体数据=线性增长趋势+高速增长趋势+光滑增长+周期性增长等量化因子,方便分析。
所述时序趋势分析基于时间序列分解为线性增长趋势、高速增长趋势、周期性增长趋势,用数学函数表示为:Yt=St+Tt+Ct,其中
Yt为组合检测数据;
St为线性增长趋势,服从形如y=a+bx的一次线性分布;
Tt为高速增长趋势,服从形如y=a+bxn(其中n>1)的高次非线性分布;
Ct为周期性增长趋势,服从形如y=a+b cos(x)的周期性分布;
从所述组合检测数据中逐个对分解后的几种趋势进行检测,选取不满足所述线性增长趋势、高速增长趋势或周期性增长趋势的数据作为异常数据,不满足趋势的方式可以采用现有的各种趋势分析方式进行判断,例如各种函数的回归算法进行判断,如线性回归和非线性回归方式进行判断,或者是对组合检测数据分别按照线性回归或者非线性回归方式计算对应的回归函数,并判断回归函数是否满足Yt=St+Tt+Ct
时序因果推断是通过预先已知两个分布相同或类似的两组数据组y1和y2,在某个时间点,如果只有其中一组数据组,例如y1发生变化,而数据组y2没有发生变化,则可以用没有发生变化的数据组y2去对已经发生变化的数据组y1进行计算和判断,由于可以根据同分布数据计算出正常数据变动的范围,因此,如果发生变化的数据组y1中,变动幅度超过采用没发生变化的数据组y2的正常数据变动范围的数据判断为异常数据。
例如,对于正态分布的数据,可以计算出其均值和方差,对于没发生变化的数据组y2计算出其方差,对于数据组y1中变动幅度超过数据组y2的数据作为异常数据。数据组的选择可以通过预先确定,例如对于购买有两组数据是在相同时间段内分别购买不同的商品,如果商品的类别较为相似,则可以认为这两组数据具有相同的概率分布。具体如何选择,可以由用户预先确定并写入配置文件中,在计算过程,通过读取配置文件进行确定。
在其中一个实施例中,还包括:
所述回溯性断点分析包括:将所述时序趋势分析或所述时序因果推断的异常数据对应的时间点作为当前时间点tnow向前回溯,每次比较每个时间点前区间range1内的组合检测数据的前均值D1和时间点后区间range2内组合检测数据的后均值D2,range1和range2的时间间隔相同,如果时间点tfore的前均值和后均值的变化超过预设阈值,则认为时间点tfore的前区间range1和后区间range2的数据有异常,从时间点tfore到tnow时间段内的组合检测数据作为异常数据。
本实施例增加了断点检测(Breakout Detection):对于一些时间序列数据,短期可能没有大的波动,而是通过还变的改变,形成另外一种趋势范围,断点检测就是通过监控时间序列指标长期范围内的趋势改变来发现异常点的存在,主要是通过计算各个数据点前后一段时间的均值或累积变化量来进行对比,如果该数据点前后的均值变化或累积变化量比较大,则很可能是一个断点,在此数据点前后的数据趋势发生变化。
在其中一个实施例中,所述分位数统计,具体包括:
对窗口统计数据按数据大小排序,计算窗口统计数据的中位数、上四分位数、下四分位数,所述中位数为窗口统计数据排序后处于所有数据中间位置的数据,所述上四分位数为窗口统计数据排序后处于所有数据四分之一位置的数据,所述下四分位数为窗口统计数据排序后出于所有数据四分之三位置的数据,计算下四分位数和上四分位数的差值的绝对值作为四分位距,确定所述正常值上边界值为中位数减去k倍四分位距,确定所述正常值下边界值为中位数加上k倍四分位距,其中,所述k为大于1的自然数。
窗口统计数据的排序可以是按从小到大的顺序进行排序,则四分位距=下四分位数-上四分位数,而小于正常值上边界值的数据为异常数据,大于正常值下边界值的数据为异常数据。
窗口统计数据的排序也可以是按从大到小的顺序进行排序,则四分位距=上四分位数-下四分位数,而大于正常值上边界值的数据为异常数据,小于正常值下边界值的数据为异常数据。
优选地,k为1、2或3。
如图3所示为分位数异常点示意图。分位数检测有对任何分布都适用,其检验效果也很好,而且当数据服从正态分布时,能取得和均值-标准差相当的检测功效。如图4所示,当数据符合正态分布时,本实施例的分位数统计和正态分布的检验功效相当,中位数与正态分布的均值μ相等,四分位距约等于1.4倍正态分布的标准差σ。
如图5所示为本发明的最佳实施例的***结构图,包括:数据准备模块501、基准检测模块502、组合检测模块503、结果融合模块504、检测应用模块505五部分组成,其中。
数据准备模块501:数据准备模块的主要功能是进行训练模型的数据样本预处理,它主要是通过剔除错误值、空值等不符合时间序列或业务逻辑的数据,并根据业务需要去掉极值等手段排除干扰因素的影响。
基准检测模块502:基准检测模块的主要功能是提供异常检测的基本检测,这里是采用包含N期异动窗口数据的分位数异常点检测方法。N是个参数,可以依据业务需要来指定,一般来说N取值越大,考虑的时间周期越长,异常值边界范围变动越小,适合波动情况不大的数据,比如购买用户变动情况;反之,异常值边界变动越大,适合波动情况较大的数据,比如用户浏览数量、购买金额等。分位数异常点检测是稳健统计的一种方法,所谓稳健是数据有变动甚至数据有失误时,统计方法的适应性问题,稳健性强的方法在面对不同数据情况时得到的结果差别不大,分位数的方法对于任何分布,甚至包含错误值或多个异常数据的统计计算都很稳健,基本原理是计算数据在该统计窗口的所有数据中所占的位置,如图3所示,中位数就是指把所有数据按大小排序后,处于所有数据中间位置的数,上四分位数是处于所有数据四分之一(25%)位置的数据,下四分位数是出于所有数据四分之三(75%)位置的数据,和正态分布当中标准差作为度量数据离散程度的统计量一样,分位数统计中,定义四分位距作为数据离散程度的度量,具体计算为:下四分位数减去上四分位数。这样就可以定义出一个正常数据的区间范围,一般为:中位数±n倍四分位距,n一般去取1到3之间,这样分位数中的中位数和四分位距对应正态分布中的均值和标准差,就实现了对所有数据分布都通用的异常值检测。上述正常值上下边界之外的点定义为异常值点。分位数检测有对任何分布都适用,其检验效果也很好,而且当数据服从正态分布时,能取得和均值-标准差相当的检测功效。如图4所示,当数据符合正态分布时,两者检验功效相当,中位数与均值相等,四分位距约等于1.4倍标准差。
组合检测模块503:组合检测模块的主要功能是除基准检测模块外,还提供几种特定业务场景的检测方法,以便提高整体方案检测效果;其中时序趋势分解是把复杂时间序列数据分解成线性增长趋势、高速增长趋势、光滑增长等各种不同类型趋势,各个类型分别检测和处理;时序因果推断是针对细粒度数据,比如某一个部门、品类数据在一些专门促销活动中定量识别活动冲击造成的异常数据的具体影响;回溯性断点分析是针对基准检测数据即时性检测而增加的一个补充模块,针对有一些异常数据需要累积一段时间才能看出来,断点分析解决的就是在异常发生一段时间以后,做阶段性回溯,通过异常数据的累积计算从而判断不同的异常阶段,最终找到长期范围内的趋势改变。
结果融合模块504:结果融合模块的主要功能是把结果按业务逻辑和置信度权重组合起来,输出一个最终可信度更高和效果更好的结果。
检测应用模块505:检测应用模块的主要功能是提供一个异常检测数据传输接口,依据已经计算出的异常点数据,传输给各业务应用模块或预警模块,把异常检测信息快速传导到使用人手中。
如图6所示为本发明最佳实施例的工作流程图,包括:
步骤S601,数据准备模块进行数据集成和数据预处理;
步骤S602,经过数据准备模块集成处理的数据输入基准检测模块,基准检测模块进行基本检测,如果检测出异常数据,则发送到结果融合模块,执行步骤S604,如果连续多期均没有检测出异常数据,则将数据发送到组合检测模块执行步骤S603;
步骤S603,对数据进行时序趋势分解和时序因果推断,当检测出异常数据则进行断点检测,将异常数据发送到结果融合模块,执行步骤S604;
步骤S604,对从组合检测模块接收的异常数据进行模型结果融合,得到最终的异常检测结果后发送到检测应用模型,执行步骤S605;
步骤S605,输出数据到检测应用接口。
如图7所示为本发明一种电子商务时间序列数据的异常检测***的结构模块图,包括:
数据获取模块701,用于:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行基准检测模块,执行基准检测模块的数据为待检测数据;
基准检测模块702,用于:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行异常调用模块,其中,所述N为预设的大于1的自然数;
异常调用模块703,用于:把异常数据作为应用接口提供给需求方调用。
在其中一个实施例中,还包括:如果所述电子商务数据连续M期的数据执行基准检测模块未检测出异常数据,则将所述电子商务数据连续M期的数据作为组合检测数据,执行组合检测模块,其中M为预设的大于1的自然数,所述组合检测模块,对所述组合检测数据进行包括时序趋势分析或时序因果推断,并将时序趋势分析或时序因果推断得到的异常数据进行回溯性断点分析。
在其中一个实施例中,
所述时序趋势分析包括:将所述组合检测数据基于时间序列分解为线性增长趋势、高速增长趋势、周期性增长趋势,从所述电子商务数据中选取不满足所述线性增长趋势、高速增长趋势、周期性增长趋势的数据作为异常数据;
所述时序因果推断包括:从所述组合检测数据中选择第一数据组和第二数据组,所述第一数据组和第二数据组具有相同类型的概率分布,计算第一数据组的数据变化范围作为正常数据变化范围,将第二数据组中超过所述正常数据变化范围的数据作为异常数据。
在其中一个实施例中,所述回溯性断点分析包括:将所述时序趋势分析或所述时序因果推断的异常数据对应的时间点作为当前时间点tnow向前回溯,每次比较每个时间点前区间range1内的组合检测数据的前均值D1和时间点后区间range2内组合检测数据的后均值D2,range1和range2的时间间隔相同,如果时间点tfore的前均值和后均值的变化超过预设阈值,则认为时间点tfore的前区间range1和后区间range2的数据有异常,从时间点tfore到tnow时间段内的组合检测数据作为异常数据。
在其中一个实施例中,所述分位数统计,具体包括:
对窗口统计数据按数据大小排序,计算窗口统计数据的中位数、上四分位数、下四分位数,所述中位数为窗口统计数据排序后处于所有数据中间位置的数据,所述上四分位数为窗口统计数据排序后处于所有数据四分之一位置的数据,所述下四分位数为窗口统计数据排序后出于所有数据四分之三位置的数据,计算下四分位数和上四分位数的差值的绝对值作为四分位距,确定所述正常值上边界值为中位数减去k倍四分位距,确定所述正常值下边界值为中位数加上k倍四分位距,其中,所述k为大于1的自然数。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种电子商务时间序列数据的异常检测方法,其特征在于,包括:
数据获取步骤,包括:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行基准检测步骤,执行基准检测步骤的数据为待检测数据;
基准检测步骤,包括:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行异常调用步骤,其中,所述N为预设的大于1的自然数;
异常调用步骤,包括:把异常数据作为应用接口提供给需求方调用。
2.根据权利要求1所述的电子商务时间序列数据的异常检测方法,其特征在于,还包括:如果所述电子商务数据连续M期的数据执行基准检测步骤未检测出异常数据,则将所述电子商务数据连续M期的数据作为组合检测数据,执行组合检测步骤,其中M为预设的大于1的自然数,所述组合检测步骤,对所述组合检测数据进行包括时序趋势分析或时序因果推断,并将时序趋势分析或时序因果推断得到的异常数据进行回溯性断点分析。
3.根据权利要求2所述的电子商务时间序列数据的异常检测方法,其特征在于,
所述时序趋势分析包括:将所述组合检测数据基于时间序列分解为线性增长趋势、高速增长趋势、周期性增长趋势,从所述电子商务数据中选取不满足所述线性增长趋势、高速增长趋势、周期性增长趋势的数据作为异常数据;
所述时序因果推断包括:从所述组合检测数据中选择第一数据组和第二数据组,所述第一数据组和第二数据组具有相同类型的概率分布,计算第一数据组的数据变化范围作为正常数据变化范围,将第二数据组中超过所述正常数据变化范围的数据作为异常数据。
4.根据权利要求2所述的电子商务时间序列数据的异常检测方法,其特征在于,所述回溯性断点分析包括:将所述时序趋势分析或所述时序因果推断的异常数据对应的时间点作为当前时间点tnow向前回溯,每次比较每个时间点前区间range1内的组合检测数据的前均值D1和时间点后区间range2内组合检测数据的后均值D2,range1和range2的时间间隔相同,如果时间点tfore的前均值和后均值的变化超过预设阈值,则认为时间点tfore的前区间range1和后区间range2的数据有异常,从时间点tfore到tnow时间段内的组合检测数据作为异常数据。
5.根据权利要求1所述的电子商务时间序列数据的异常检测方法,其特征在于,所述分位数统计,具体包括:
对窗口统计数据按数据大小排序,计算窗口统计数据的中位数、上四分位数、下四分位数,所述中位数为窗口统计数据排序后处于所有数据中间位置的数据,所述上四分位数为窗口统计数据排序后处于所有数据四分之一位置的数据,所述下四分位数为窗口统计数据排序后出于所有数据四分之三位置的数据,计算下四分位数和上四分位数的差值的绝对值作为四分位距,确定所述正常值上边界值为中位数减去k倍四分位距,确定所述正常值下边界值为中位数加上k倍四分位距,其中,所述k为大于1的自然数。
6.一种电子商务时间序列数据的异常检测***,其特征在于,包括:
数据获取模块,用于:获取基于时间序列的电子商务数据,对所述电子商务数据中的每个数据执行基准检测模块,执行基准检测模块的数据为待检测数据;
基准检测模块,用于:选择邻近待检测数据的N期电子商务数据作为窗口统计数据,对所述窗口统计数据进行分位数统计,从而确定所述窗口统计数据中的正常值上边界和正常值下边界,所述窗口统计数据中处于所述正常值上边界和所述正常值下边界所确定的正常值范围以外的数据为异常数据,如果出现异常数据,则执行异常调用模块,其中,所述N为预设的大于1的自然数;
异常调用模块,用于:把异常数据作为应用接口提供给需求方调用。
7.根据权利要求6所述的电子商务时间序列数据的异常检测***,其特征在于,还包括:如果所述电子商务数据连续M期的数据执行基准检测模块未检测出异常数据,则将所述电子商务数据连续M期的数据作为组合检测数据,执行组合检测模块,其中M为预设的大于1的自然数,所述组合检测模块,对所述组合检测数据进行包括时序趋势分析或时序因果推断,并将时序趋势分析或时序因果推断得到的异常数据进行回溯性断点分析。
8.根据权利要求7所述的电子商务时间序列数据的异常检测***,其特征在于,
所述时序趋势分析包括:将所述组合检测数据基于时间序列分解为线性增长趋势、高速增长趋势、周期性增长趋势,从所述电子商务数据中选取不满足所述线性增长趋势、高速增长趋势、周期性增长趋势的数据作为异常数据;
所述时序因果推断包括:从所述组合检测数据中选择第一数据组和第二数据组,所述第一数据组和第二数据组具有相同类型的概率分布,计算第一数据组的数据变化范围作为正常数据变化范围,将第二数据组中超过所述正常数据变化范围的数据作为异常数据。
9.根据权利要求7所述的电子商务时间序列数据的异常检测***,其特征在于,所述回溯性断点分析包括:将所述时序趋势分析或所述时序因果推断的异常数据对应的时间点作为当前时间点tnow向前回溯,每次比较每个时间点前区间range1内的组合检测数据的前均值D1和时间点后区间range2内组合检测数据的后均值D2,range1和range2的时间间隔相同,如果时间点tfore的前均值和后均值的变化超过预设阈值,则认为时间点tfore的前区间range1和后区间range2的数据有异常,从时间点tfore到tnow时间段内的组合检测数据作为异常数据。
10.根据权利要求6所述的电子商务时间序列数据的异常检测***,其特征在于,所述分位数统计,具体包括:
对窗口统计数据按数据大小排序,计算窗口统计数据的中位数、上四分位数、下四分位数,所述中位数为窗口统计数据排序后处于所有数据中间位置的数据,所述上四分位数为窗口统计数据排序后处于所有数据四分之一位置的数据,所述下四分位数为窗口统计数据排序后出于所有数据四分之三位置的数据,计算下四分位数和上四分位数的差值的绝对值作为四分位距,确定所述正常值上边界值为中位数减去k倍四分位距,确定所述正常值下边界值为中位数加上k倍四分位距,其中,所述k为大于1的自然数。
CN201510342240.4A 2015-06-18 2015-06-18 一种电子商务时间序列数据的异常检测方法及*** Pending CN104915846A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510342240.4A CN104915846A (zh) 2015-06-18 2015-06-18 一种电子商务时间序列数据的异常检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510342240.4A CN104915846A (zh) 2015-06-18 2015-06-18 一种电子商务时间序列数据的异常检测方法及***

Publications (1)

Publication Number Publication Date
CN104915846A true CN104915846A (zh) 2015-09-16

Family

ID=54084892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510342240.4A Pending CN104915846A (zh) 2015-06-18 2015-06-18 一种电子商务时间序列数据的异常检测方法及***

Country Status (1)

Country Link
CN (1) CN104915846A (zh)

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653129A (zh) * 2015-12-29 2016-06-08 江苏飞尚安全监测咨询有限公司 一种基于经典算法的实时信号甄别和修正的方法
CN105808368A (zh) * 2016-03-15 2016-07-27 南京联成科技发展有限公司 一种基于随机概率分布的信息安全异常检测的方法及***
CN106209496A (zh) * 2016-06-23 2016-12-07 珠海格力电器股份有限公司 一种通信异常检测装置及方法
CN106227640A (zh) * 2016-07-27 2016-12-14 北京市环境保护监测中心 一种基于自动监测仪器的异常数据检测方法及***
CN106339316A (zh) * 2016-08-24 2017-01-18 上海爱企网络科技有限公司 一种电子商务平台中对代码段进行诊断的方法及装置
CN106548035A (zh) * 2016-11-24 2017-03-29 腾讯科技(深圳)有限公司 一种数据异常的诊断方法及装置
CN106815452A (zh) * 2015-11-27 2017-06-09 苏宁云商集团股份有限公司 一种作弊检测方法及装置
CN106933691A (zh) * 2017-03-09 2017-07-07 深圳市彬讯科技有限公司 一种针对季节性时序数据序列中异常点的识别方法及***
CN107204875A (zh) * 2017-05-11 2017-09-26 腾讯科技(深圳)有限公司 数据上报链路监测方法、装置、电子设备及存储介质
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法
CN107729293A (zh) * 2017-09-27 2018-02-23 中南大学 一种基于多元自适应回归的地理空间异常探测方法
CN108154342A (zh) * 2017-12-25 2018-06-12 苏州大学 基于云存储的智能公交数据协同方法及其***
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
CN108536777A (zh) * 2018-03-28 2018-09-14 联想(北京)有限公司 一种数据处理方法、服务器集群及数据处理装置
CN108804703A (zh) * 2018-06-19 2018-11-13 北京焦点新干线信息技术有限公司 一种数据异常检测方法及装置
CN108900478A (zh) * 2018-06-11 2018-11-27 阿里巴巴集团控股有限公司 异动攻击的检测方法及装置、安全防护设备
CN109189827A (zh) * 2018-08-16 2019-01-11 阿里巴巴集团控股有限公司 时间序列处理方法和装置、电子设备
CN109861857A (zh) * 2019-01-28 2019-06-07 网联清算有限公司 故障检测方法及装置
CN110071913A (zh) * 2019-03-26 2019-07-30 同济大学 一种基于无监督学习的时间序列异常检测方法
CN110083638A (zh) * 2019-04-24 2019-08-02 广东联合电子服务股份有限公司 一种滞留规则库构建方法及数据滞留分析方法
CN110163457A (zh) * 2018-02-14 2019-08-23 北京京东尚科信息技术有限公司 一种业务指标的异常定位方法和装置
CN110334849A (zh) * 2019-05-30 2019-10-15 深圳壹账通智能科技有限公司 基于数据监控的资源预警方法、装置和计算机设备
CN110348718A (zh) * 2019-06-28 2019-10-18 北京淇瑀信息科技有限公司 金融业务指标监控方法、装置及电子设备
CN110399903A (zh) * 2019-06-28 2019-11-01 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN110399400A (zh) * 2018-10-31 2019-11-01 腾讯科技(深圳)有限公司 检测异常数据的方法、装置、设备以及介质
CN110474862A (zh) * 2018-05-10 2019-11-19 中移(苏州)软件技术有限公司 一种网络流量异常检测方法及装置
CN110751371A (zh) * 2019-09-20 2020-02-04 苏宁云计算有限公司 基于统计四分位距的商品库存风险预警方法、***及计算机可读存储介质
CN111241158A (zh) * 2020-01-07 2020-06-05 清华大学 一种飞行器遥测数据的异常检测方法和装置
CN111382919A (zh) * 2018-12-28 2020-07-07 顺丰科技有限公司 运营指标自动监控方法和装置
CN111382944A (zh) * 2020-03-11 2020-07-07 江苏苏宁物流有限公司 作业行为风险识别方法、装置、计算机设备和存储介质
US10769658B2 (en) 2016-09-30 2020-09-08 International Business Machines Corporation Automatic detection of anomalies in electronic communications
CN111650346A (zh) * 2020-07-14 2020-09-11 中科三清科技有限公司 大气污染监测数据的自动审核方法、装置及电子设备
CN111755125A (zh) * 2020-07-07 2020-10-09 医渡云(北京)技术有限公司 分析患者测量指标的方法、装置、介质及电子设备
CN111783804A (zh) * 2019-04-04 2020-10-16 ***通信集团上海有限公司 异常话单确定方法、装置、设备及存储介质
CN111984930A (zh) * 2020-08-19 2020-11-24 河海大学 一种地下水水位监测数据异常值识别方法及***
CN112116014A (zh) * 2020-09-24 2020-12-22 贵州电网有限责任公司 一种配电自动化设备测试数据离群值检测方法
CN112651539A (zh) * 2019-10-12 2021-04-13 富士通株式会社 信息处理装置和信息处理方法
CN112926906A (zh) * 2019-12-06 2021-06-08 顺丰科技有限公司 货件收发点的接驳班次分配方法、装置、存储介质和设备
CN113076349A (zh) * 2020-01-06 2021-07-06 阿里巴巴集团控股有限公司 数据异常检测方法、装置、***及电子设备
CN113159597A (zh) * 2021-04-29 2021-07-23 浙江陀曼云计算有限公司 基于时序数据波动的机床生产间隔计算方法及***
CN113434823A (zh) * 2021-08-26 2021-09-24 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN113742118A (zh) * 2020-05-29 2021-12-03 Ovh公司 对数据管道中的异常进行检测的方法和***
CN114493230A (zh) * 2022-01-20 2022-05-13 清华大学 异常业务数据的处理方法、装置和存储介质
CN114780400A (zh) * 2022-04-18 2022-07-22 南京安元科技有限公司 基于周期性数据平衡统计的阻断业务之间循环调用的方法
CN115168159A (zh) * 2022-09-06 2022-10-11 北京达佳互联信息技术有限公司 异常检测方法、装置、电子设备及存储介质
CN117093917A (zh) * 2023-10-18 2023-11-21 北京天泽智云科技有限公司 基于融合累计量的数据异常检测方法及***
CN117648232A (zh) * 2023-12-11 2024-03-05 武汉天宝莱信息技术有限公司 一种应用程序数据监控方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100199285A1 (en) * 2009-02-05 2010-08-05 Vmware, Inc. Virtual machine utility computing method and system
CN102945320A (zh) * 2012-10-29 2013-02-27 河海大学 一种时间序列数据异常检测方法与装置
CN103561418A (zh) * 2013-11-07 2014-02-05 东南大学 基于时间序列的异常检测方法
CN103631681A (zh) * 2013-12-10 2014-03-12 国家电网公司 一种在线修复风电场异常数据的方法
CN104350471A (zh) * 2012-06-28 2015-02-11 国际商业机器公司 利用自动阈值设置在多时间序列数据中实时地检测异常

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100199285A1 (en) * 2009-02-05 2010-08-05 Vmware, Inc. Virtual machine utility computing method and system
CN104350471A (zh) * 2012-06-28 2015-02-11 国际商业机器公司 利用自动阈值设置在多时间序列数据中实时地检测异常
CN102945320A (zh) * 2012-10-29 2013-02-27 河海大学 一种时间序列数据异常检测方法与装置
CN103561418A (zh) * 2013-11-07 2014-02-05 东南大学 基于时间序列的异常检测方法
CN103631681A (zh) * 2013-12-10 2014-03-12 国家电网公司 一种在线修复风电场异常数据的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴林: "一种基于趋势分析的网络性能异常检测方法", 《科学技术与工程》 *
金中淦: "四分位数稳健统计和迭代稳健统计在室间质量评价结果分析中的比较", 《临床检验杂志》 *
陈运文: "基于异常检测的时间序列研究", 《计算机技术与发展》 *

Cited By (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815452A (zh) * 2015-11-27 2017-06-09 苏宁云商集团股份有限公司 一种作弊检测方法及装置
CN105653129A (zh) * 2015-12-29 2016-06-08 江苏飞尚安全监测咨询有限公司 一种基于经典算法的实时信号甄别和修正的方法
CN105808368A (zh) * 2016-03-15 2016-07-27 南京联成科技发展有限公司 一种基于随机概率分布的信息安全异常检测的方法及***
CN105808368B (zh) * 2016-03-15 2019-04-30 南京联成科技发展股份有限公司 一种基于随机概率分布的信息安全异常检测的方法及***
CN106209496A (zh) * 2016-06-23 2016-12-07 珠海格力电器股份有限公司 一种通信异常检测装置及方法
CN106227640B (zh) * 2016-07-27 2019-03-19 北京市环境保护监测中心 一种基于自动监测仪器的异常数据检测方法及***
CN106227640A (zh) * 2016-07-27 2016-12-14 北京市环境保护监测中心 一种基于自动监测仪器的异常数据检测方法及***
CN106339316A (zh) * 2016-08-24 2017-01-18 上海爱企网络科技有限公司 一种电子商务平台中对代码段进行诊断的方法及装置
CN106339316B (zh) * 2016-08-24 2019-01-11 上海爱企网络科技有限公司 一种电子商务平台中对代码段进行诊断的方法及装置
US10769658B2 (en) 2016-09-30 2020-09-08 International Business Machines Corporation Automatic detection of anomalies in electronic communications
CN106548035B (zh) * 2016-11-24 2019-08-06 腾讯科技(深圳)有限公司 一种数据异常的诊断方法及装置
CN106548035A (zh) * 2016-11-24 2017-03-29 腾讯科技(深圳)有限公司 一种数据异常的诊断方法及装置
CN106933691B (zh) * 2017-03-09 2020-11-10 深圳市彬讯科技有限公司 一种针对季节性时序数据序列中异常点的识别方法及***
CN106933691A (zh) * 2017-03-09 2017-07-07 深圳市彬讯科技有限公司 一种针对季节性时序数据序列中异常点的识别方法及***
CN107204875A (zh) * 2017-05-11 2017-09-26 腾讯科技(深圳)有限公司 数据上报链路监测方法、装置、电子设备及存储介质
CN107729293B (zh) * 2017-09-27 2019-11-12 中南大学 一种基于多元自适应回归的地理空间异常探测方法
CN107729293A (zh) * 2017-09-27 2018-02-23 中南大学 一种基于多元自适应回归的地理空间异常探测方法
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法
CN107657288B (zh) * 2017-10-26 2020-07-03 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法
CN108154342A (zh) * 2017-12-25 2018-06-12 苏州大学 基于云存储的智能公交数据协同方法及其***
CN110163457A (zh) * 2018-02-14 2019-08-23 北京京东尚科信息技术有限公司 一种业务指标的异常定位方法和装置
CN108536777A (zh) * 2018-03-28 2018-09-14 联想(北京)有限公司 一种数据处理方法、服务器集群及数据处理装置
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
CN110474862B (zh) * 2018-05-10 2021-08-13 中移(苏州)软件技术有限公司 一种网络流量异常检测方法及装置
CN110474862A (zh) * 2018-05-10 2019-11-19 中移(苏州)软件技术有限公司 一种网络流量异常检测方法及装置
CN108900478A (zh) * 2018-06-11 2018-11-27 阿里巴巴集团控股有限公司 异动攻击的检测方法及装置、安全防护设备
CN108804703B (zh) * 2018-06-19 2021-09-17 北京焦点新干线信息技术有限公司 一种数据异常检测方法及装置
CN108804703A (zh) * 2018-06-19 2018-11-13 北京焦点新干线信息技术有限公司 一种数据异常检测方法及装置
CN109189827B (zh) * 2018-08-16 2022-04-15 创新先进技术有限公司 时间序列处理方法和装置、电子设备
CN109189827A (zh) * 2018-08-16 2019-01-11 阿里巴巴集团控股有限公司 时间序列处理方法和装置、电子设备
CN110399400A (zh) * 2018-10-31 2019-11-01 腾讯科技(深圳)有限公司 检测异常数据的方法、装置、设备以及介质
CN110399400B (zh) * 2018-10-31 2023-08-15 腾讯科技(深圳)有限公司 检测异常数据的方法、装置、设备以及介质
CN111382919A (zh) * 2018-12-28 2020-07-07 顺丰科技有限公司 运营指标自动监控方法和装置
CN109861857A (zh) * 2019-01-28 2019-06-07 网联清算有限公司 故障检测方法及装置
CN110071913A (zh) * 2019-03-26 2019-07-30 同济大学 一种基于无监督学习的时间序列异常检测方法
CN111783804B (zh) * 2019-04-04 2023-11-24 ***通信集团上海有限公司 异常话单确定方法、装置、设备及存储介质
CN111783804A (zh) * 2019-04-04 2020-10-16 ***通信集团上海有限公司 异常话单确定方法、装置、设备及存储介质
CN110083638A (zh) * 2019-04-24 2019-08-02 广东联合电子服务股份有限公司 一种滞留规则库构建方法及数据滞留分析方法
CN110334849A (zh) * 2019-05-30 2019-10-15 深圳壹账通智能科技有限公司 基于数据监控的资源预警方法、装置和计算机设备
CN110399903B (zh) * 2019-06-28 2021-07-13 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN110348718B (zh) * 2019-06-28 2023-11-14 北京淇瑀信息科技有限公司 业务指标监控方法、装置及电子设备
CN110399903A (zh) * 2019-06-28 2019-11-01 上海上湖信息技术有限公司 异常数据的检测方法及装置、计算机可读存储介质
CN110348718A (zh) * 2019-06-28 2019-10-18 北京淇瑀信息科技有限公司 金融业务指标监控方法、装置及电子设备
CN110751371A (zh) * 2019-09-20 2020-02-04 苏宁云计算有限公司 基于统计四分位距的商品库存风险预警方法、***及计算机可读存储介质
WO2021052031A1 (zh) * 2019-09-20 2021-03-25 苏宁云计算有限公司 基于统计四分位距的商品库存风险预警方法、***及计算机可读存储介质
CN112651539A (zh) * 2019-10-12 2021-04-13 富士通株式会社 信息处理装置和信息处理方法
CN112926906B (zh) * 2019-12-06 2023-06-13 顺丰科技有限公司 货件收发点的接驳班次分配方法、装置、存储介质和设备
CN112926906A (zh) * 2019-12-06 2021-06-08 顺丰科技有限公司 货件收发点的接驳班次分配方法、装置、存储介质和设备
CN113076349A (zh) * 2020-01-06 2021-07-06 阿里巴巴集团控股有限公司 数据异常检测方法、装置、***及电子设备
CN113076349B (zh) * 2020-01-06 2024-06-11 阿里巴巴集团控股有限公司 数据异常检测方法、装置、***及电子设备
CN111241158B (zh) * 2020-01-07 2020-09-18 清华大学 一种飞行器遥测数据的异常检测方法和装置
CN111241158A (zh) * 2020-01-07 2020-06-05 清华大学 一种飞行器遥测数据的异常检测方法和装置
CN111382944A (zh) * 2020-03-11 2020-07-07 江苏苏宁物流有限公司 作业行为风险识别方法、装置、计算机设备和存储介质
CN113742118A (zh) * 2020-05-29 2021-12-03 Ovh公司 对数据管道中的异常进行检测的方法和***
CN113742118B (zh) * 2020-05-29 2024-04-26 Ovh公司 对数据管道中的异常进行检测的方法和***
CN111755125A (zh) * 2020-07-07 2020-10-09 医渡云(北京)技术有限公司 分析患者测量指标的方法、装置、介质及电子设备
CN111755125B (zh) * 2020-07-07 2024-04-23 医渡云(北京)技术有限公司 分析患者测量指标的方法、装置、介质及电子设备
CN111650346A (zh) * 2020-07-14 2020-09-11 中科三清科技有限公司 大气污染监测数据的自动审核方法、装置及电子设备
CN111984930A (zh) * 2020-08-19 2020-11-24 河海大学 一种地下水水位监测数据异常值识别方法及***
CN112116014A (zh) * 2020-09-24 2020-12-22 贵州电网有限责任公司 一种配电自动化设备测试数据离群值检测方法
CN113159597B (zh) * 2021-04-29 2022-08-16 浙江陀曼云计算有限公司 基于时序数据波动的机床生产间隔计算方法及***
CN113159597A (zh) * 2021-04-29 2021-07-23 浙江陀曼云计算有限公司 基于时序数据波动的机床生产间隔计算方法及***
CN113434823B (zh) * 2021-08-26 2021-11-16 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN113434823A (zh) * 2021-08-26 2021-09-24 企查查科技有限公司 数据采集任务异常预警方法、装置、计算机设备和介质
CN114493230A (zh) * 2022-01-20 2022-05-13 清华大学 异常业务数据的处理方法、装置和存储介质
CN114780400B (zh) * 2022-04-18 2023-06-27 南京安元科技有限公司 基于周期性数据平衡统计的阻断业务之间循环调用的方法
CN114780400A (zh) * 2022-04-18 2022-07-22 南京安元科技有限公司 基于周期性数据平衡统计的阻断业务之间循环调用的方法
CN115168159A (zh) * 2022-09-06 2022-10-11 北京达佳互联信息技术有限公司 异常检测方法、装置、电子设备及存储介质
CN117093917A (zh) * 2023-10-18 2023-11-21 北京天泽智云科技有限公司 基于融合累计量的数据异常检测方法及***
CN117648232A (zh) * 2023-12-11 2024-03-05 武汉天宝莱信息技术有限公司 一种应用程序数据监控方法、装置及存储介质
CN117648232B (zh) * 2023-12-11 2024-05-24 武汉天宝莱信息技术有限公司 一种应用程序数据监控方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN104915846A (zh) 一种电子商务时间序列数据的异常检测方法及***
WO2021052031A1 (zh) 基于统计四分位距的商品库存风险预警方法、***及计算机可读存储介质
CN111324639B (zh) 数据监测方法、装置及计算机可读存储介质
CN107086944A (zh) 一种异常检测方法和装置
US11182394B2 (en) Performing database file management using statistics maintenance and column similarity
US20060167704A1 (en) Computer system and method for business data processing
US20130085801A1 (en) Supply Chain Performance Management Tool Having Predictive Capabilities
CA2955615C (en) Visual tools for failure analysis in distributed systems
CN106161138A (zh) 一种智能自动计量方法及装置
US20090327049A1 (en) Forecasting discovery costs based on complex and incomplete facts
CN105046532A (zh) 一种竞价方法和装置
Yang et al. Optimal acquisition policy in remanufacturing under general core quality distributions
US20160132798A1 (en) Service-level agreement analysis
KR101886943B1 (ko) 동적 클러스터링에 의한 일종의 전력시장 수급 조기 경보 모델의 구축 방법
CN102663065B (zh) 一种广告位异常数据识别和筛选方法
CN106408325A (zh) 基于用户支付信息的用户消费行为预测分析方法及***
Salamai et al. Risk identification-based association rule mining for supply chain big data
CN115330531B (zh) 一种基于用电变动周期的企业风险预测方法
CN112541635A (zh) 业务数据统计预测方法、装置、计算机设备及存储介质
CN117397204A (zh) 机器学习时间序列异常检测
CN116126642A (zh) 信息处理方法、装置、设备及存储介质
Yu et al. LRProb control chart based on logistic regression for monitoring mean shifts of auto-correlated manufacturing processes
CN105447117B (zh) 一种用户聚类的方法和装置
CN105005575A (zh) 一种企业智能预测快速开发接口方法
CN110874640B (zh) 使用机器学习(ml)的间歇数据的分布选择和模拟

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150916

RJ01 Rejection of invention patent application after publication