CN112215396A - 一种基于模糊时间序列分析和粒子群技术的数据预测算法 - Google Patents
一种基于模糊时间序列分析和粒子群技术的数据预测算法 Download PDFInfo
- Publication number
- CN112215396A CN112215396A CN202010913459.6A CN202010913459A CN112215396A CN 112215396 A CN112215396 A CN 112215396A CN 202010913459 A CN202010913459 A CN 202010913459A CN 112215396 A CN112215396 A CN 112215396A
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- data
- time series
- trend
- granularity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002245 particle Substances 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012731 temporal analysis Methods 0.000 title claims abstract description 11
- 238000000700 time series analysis Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000007774 longterm Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 9
- 230000001174 ascending effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000009499 grossing Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 101100202447 Drosophila melanogaster sav gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013213 extrapolation Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241001123248 Arma Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/02—Computing arrangements based on specific mathematical models using fuzzy logic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Biophysics (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Mathematical Optimization (AREA)
- Development Economics (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Computational Mathematics (AREA)
- Automation & Control Theory (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于模糊时间序列分析和粒子群技术的数据预测算法,通过自动聚类算法将多时间序列生成不同的区间长度,并划分粒度空间;然后,对不同粒度空间中的模糊趋势进行预测;最后利用各粒度空间的预测模糊趋势和粒子群技术得到的最优加权向量,计算出最终预测值。该算法不用依赖大量的历史数据,且可以对不完整、不准确和具有含糊性的数据来进行预测,很好的解决了传统时间序列预测模型的问题。因此模糊时间序列预测模型可以很好的处理具有这种特点的数据,同时能够很好的处理非线性时间数据,在处理长期序列预测时也表现出了比较好的效果。
Description
技术领域
本发明属于时间序列预测技术领域,具体涉及一种基于模糊时间序列分析和粒子群技术的数据预测算法的方法。
背景技术
近年来时间序列预测在很多领域起到重要的作用,通过对模糊时间序列数据的分析,掌握经济现状随时间的变化规律,从而预测其未来,它被广泛地应用在天文、气象、水文、生物和社会经济等方面的预测。基本原理是根据对象的时间序列数据,依据事物发展的连续性规律,通过统计分析或建立数学模型进行趋势外推,对预测对象的未来可能值作出了定量分析的方法。时间序列预测法也叫时间写分析法、历史外推法或外推法。
目前国内预测时间的序列的方法主要有以下几种:
1)指数平滑法
指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。但是指数平滑法赋予远期较小的比重,近期较大的比重,所以只能进行短期预测进行长期预测时,误差较大参效果不理想。同时对于海量模糊的数据没法进行处理。
2)ARMA模型
ARMA模型(Auto-Regressive and Moving Average Model)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成,在市场研究中常用于长期追踪资料的研究。如:Panel研究中,用于消费行为模式变迁研究;在零售研究中,用于具有季节变动特征的销售量、市场规模的预测等。它比AR模型与MA模型有较精确的谱估计及较优良的谱分辨率性能,但其参数估算比较繁琐,进行预测只是能表示简单的趋势,对于相对复杂的时间序列则效果比较差。
3)logistic回归法
logistic回归是一种广义线性回归(generalized linear model),与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有wx+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将wx+b作为因变量,即y=wx+b,而logistic回归则通过函数L将wx+b对应一个隐状态p,p=L(wx+b),然后根据p与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。但是并不能利用该方法处理非线性问题。
时间序列预测在很多领域都起到重要的作用,在传统的时间序列预测当中,使用了各种统计模型,如移动平均、指数平滑等。但这些统计模型高度依赖历史明确的数据,而且要求数据遵循高斯分布,加之对数据测量的不准确、观测集的不完整、获得测量数据困难等原因,无法处理某些数据中固有的模糊性和不确定性,对于那些不完整不清晰的序列,预测精度并不高。
发明内容
针对现有技术存在的缺陷或不足,本发明的目的在于,提供一种基于模糊时间序列分析和粒子群技术的数据预测算法。
为了实现上述任务,本发明采取如下的技术解决方案:
一种基于模糊时间序列分析和粒子群技术的数据预测算法,其特征在于,通过自动聚类算法将多时间序列生成不同的区间长度,并划分粒度空间;然后,对不同粒度空间中的模糊趋势进行预测;最后利用各粒度空间的预测模糊趋势和粒子群技术得到的最优加权向量,计算出最终预测值。
根据本发明,所述的自动聚类算法将多时间序列生成不同的区间长度是,对于每一个因子,利用模糊趋势逻辑关系组构造模糊趋势矩阵,用于预测因子的模糊趋势。
本发明的基于模糊时间序列分析和粒子群技术的数据预测算法,通过一些模糊不清的词语来表示数据,它不用依赖大量的历史数据,且可以对不完整、不准确和具有含糊性的数据来进行预测,很好的解决了传统时间序列预测模型的问题。因此模糊时间序列预测模型可以很好的处理具有这种特点的数据,同时能够很好的处理非线性时间数据,在处理长期序列预测时也表现出了比较好的效果。
附图说明
图1是本发明的基于模糊时间序列分析和粒子群技术的数据预测算法整体流程框图;
图2是自动聚类算法过程框图;
图3是将类转为区间的过程框图;
图4是PSO算法流程图
图5是自动聚类和划分区间框图;
图6是建立FTLRG框图;
图7是预测模糊趋势框图;
图8是划分粒度空间框图;
图9是预测最终值框图;
图10是IRI时间序列变化趋势图;
图11是各模型预测精度比较图;
图12是Alabama—0103路段趋势图;
图13是Alabama—0163路段趋势图;
图14是Florida—3804路段趋势图;
图15是三个路段的相对误差图。
以下结合附图和实施例对本发明作进一步的详细说明。
具体实施方式
如图1所示,本发明的技术思路是将原始数据通过自动聚类建立模糊趋势逻辑关系组(FILRG),然后预测模糊趋势,通过多个因子选择计算预测模糊趋势,根据多个粒度空间得到最优权重向量,预测,结束。
本实施例给出一种基于模糊时间序列分析和粒子群技术的数据预测算法,通过自动聚类算法将多时间序列生成不同的区间长度,并划分粒度空间;然后,对不同粒度空间中的模糊趋势进行预测;最后利用各粒度空间的预测模糊趋势和粒子群技术得到的最优加权向量,计算出最终预测值。
在该算法中,自动聚类算法将多时间序列生成不同长度的区间是:对于每一个因子,利用模糊趋势逻辑关系组构造模糊趋势矩阵,用于预测因子的模糊趋势。
为了处理不确定性和实现高预测精度,将预测问题的整体(数据)解空间划分为n+1个粒度空间(n为次因子个数),在不同的粒度空间中进行预测。最后,利用预测的模糊趋势和粒子群优化技术进行最终值的预测。
这种预测算法的特点体现在以下两个方面:
1)将预测问题的整体(数据)解空间划分为多个局部粒度空间,并计算不同粒度空间的局部预测模糊趋势,再将所有局部预测模糊趋势结合起来预测最终趋势和值。
2)构造一个n*m模糊趋势矩阵,对各因子进行模糊趋势预测,通过简单的求和和计数操作,充分利用历史模糊趋势。
A、模糊时间序列
U为论域,给定U一个次序分割集为U={u1,u2,...,un},定义A为论域U上的模糊集,并记为:
A=fA(ui)/u1+fA(u2)/u2+...+fA(un)/un
F(t-1)=Ai→F(t)=AjR(t,t-1)
F(t)=F(t-1)Ai→Aj
其中:fA是定义在A上模糊隶属度函数,fA:U→[0,1]。fA(ui)表示ui在模糊集A上的模糊隶属度值,并且fA(ui)属于[0,1],1≤i≤n。
对任一固定的(t=...0,1,2,...),设Y(t)属于R,即为实数域的子集,Y(t)上定义一组模糊集,f(t)(i=1,2...)且F(t)={f1(t),f2(t),...},称F(t)为定义在Y(t)上的模糊时间序列。
设R(t,t-1)为定义在从F(t-1)到F(t)的模糊关系,满足F(t)=F(t-1)。R(t,t-1)则称F(t)是由F(t-1)得到的,且可以用模糊逻辑关系F(t-1)→F(t)来表示,其中,表示合成运算的F(t)和F(t-1)都是模糊集,关系R成为定义在F(t)上的一节模糊关系。
令F(t-1)=Ai,F(t)=Aj,则在两个连续的F(t)和F(t-1)可以用一阶模糊关系来表示,记为Ai→Aj,这里Ai称为模糊关系的左件,称Aj为模糊关系的右件。或者称Ai为当前状态,它是某个问题中已知的值。称Aj为下一个状态,它可以通过模型进行预测。
B、粒度计算
粒度计算的思想实质是用简单易求、低成本的足够满意近似解替代精确解,即利用不精确、不完整、不确定和海量信息的可容度实现智能***或智能控制的易处理、鲁棒性、低代价和更好地刻画实现世界。粗略地讲,凡是在分析问题和求解问题中,应用了分组、分类和聚类手段的一切理论与方法均属于粒度计算的范畴。
C、自动聚类算法
自动聚类算法是针对历史数据的分布特点和模型复杂度而提出的,用它来进行区间的划分。为提高模型的预测效果,采用自动聚类算法把数据划分为不同的区间长度。其过程如图2所示,包括原始数据升序排序、计算平均偏差和标准差、计算最大距离,进行分类、将聚类结果转为连续区间,具体步骤如下:
步骤1:按升序对原始数据进行排序,可以表示为d1、d2、d3、…di、…dn。这里,i表示任意数,n表示数据集的总数。其中,d1<d2<…di<…<dn,然后,计算任意两个相邻数据之间的标准差。
第二步,计算最大距离max_distance,如公式(5)所示:
max_distance=c×dev_diff (5)
这里,c取值为0.5。
将升序排序的数据进行聚类,先将d1作为当前类,根据最大距离来判断下一个数据是放在当前类中还是单独聚类。若di+1-di<=max_distance,把di+1放到当前类中,否则创建一个新类,如此重复直到所有数据都被聚类。聚类结果如下式所示:
{d11,...d1a},{d21,...d2b},...{di1,...din},...{dj1,...djm}; (6)
第三步,将聚类结果根据图3所示的规则转换为连续的区间:如此重复就可以将所有聚类转换为连续区间。最后,将第一个区间的下界用其值减去最大距离来代替,最后一个区间的上界用其值加上最大距离来代替。
第四步,计算区间的中间值:
第i个区间的下界如下式所示:
lowi=upperi-1 (7)
第i个区间的上界公式为:
第i个区间中间值公式为:
通过以上步骤,即可以将数据进行聚类并划分区间。
D、粒子群优化算法
粒子群是由一群粒子组成的,这群粒子代表可能存在的解。粒子i在N维空间的位置表示为矢量Xi=(x1,x2,…,xN),飞行速度表示为矢量Vi=(v1,v2,…,vN)。每个粒子都有一个由目标函数决定的适应值(fitness value),并且知道自己到目前为止发现的最好位置(Pbest)和现在的位置Xi。这个可以看作是粒子自己的飞行经验。除此之外,每个粒子还知道到目前为止整个群体中所有粒子发现的最好位置(Pgbest,Pgbest是Pbest中的最好值),这个可以看作是粒子同伴的经验。粒子就是通过自己的经验和同伴中最好的经验来决定下一步的运动。PSO初始化为一群随机粒子(随机解)。然后通过迭代找到最优解。在每一次的迭代中,粒子通过跟踪两个“极值”(Pbest,Pgbest)来更新自己。在找到这两个最优值后,粒子通过下面的公式(10)和(11)来更新自己的速度和位置。
Vi,t=ω×Vi,t-1+C1×r1×(Pbes,ti-Wi,t-1)+C2×r2×(Pgbest-Wi,t-1) (10)
Wi,t=Wi,t-1+Vi,t (11)
其中,Vi,t和Wi,t分别代表在第t次迭代中第i个粒子的速度和位置,ω是惯性加权系数,C1是个体经验学习因子,C2是社会经验学习因子,r1和r2是正态分布随机数,介于(0,1)之间。本实施例中,取ω=1,C1=C2=2。
对于图4的PSO算法流程图,标准PSO算法可以简单分为以下四步:
1、初始化种群(包括种群数量,每个粒子的初始位置和速度);
2、通过目标函数计算每个粒子的适应度;
3、根据公式(7)和式(8)更新每个粒子的速度和位置;
4、若满足终止条件则输出全局最优解。
E、多粒度组合预测模型
第一阶段,基于自动聚类算法为每个因子划分区间(图5)。把每个因子的数据按升序进行排序,聚类,把论域分为不同的区间长度。
第二阶段,分为四个子过程:定义模糊集,模糊化数据,给每个因子建立二阶逻辑模糊关系(FLR)以及为模糊趋势逻辑关系组(FTLRG);
第三阶段,在建立的FTLRG基础上,来构建模糊趋势矩阵,并预测每一个因子的模糊趋势;
第四阶段,把全局解空间划分为n+1个粒度空间,并预测每个粒度空间的模糊趋势和预测值;
第五阶段,建立训练集找最优权重向量,并计算最终预测值;
以下是发明人给出具体实施例。
第一部分:基于模糊时间序列分析和粒子群技术的数据预测算法完整步骤:
第一阶段,基于自动聚类算法为每个因子划分区间(图5)。把每个因子的数据按升序进行排序,聚类,把论域分为不同的区间长度。
第二阶段,分为四个子过程:定义模糊集,模糊化数据,给每个因子建立二阶逻辑模糊关系(FLR)以及为模糊趋势逻辑关系组(FTLRG)。如图6所示。
(1)定义主因子模糊集和次因子模糊集
(2)模糊化历史数据:
确定每个历史数据所属的模糊集,如果数据属于区间ui,则放在模糊集Ai中,如果属于区间vj,k,则放到模糊集Bj,k中。
(3)基于上述模糊历史数据给每个因子建立二阶模糊逻辑关系(FLR)
假设在t-2,t-1和t时刻主因子的模糊历史数据对应的模糊集分别为Ai2,Ai1和Am,则二阶模糊逻辑关系为Ai2,Ai1→Am,同理次因子相应的FLR为Bj,k2,Bj,k1→Am。
(4)通过FLR建立模糊趋势逻辑关系组(FTLRG)
t-2和t-1时刻对应的模糊历史数据称为当前状态,t时刻的数据称为下一状态。由于FLR的表示为Ai2,Ai1→Am和Bj,k2,Bj,k1→Am,则:当i2>i1(或k2>k1),此FLR归为组1;当i2=i1(或k2=k1),归为组2;当i2<i1(或k2<k1),归为组3。
逻辑关系组的表示如下表1所示。
表1:模糊趋势逻辑关系组
分组 | i2(k2)和i1(k1)关系 |
组1 | 下降 |
组2 | 不变 |
组3 | 上升 |
第三阶段,在建立的FTLRG基础上,来构建模糊趋势矩阵,并预测每一个因子的模糊趋势(图7)。
表2:模糊趋势矩阵
表2为一个3*6的趋势矩阵,对于每个因子都可以得到一个3*6的模糊趋势矩阵。如表中所示,Sd(i)为组i中所有二阶逻辑模糊关系中呈下降趋势的总和,Nd(i)呈下降关系的个数;同理,Se(i)为呈不变趋势的总和,为个数;为呈上升趋势的总和,Nu(i)为个数。
具体统计如下:以主因子为例,二阶模糊逻辑关系表示为Ai2,Ai1→Am,若i1>m,则Sd(i)就增加mid_valuem-mid_valuei1,Nd(i)数量相应加一;i1=m,则Se(i)为0,Ne(i)数量相应加一;i1<m,则Su(i)就增加mid_valuem-mid_valuei1,Nu(i)数量相应加一。
当前状态的模糊逻辑关系属于组i,则下一状态的模糊预测趋势则如下式(13)所示:
第四阶段,把全局解空间划分为n+1个粒度空间,并预测每个粒度空间的模糊趋势和预测值(图8)。其中,n是次因子的数量,则划分规则为:
第1个粒度空间:只有主因子;
第2个粒度空间:主因子和1个次因子;
第3个粒度空间:主因子和2个次因子;
第n+1个粒度空间:主因子和n个次因子。
分别计算每个粒度空间中的模糊趋势和预测值,则第m+1个粒度空间中模糊趋势Δm+1和预测值Rm+1(t)的计算公式分别为:
Rm+1(t)=R(t-1)+Δm+1 (17)
其中,R(t-1)为原始数据中t-1时刻主因子对应的值,ΔM为主因子的模糊预测趋势,为第j个次因子的模糊预测趋势,rj为主因子平均趋势变化向量VM=(Sd(i)/Nd(i),Se(i)/Ne(i),Su(i)/Nu(i))和第j个次因子平均趋势变化向量VS(j)=(Sd(k)/Nd(k),Se(k)/Ne(k),Su(k)/Nu(k))之间的相关系数。
第五阶段,建立训练集找最优权重向量,并计算最终预测值(图9)。
首先建立训练集T=(X,Y),其中,X是由前p天每个粒度空间中的预测值所构成的矩阵,Y是由前p天的原始数据真实值构成的向量。如下式(18)所示:
n+1代表粒度空间的数量,Rm+1(t-i)表示第i天在第m+1个粒度空间中的预测值,R(t-i)表示第i天的真实值。
训练集建立好之后,通过粒子群优化算法找出最优权重向量。
在n+1个粒度空间中产生q个粒子,第i个粒子的位置Wi是由wi,1,wi,2,...,wi,n+1组成,并且wi,j∈[0,1],1≤j≤n+1,wi,1+wi,2+...+wi,n+1=1。
第i个粒子的速度Vi是由vi,1,vi,2,...,vi,n+1组成,并且vi,j∈[-1,1],1≤j≤n+1。
一开始,q个粒子的初始位置和速度是随机产生的,Pbest,i指第i个粒子目前为止发现的最好位置,初始化时令Pbest,i等于初始的位置向量,然后开始进行迭代更新,对于每一次迭代,都要计算每个粒子的适应度,第i个粒子的适应度函数f为式(19)所示,其中,1≤i≤q。
Pbest,i为个体最好位置的位置向量,Pgbest为全局最好位置的位置向量。每次迭代时,若当前粒子的适应度比Pbest,i的适应度小,就让当前那组Wi等于Pbest,i的那组向量(即最终找的是每个粒子所有迭代中的适应度最大的那组值),如果Pbest,i的适应度小于Pgbest,就让Pgbest=Pbest,i,(即Pgbest找的是所有Pbest,i中适应度最小的那组值)。
利用式(9)和式(10)更新Wi和Vi,通过不断迭代更新,可以找到全局最好位置向量Pgbest,并将其作为最优权重向量W=(w1,w2,...,wn+1)。
最后,根据最优权重向量来计算最终预测趋势Δz和最终值FR(t),公式(20)和公式(21)如下所示:
FR(t)=R(t-1)+Δz (21)
其中,Δi+1为第i+1个粒度空间中的模糊趋势;Δz为最终预测趋势,该值大于0表明下一预测状态呈上升趋势,该值等于0表明当前状态和下一状态的值保持不变,该值小于0表明下一状态呈下降趋势。
第二部分:具体应用实例
本应用实例使用的数据是长期路面性能数据库LTPP中的IRI数据,选取安大略省中SHRP_ID为0901路段的IRI数据,节选部分IRI原始数据如表3所示,用图表示其整体趋势如图10所示。从图10中可以看出,随着年份的增长,IRI值整体呈上升趋势,则说明随着年份的使用,路面性能状况逐渐下降。
首先将数据按时间由小到大进行排序,并把IRI_AVERAGE作为主因子,IRI_LEFT_WHEEL_PATH和IRI_RIGHT_WHEEL_PATH分别作为两个次因子进行预测下一个时间的IRI值。这里,预测的因子称为主因子,而其他因子则称为次因子。
表3:部分IRI原始数据
SHRP_ID | VISIT_DATE | IRI_AVERAGE | IRI_left_WHEEL_PATH | IRI_right_WHEEL_PATH |
0901 | 08/07/1997 | 1.07099998 | 0.964999974 | 1.177000046 |
0901 | 08/07/1997 | 1.080000043 | 0.953999996 | 1.20599997 |
0901 | 08/07/1997 | 1.100999951 | 0.968999982 | 1.23300004 |
0901 | 08/07/1997 | 1.105999947 | 0.968999982 | 1.243000031 |
0901 | 08/07/1997 | 1.082999945 | 0.975000024 | 1.190999985 |
0901 | 10/15/1998 | 1.080000043 | 0.944000006 | 1.215999961 |
0901 | 10/15/1998 | 1.085999966 | 0.952000022 | 1.218999982 |
0901 | 10/15/1998 | 1.103000045 | 0.958000004 | 1.248999953 |
0901 | 10/15/1998 | 1.072000027 | 0.962000012 | 1.182000041 |
0901 | 10/15/1998 | 1.088000059 | 0.954999983 | 1.220999956 |
0901 | 05/05/1999 | 1.075999975 | 0.992999971 | 1.159000039 |
0901 | 05/05/1999 | 1.070000052 | 0.949000001 | 1.190999985 |
1、运用自动聚类算法划分论域
基于以上数据,首先把原始数据按升序排序。计算图10中的主因子(图中b曲线)IRI_AVERAGE的平均偏差为0.0438,标准差为0.1571,次因子(图中a曲线)IRI_LEFT_WHEEL_PATH的平均偏差为0.0275,标准差为0.0987,次因子(图中c曲线)IRI_RIGHT_WHEEL_PATH的平均偏差为0.0634,标准差为0.2110,利用程序聚类并划分论域区间。
最终划分论域的结果如表4所示:
表4:论域划分的结果
2、定义模糊集并建立模糊趋势逻辑关系组
主因子定义的模糊集如图所示。根据二阶逻辑模糊关系来建立逻辑趋势逻辑关系组。FTLRG如表5所示。
A1=1/u1+0.5/u2+...+0/u7
A2=0.5/u1+1/u2+...+0/u7
.....
A7=0/u1+0/u2+...+0/u7
表5:逻辑趋势逻辑关系组
3、建立模糊关系矩阵,预测每一个因子的模糊趋势
根据表2建立三个因子的模糊趋势矩阵,结果如表6(a),表6(b)和表6(c)所示,根据公式(13)得:
Δ主=0.688Δ次1=0.127Δ次2=0.030,分别代表三个因子的模糊趋势(表6),其值均大于0,表示均呈上升趋势。
表6(a):IRI_AVERAGE的模糊趋势矩阵
表6(b):IRI_LEFT_WHEEL_PATH的模糊趋势矩阵
表6(c):IRI_RIGHT_WHEEL_PATH的模糊趋势矩阵
4、划分粒度空间,预测每个粒度空间的模糊趋势和值
根据上述的数据,有三个因子,所以划分三个粒度空间。
第一个粒度空间只包括主因子IRI_AVERAGE;
第二个粒度空间包括主因子IRI_AVERAGE和次因子IRI_LEFT_WHEEL_PATH;
第三个粒度空间为主因子IRI_AVERAGE、次因子IRI_LEFT_WHEEL_PATH和次因子IRI_RIGHT_WHEEL_PATH三个因子。根据公式(14)到公式(17),可以计算出三个粒度空间分别的模糊趋势和值。
Δ1=0.688 Δ2=0.4145 Δ3=0.248
R1(t)=3.684 R2(t)=3.411 R3(t)=3.244
5、用粒子群算法找到最优加权向量
选择20个粒子和1000次的迭代,利用公式(9)和公式(10)不断迭代更新,找出最优权重向量w=(0.26,0.11,0.63),通过公式(20)和公式(21)计算出最终值,即:
Δz=0.26*0.6875+0.11*0.4145+0.63*0.2477=0.3804,
FR(t)=2.996+0.3804=3.3764。
根据对IRI进行预测,可以发现该模型可以预测IRI的下一个状态是呈上升还是下降趋势,并同时可以预测其下一个状态的值。
6、对比实验及分析
采用均方根误差(RMSE)和相对误差(RE)来说明模型的预测精度,RMSE和RE的值越小,则说明模型精度越高,RMSE和RE的公式表示分别为:
其中,n为预测数据的数量,Forecastedt代表预测值,Actualt代表真实值,1≤t≤n。
将本实施例提出的模型与多项式拟合模型、ARIMA模型以及BP神经网络模型的预测结果进行对比,各模型的预测精度比较结果如图11所示。
从图11中可以看出,本实施例的模型的相对误差为6.37%,RMSE为0.191,均为最小,即说明实施例的模型要优于其他三种模型。
为了进一步证明本实施例模型的有效性,发明人另选取了其他三组IRI数据进行预测,分别为阿拉巴马州SHRP_ID为0103和0163的路段,以及佛罗里达州SHRP_ID为3804的路段。三组数据的IRI时间序列变化趋势如图12至图14所示,从这些图中可以看出数据基本较为平稳,3804路段的IRI值从2002年以后呈下降趋势。预测下一时间的IRI值分别为0.8272,0.8956和0.9891,用公式22可以计算其整体的RMSE为0.161,与真实值之间的相对误差如图15所示,从图中可以看出相对误差基本稳定在2%左右,因此得出结论,本实施例提出的模型具有较高的预测精度。
Claims (2)
1.一种基于模糊时间序列分析和粒子群技术的数据预测算法,其特征在于,通过自动聚类算法将多时间序列生成不同的区间长度,并划分粒度空间;然后,对不同粒度空间中的模糊趋势进行预测;最后利用各粒度空间的预测模糊趋势和粒子群技术得到的最优加权向量,计算出最终预测值。
2.如权利要求1所述的算法,其特征在于,所述的自动聚类算法将多时间序列生成不同的区间长度是,对于每一个因子,利用模糊趋势逻辑关系组构造模糊趋势矩阵,用于预测因子的模糊趋势。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010913459.6A CN112215396A (zh) | 2020-09-03 | 2020-09-03 | 一种基于模糊时间序列分析和粒子群技术的数据预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010913459.6A CN112215396A (zh) | 2020-09-03 | 2020-09-03 | 一种基于模糊时间序列分析和粒子群技术的数据预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112215396A true CN112215396A (zh) | 2021-01-12 |
Family
ID=74049015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010913459.6A Pending CN112215396A (zh) | 2020-09-03 | 2020-09-03 | 一种基于模糊时间序列分析和粒子群技术的数据预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215396A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116485075A (zh) * | 2023-04-23 | 2023-07-25 | 国网江苏省电力有限公司南通市海门区供电分公司 | 一种基于fts的电网负荷预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023071A (zh) * | 2015-08-14 | 2015-11-04 | 中国科学院重庆绿色智能技术研究院 | 一种基于高斯云变换和模糊时间序列的水质预测方法 |
CN105185106A (zh) * | 2015-07-13 | 2015-12-23 | 丁宏飞 | 一种基于粒计算的道路交通流参数预测方法 |
CN109118009A (zh) * | 2018-08-24 | 2019-01-01 | 山东师范大学 | 基于极坐标模糊信息粒的时间序列预测方法、***及介质 |
-
2020
- 2020-09-03 CN CN202010913459.6A patent/CN112215396A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105185106A (zh) * | 2015-07-13 | 2015-12-23 | 丁宏飞 | 一种基于粒计算的道路交通流参数预测方法 |
CN105023071A (zh) * | 2015-08-14 | 2015-11-04 | 中国科学院重庆绿色智能技术研究院 | 一种基于高斯云变换和模糊时间序列的水质预测方法 |
CN109118009A (zh) * | 2018-08-24 | 2019-01-01 | 山东师范大学 | 基于极坐标模糊信息粒的时间序列预测方法、***及介质 |
Non-Patent Citations (5)
Title |
---|
刘君;赵立进;黄良;曾华荣;张迅;彭辉;: "基于改进模糊时间序列的变压器油中气体预测方法", 武汉大学学报(工学版), no. 05, pages 116 - 121 * |
张泽国;尹建川;胡江强;柳成;: "基于灰色模型粒子群优化算法的自适应神经模糊推理***模型的船舶横摇运动预报分析", 科学技术与工程, no. 33, pages 129 - 134 * |
王国胤等: "知识与数据双向驱动的多粒度认知计算", 西北大学学报(自然科学版), vol. 48, no. 4, pages 488 - 500 * |
田宗浩;王鹏;: "基于K均值粒子群算法的模糊时间序列", 江苏师范大学学报(自然科学版), no. 03, pages 55 - 58 * |
邓伟辉: "时间序列的多粒度智能分析方法研究", 中国博士学位论文全文数据库信息科技辑(月刊), no. 07, pages 140 - 43 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116485075A (zh) * | 2023-04-23 | 2023-07-25 | 国网江苏省电力有限公司南通市海门区供电分公司 | 一种基于fts的电网负荷预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Fuzzy time series forecasting based on fuzzy logical relationships and similarity measures | |
CN111260118B (zh) | 一种基于量子粒子群优化策略的车联网交通流量预测方法 | |
Froelich et al. | Fuzzy cognitive maps in the modeling of granular time series | |
Wang | Predicting tourism demand using fuzzy time series and hybrid grey theory | |
Enke et al. | Stock market prediction with multiple regression, fuzzy type-2 clustering and neural networks | |
Hakimi-Asiabar et al. | Deriving operating policies for multi-objective reservoir systems: application of self-learning genetic algorithm | |
CN106448151B (zh) | 一种短时交通流预测方法 | |
Atef et al. | A comparative study using deep learning and support vector regression for electricity price forecasting in smart grids | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN109472088B (zh) | 一种页岩气调产井生产压力动态预测方法 | |
Poczęta et al. | Learning fuzzy cognitive maps using structure optimization genetic algorithm | |
CN110097088A (zh) | 一种基于迁移学习与特殊点策略的动态多目标进化方法 | |
Mustafa et al. | A new fuzzy grach model to forecast stock market technical analysis | |
Xuemei et al. | Particle swarm optimization-based LS-SVM for building cooling load prediction | |
CN112381334A (zh) | 基于多因素模糊时间序列的高陡边坡形变趋势预测的方法 | |
CN113052373A (zh) | 一种基于改进elm模型的月径流变化趋势预测方法 | |
Fan et al. | Adaptive partition intuitionistic fuzzy time series forecasting model | |
CN111723523A (zh) | 一种基于级联神经网络的河口余水位预测方法 | |
Akpinar et al. | Forecasting natural gas consumption with hybrid neural networks—Artificial bee colony | |
Barr et al. | A computational theory of the firm | |
CN112215396A (zh) | 一种基于模糊时间序列分析和粒子群技术的数据预测算法 | |
Van Tinh et al. | A new hybrid fuzzy time series forecasting model based on combining fuzzy c-means clustering and particle swam optimization | |
Nishad et al. | Hesitant fuzzy time series forecasting model of higher order based on one and two-factor aggregate logical relationship | |
Peng et al. | An extreme learning machine and gene expression programming-based hybrid model for daily precipitation prediction | |
Chouikhi et al. | Adaptive extreme learning machine for recurrent beta-basis function neural network training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |