基于ARIMA

您所在的位置:网站首页 garch-m模型 基于ARIMA

基于ARIMA

2024-04-10 19:01| 来源: 网络整理| 查看: 265

城市交通拥堵问题日益加剧, 可靠的短时交通流预测在智能交通系统中变得愈加重要, 精确的交通流预测可协助交通管理者和智能交通系统制定政策以缓解交通拥堵, 因此对短时交通流进行预测是具有重要意义的.短时交通流预测的精度直接关系到交通管控的效果, 然而交通流内部固有的复杂性、不确定性和非线性是高精度短时交通流预测需要克服的难点问题[1, 2].

目前, 传统的短时交通流预测的方法主要有:1)时间序列分析模型, 如ARIMA模型[3]、季节性差分自回归滑动平均模型(Seasonal Autoregressive Integrated Moving Average, SARIMA)模型[4]以及卡尔曼滤波[5]; 2)机器学习方法, 如K最近邻分类算法[6]、BP神经网络方法[7]、径向基神经网络方法[8]、小波神经网络方法[9]及模糊神经网络方法[10]等.然而在预测交通流时, 假定交通流为线性或者非线性难以获得较高的预测精度[11].目前对于短时交通流预测的研究主要集中在利用深度学习方法[12]和线性与非线性模型结合的方法[13, 14, 15], 文献[14]构建了ARIMA-SVR混合模型进行短时交通流预测, 时间序列模型和支持向量回归模型分别对交通流的线性和非线性部分进行建模, 获得了较好的预测效果.文献[15]利用贝叶斯方法将时间序列模型、BP神经网络方法及卡尔曼滤波方法结合, 构建了一种线性与非线性模型结合的短时交通流预测方法.然而目前的研究对于交通流时间序列中的异方差性问题的关注较少.交通流时间序列具有典型的尖峰肥尾特性, 利用传统的正态分布来估计残差存在一定的缺陷.因此, 为了克服传统模型的缺点, 研究短时交通流预测算法, 探讨交通流时间序列的异方差性, 利用广义误差分布(Generalized Error Distribution, GED)模型来估计残差, 对精确进行短时交通流具有十分重要的意义.

本文作者针对以上问题, 考虑交通流时间序列的异方差特性, 构建ARIMA-GARCH-M的混合模型进行短时交通流预测, 基于北京市城市快速路数据对模型进行验证, 结果表明, 本文提出的混合模型可获得较高的预测精度.

1 ARIMA-GARCH-M模型

时间序列模型包括自回归(Auto-Regressive, AR)模型、移动平均(Moving Average, MA)模型和自回归移动平均(Auto-Regressive and Moving Average Model, ARMA)模型.ARMA是一种随机时间序列模型, 能够识别自然界中时间序列结构, 并以最小化协方差矩阵的方式寻找最优的预测值.设时间序列中Xt是一个依赖相邻数据和随机项的函数, 相关表达式为

Xt=∑i=1pφiXt-i+∑j=0qθjat-j(1)

式中:p和q分别为AR和MA的阶数; φ i和θ j是模型的自回归参数和移动平均系数; at-j为随机误差项.

在时间序列分析中, ARIMA是ARMA模型的延伸, 可用来预测非平稳时间序列, ARIMA模型通常定义为ARIMA(p, d, q), 如下

φ(B)∇dXt=θ(B)at(2)φ(B)=1-∑i=1pφiBiθ(B)=1-∑j=1qφjBj(3)(1-B)dXt=Xt-Xt-d=∇dXt(4)

式中:d为平稳化过程中的差分阶数; B为滞后算子.

一般而言, 若时间序列的残差表现异方差性, 为了处理时间序列的异方差性, 文献[15]利用GARCH(Generalized Autoregressive Conditional Heteroscedasticity)模型进行残差分析[15].ARIMA和GARCH模型已成功应用到股市时间序列预测中, ARIMA-GARCH模型被开发后, 在计量经济学中得到广泛应用, ARIMA(p, d, q)-GARCH(u, v)模型定义为

∇dXt=φ0+∑i=1pφi(∇dXt-i)+ut+∑j=1qθiut-j(5)∇Xt=Xt-Xt-1ut=σtεtεt~N(0, 1)(6)σt2=α0+∑i=1μαiut-i2+∑j=1vβjσt-j2(7)∑i=1μαi+∑j=1vβj1(8)

式中:μ 和v分别为GARCH模型和ARCH模型的阶数; ε t为误差项; σt2为时间序列的波动性; α i和β j分别是非负约束中的待定参数.

对于时间序列模型ARIMA(p, d, q), 阶数d由自相关系数(Auto Correlation Function, ACF)和单位根(Automatic Direction Finder, ADF)估计和检验, 阶数q和p分别由ACF和偏自相关系数(Partial Auto Correlation Function, PACF)确定.ACF描述时间序列中现在时刻和历史经验时刻状态之间的关联, PACF在消除中间变量的情况下描述时间序列中现在时刻和经验时刻状态之间的关联.

误差序列的自相关图和偏自相关图可以检验误差序列是否存在ARCH(Autoregressive Condi-tional Heteroscedasticity)效应.如果不存在, 则滞后阶数为0; 如果异方差性存在, 则应该考虑ARCH效应.GARCH模型为ARCH模型的延伸, 模型中加入了前期的波动信息 ut-i2.

为了更好地描述时间序列的分布特征, 假设误差项ε t服从广义误差分布, 广义误差分布的概率密度函数可以标准化为期望为0, 方差为1的形式, 如下

f(εt)=n·exp-12|εt/λ|nλ·21+1n·Γ(1n)(9)λ=2-1nΓ(1/n)Γ(3/n)(10)

式中:Γ (• )是伽马函数; n为描述尾部厚度的参数.当n=2时, ε t为标准正态分布, 当n< 2时, ε t的分布具有比正态分布更厚的尾部, 当n> 2时, ε t的分布尾部比正态分布更薄.

GARCH-M模式是GARCH模型的推广, 在GARCH-M模型中, 除了刻画ε t的方差, 同时将残差项的条件方差特征作为影响序列本身的解释变量, 并引入序列的均值方程中.因此, GARCH-M模型如下

Xt=γyt+ρσt2+ut(11)

式中:yt为外生变量; γ 为未知参数的变量, ρ > 0.

因此, 本文构建的ARIMA-GARCH-M模型为

(1-∑i=1pφiBi)(1-B)dXt=(1-∑j=1qφjBj)εt+ρσt2(12)σt2=α0+α1ut-12+α2ut-22+…+αput-p2+β1σt-12+β2σt-22+…+βqσt-q2(13)

构建ARIMA-GARCH-M混合模型进行短时交通流预测, 具体实施步骤如下:

1) 交通流数据预处理, 包括错误数据的剔除与修复及数据的滤波处理[8];

2)训练ARIMA模型, 根据ACF、PACF及AIC(Akaike Information Criterion)标定ARIMA模型参数;

3)检验ARIMA模型的ARCH效应, 提取并绘制ARIMA模型的残差时序图, 根据时序图的集群现象判别ARCH效应的存在;

4)利用预测误差序列训练GARCH-M模型, 标定模型参数μ 和ν ;

5)利用ARIMA-GARCH-M模型进行交通流预测.

本文利用MAPE(Mean Absolute Percentage Error)、NRMSE(Normalized Root Mean Square Error)及EC(Equal Coefficient)评价模型的预测精度, 如下

MAPE=1N∑i=1N|yi-y∧yi|(14)NRMSE=1N∑i=1N(yi-y∧)2∑i=1Nyi(15)EC=1-∑i=1N(yi-y∧)2∑i=1Nyi2+∑i=1Ny∧i2(16)

式中:yi和 y∧i分别为交通流量的观测值和预测值; N为预测值数量.MAPE表示预测值和实际值之间误差的平均相对值; NRMSE表示预测值和观测值之间的偏差; EC表示预测值和实际值之间的拟合程度.

2 实例验证

为检验本文模型进行短时交通流预测的预测精度, 利用北京城市快速路二环的交通流数据进行验证.选择2006年3月20日至3月23日(均为工作日)4 d的交通流数据, 路段单向3车道, 传感器以10 min为采样周期, 每个传感器每天共采集数据144组.将每个检测断面4天的数据分为两部分, 第1部分包括3 d的数据(3月20日至3月22日), 此部分数据用来训练模型; 第2部分包括第4 d的数据(3月23日), 此部分数据用来预测, 预测过程中, 利用前4个时段交通流量预测该时段流量.图1所示为位于2环检测断面编号2016的3 d的交通流数据.下面将以2016号检测器数据为例详细说明模型构建过程.

图1Fig.1Figure OptionViewDownloadNew Window 图1 交通流量时间序列Fig.1 Traffic flow time series

数据预处理后, 对交通流时间序列进行分析.首先进行平稳性检验和差分过程, 通过散点图、ACF、PACF和ADF进行方差检验和趋势建模是平稳性检验的基础.结果表明, 时间序列的剩余平方和并不是恒定的, 而且变化趋势不是单调的.因此, 时间序列的异方差性得以证明.如果ADF检验统计的值接近0, 时间序列是平稳的.

通过一阶差分处理, 检验统计临界测试值1%, 5%以及10%的水平对应的t-统计量分别为-3.962307, -3.411895和-3.127844.ADF单位根检验t-统计量为-28.85987, 概率为0.结果表明差分效应是存在的.

通过分析ACF和PACF, 利用AIC准则确定ARIMA模型的阶数p和q.根据实验结果, 在1阶与7阶之间AC的值是显著的.选择q=7对于ARIMA模型来说是足够的.同样, 对于PAC在1阶与7阶之间PAC的值是明显的, 从7阶开始PAC值减弱到0附近, 开始变得不再显著.因此, 选择p=7对于ARIMA模型来说是足够的.

本文选择ARIMA模型作为预测模型, 预测ARIMA模型要求交通流时间序列为平稳或者差分平稳, 因此使用基于ADF的单位根检验方法检验时间序列的平稳性.检验结果表明, 原始时间序列不平稳, 一阶差分时间序列是平稳的, 因此选择ARIMA模型进行预测.

利用ARIMA模型建模最重要的过程是确定之后阶数, 本文中利用BIC准则选取阶数.基于BIC准则最优的ARIMA模型确定为ARIMA(7, 1, 7).进行残差自相关检验, 残差序列图如图2所示, 残差自相关检验对于检验ARIMA模型残差是否为白噪声是十分必要的.检验结果表明:残差序列中存在显著的自相关性.本文选择LM检验方法来检验误差序列的ARCH效应.LM检验的零假设为自相关系数为0, 则不存在ARCH效应.P值为接受零假设的概率.LM检验结果表明所有P值等于0, 零假设被拒绝, 因此GARCH-M模型适合用来预测交通流时间序列的条件方差.

图2Fig.2Figure OptionViewDownloadNew Window 图2 时间序列残差Fig.2 Residual error time series square over time

对GARCH-M模型的参数μ 和ν 进行标定.对于GARCH-M模型, 阶数不大于3模型比较稳定, 本文中利用BIC准则确定滞后阶数.结果表明:GARCH-M(1, 1)模型的BIC值为13 117, 小于其他阶数模型, 因此对于本研究是最适用的模型.GARCH-M(1, 1)模型经济学研究中被广泛应用, 本文将其应用到交通流预测中.

图3所示为编号为2016检测断面交通流量预测值与观测值对比, 利用ARIMA-GARCH-M模型获得的预测结果的MAPE、NRMSE及EC值分别为9.61%、0.88%及94.27%.

图3Fig.3Figure OptionViewDownloadNew Window 图3 预测误差Fig.3 Errors of the forecasting results3 模型对比分析

为了检验ARIMA-GARCH-M模型进行短时交通流预测的性能, 利用ARIMA-SVR模型和ARIMA-GARCH模型进行预测作对比.对比模型的详细描述如下.

1)ARIMA-SVR模型[14]:ARIMA模型为ARIMA(7, 1, 7), SVR模型为ε -SVR模型.

2)ARIMA-GARCH模型:ARIMA模型为ARIMA(7, 1, 7), GARCH模型为GARCH(1, 1).

3)ARIMA-GARCH-M模型:ARIMA模型为ARIMA(7, 1, 7), GARCH-M模型为GARCH-M(1, 1).

各模型预测效果如图4所示, 各模型预测性能的评价指标如表1所示.通过对比可知, ARIMA-GARCH-M模型的3项预测指标(MAPE、NRMSE及EC)均优于其他模型, 表明ARIMA-GARCHM模型的预测性能良好.

图4Fig.4Figure OptionViewDownloadNew Window 图4 3种模型预测结果对比Fig.4 Comparison of the forecasting results among 3 models表1Tab.1表1(Tab.1) 表1 模型有效性对比 Tab.1 Comparison of the forecastings results %模型MAPENRMSEECARIMA-SVR10.030.9793.79ARIMA-GARCH9.920.9593.89ARIMA-GARCH-M9.610.8894.27 表1 模型有效性对比 Tab.1 Comparison of the forecastings results %

为验证模型的普适性, 除了上述断面外, 本文选取了位于北京市城市快速路上9个断面进行短时交通流预测, 且分别3种预测方法对各个断面逐个预测, 预测结果的MAPE值如图5所示.

图5Fig.5Figure OptionViewDownloadNew Window 图5 预测结果的MAPE对比Fig.5 MAPE of traffic volumes forecasting

由图5可知:本文模型的预测结果整体上优于其他两个对比模型; ARIMA-SVR模型在断面6处的预测结果优于本文模型和ARIMA-GARCH模型, 但是模型预测结果的稳定性低于ARIMA-GARCH-M模型; 而经过改进的ARIMA-GARCH-M模型的预测精度整体上高于ARIMA-GARCH模型, 证明了本文模型在进行短时交通流预测中预测精度较高.

4 结论

1)提出的混合模型预测结果具有较高的预测精度.构建的ARIMA-GARCH-M模型将线性模型ARIMA和非线性模型GARCH-M模型结合以获得交通流时间序列的异方差性, 因此比其他两种模型更可靠.

2)为了检验混合模型的预测性能, 本文选择ARIMA-SVR模型和ARIMA-GARCH模型与混合模型进行对比, 结果表明, ARIMA-GARCH-M混合模型的预测性能优于其他两个模型.

3)机器学习算法已在诸多领域证明了其预测能力, 将机器学习与既有统计模型结合进行短时交通流预测将是本文下一步的主要研究工作.



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3