用Rstudio进行ARIMA模型预测(小白系列)

您所在的位置:网站首页 ar模型怎么做 用Rstudio进行ARIMA模型预测(小白系列)

用Rstudio进行ARIMA模型预测(小白系列)

2024-07-12 12:30| 来源: 网络整理| 查看: 265

读前告知:阅读本文前,需要带着对应用ARIMA模型的需求,大佬请避让,但欢迎指点本文的不足之处,本文只说明ARIMA模型和用Rstudio应用ARIMA模型进行预测的一些通俗性概念和操作,不会深度讲解定义的来源和相关代码的意义,旨在帮助读者搭建理解ARIMA模型实际应用的桥梁,对于一些刨根问底的求知者请转向大佬区域或自行查阅相关资料。

1.ARIMA模型及相关知识点的介绍 1.1ARIMA模型(p,d,q)

     全称:自回归(AR)差分(I)移动平均模型(MA)。p是自回归项,d是时间序列平稳化是做的差分次数,q是移动平均项。在我们生活中有很多的经济现象都具有一定的规律性或者也会发生周期性的变化,然后我们就会利用一些方法来预测经济的未来发展趋势,其中一种方法就是我们这里提到的ARIMA模型,它的原理就是把非平稳的时间序列通过差分转化为平稳的时间序列,然后。其中ARIMA模型包含了以下几种类型:

 1.1.1自回归模型(AR)    

      在计量经济学中,了解基础的人一般大概知道回归分析,通过回归分析可以考察解释变量与被解释变量之间的相关关系,进一步延申到自回归,自回归没有了回归分析中的一个变量与另一个变量的关系,在时间序列中,自回归只有当前值和历史值之间的关系。所以在AR模型中,它用的是过去一段时间数据对未来发生值的预测。不过,自回归模型需要满足的是所使用的时间序列是平稳的而且不是白噪声。(其中平稳性和白噪声将会在下文说明)

   AR模型有个AR(P)过程 ,简单来说就是P阶自回归过程,回归过程的公式定义:     y_{t}=\mu +\sum_{i=1}^{p}\gamma _{i}y_{t-i}+\epsilon _{t}  ,其中y_{t}是t时刻对应的数据,\mu的常数项,p就是上面说的p阶自回归阶数,\gamma _{i}是自相关系数(相似于回归模型中求解的\beta _{i},在此模型中,随着时间序列越推后,\gamma _{i}会越趋近于0),\epsilon _{t}是误差项。主要表达的是当前期受到过去p期的影响,同时也受到随机干扰项(误差项)的冲击,比如说20年的疫情,也可能存在漂移项的冲击。

1.1.2移动平均模型(MA)

    在自回归模型中,有个误差项,它是不同时期内发生的冲击导致时间序列数据的变异,而移动平均模型就是对这些误差项的累加。MA模型有个q阶移动平均过程,移动平均过程的公式定义:

y_{t}=\mu +\epsilon _{t}+\sum_{i=1}^{q}\theta _{i}\epsilon _{t-i},它表达的是当前期的冲击和(不可观察的)滞后期冲击,通过q值的引入来消除预测中的随机波动;与自回归公式不同之处主要是用当前的冲击和序列的(可以观察到的)之后值来表述

1.1.3自回归移动平均模型(ARMA)

    该模型是AR模型和MA模型的结合;公式:y_{t}=\mu +\sum_{i=1}^{p}\gamma _{i}y_{t-i}+\epsilon _{t}+\sum_{i=1}^{q}\theta _{i}\epsilon _{t-i}

1.2平稳性及其检验

    平稳性可以说是时间序列预测前的一个重要指标,通过平稳性检验的时间序列的均值和方差都不会发生明显变化,它能让时间序列有规律可循,并在未来一段时间依照原有的“惯性”继续下去。

1.3差分法

    差分法的原理是时间序列里t期的值与t-1的值的差,通过这个过程能让时间序列更平稳一些,具体的差分次数在ARIMA模型中表示的是d值

1.4白噪声及其检验

    它的特点表现在任何两个时期的随机变量都不相关,时间序列中不存在任何可以利用的规律,所以白噪声序列不能用过去的数据对未来进行预测,在ARIMA模型开始执行的前几部操作中若检测出白噪声序列就说明该时间序列就不能进行下去了,无法对其预测。

    其中白噪声检验又称纯随机性检验,它的作用在ARIMA模型中担当的是检测拟合出来的ARIMA模型是否是优质模型

1.5自相关函数ACF和偏自相关函数PACF

   ACF表示的是在时间序列中不同时间对应的数值之间的相关性,对应的PACF是描述随机特征的一种方法,具体原理内容较多,不便解释。通过这两个函数的图像可以确定ARIMA模型中p,q的值。

在理解一些相关概念后,我们开始进行ARIMA模型的实际操作

2.R和Rstudio的安装 2.1安装R

    ①进入R的官网

R: The R Project for Statistical Computing

    ② 点击DOWNLOAD下的CRAN

    ③下拉选择China的镜像:

The Comprehensive R Archive Networkhttps://mirrors.tuna.tsinghua.edu.cn/CRAN/    ④点击Download R for Windows,再点击 install R for the first time,最后点击Download R 4.1.1 for Windows下载安装

2.2安装Rstudio 

    ①进入Rstudio官网:

RStudio | Open source & professional software for data science teams - RStudio

    ②下拉窗口找到"DOWNLOAD FREE DESKTOP IDE"并点击进去

    ③下拉窗口找到"Rstudio Dsktop"和"Free",点击"DOWNLOAD"

    ④版本选择windows版

     ⑤注意安装的目标文件夹名称都要是英文

     ⑥更新R包镜像资源,点击Tools下的Global Options,在其中选择Packages,最后点击change更改为国内的服务器

3.Rstudio的ARIMA模型实际操作 3.1简化步骤 3.1.1操作原理 

 (此图片源于B站up不懂数据)

3.1.2操作流程

    平稳性检验→白噪声检验→模型拟合与定阶→模型检验→模型预测

3.2ARIMA实际操作

该例子以2010年1月份到2020年12月份中国钢铁出口贸易额(美元)建立表格,然后导入到Rstudio中建立时间序列,之后进行以下一系列操作.......

3.2.1导入数据

    打开Rstudio软件后,在Console框中输入代码安装相关package包

install.packages("forecast") install.packages("tseries") install.packages("readxl")

    进行数据的导入和相关算法的引入,其中的getwd(C:/Rstudio/project)是确定你需要预测的表格文件所在的地址,如果不对的话可以在getwd()下一行输入例如:setwd(F:/Rstudio/first project),具体所要使用的表格所在地址可以鼠标右击桌面表格,查看表格的属性来获取

library(forecast) library(tseries) library(readxl) getwd() #确定工作文件位置 x


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3