Eviews操作入门输入大数据对大数据进行描述统计和画图.docx |
您所在的位置:网站首页 › eviews股票价格的分析与预测 › Eviews操作入门输入大数据对大数据进行描述统计和画图.docx |
Eviews操作入门输入大数据对大数据进行描述统计和画图.docx Eviews操作入门输入大数据对大数据进行描述统计和画图 Eviews操作入门: 输入数据,对数据进行描述统计和画图 首先是打开Eviews软件,可以双击桌面上的图标,或者从windows开始菜单中寻找Eviews,打开Eviews后,可以看到下面的窗口如图F1-1。 图F1-1Eviews窗口 关于Eviews的操作可以点击F1-1的Help,进行自学。 打开Eviews后,第一项任务就是建立一个新Workfile或者打开一个已有的Workfile,单击File,然后光标放在New上,最后单击Workfile。 如图F1-2 图F1-2 图F1-2左上角点击向下的三角可以选则数据类型,如同F1-3。 数据类型分三类截面数据,时间序列数据和面板数据。 图F1-3 图F1-2右上角可以选中时间序列数据的频率,见图F1-4。 图F1-4 对话框中选择数据的频率: 年、半年、季度、月度、周、天(5天一周或7天1周)或日内数据(用integerdata)来表示。 对时间序列数据选择一个频率,填写开始日期和结束日期, 日期格式: 年: 1997 季度: 1997: 1 月度: 1997: 01 周和日: 8: 10: 1997表示1997年8月10号,美式表达日期法。 8: 10: 1997表示1997年10月8号,欧式表达日期法。 如何选择欧式和美式日期格式呢? 从Eviews窗口点击Options再点击datesandFrequencyconversion,得到窗口F1-5。 F1-5的右上角可以选择日期格式。 图F1-5 假设建立一个月度数据的workfile,填写完后点OK,一个新Workfile就建好了。 见图F1-6。 保存该workfile,单击Eviews窗口的save命令,选择保存位置即可。 图F1-6 新建立的workfile之后,第二件事就是输入数据。 数据输入有多种方法。 1)直接输入数据,见F1-7 在Eviews窗口下,单击Quick,再单击Emptygroup(editseries),直接输数值即可。 注意在该窗口中命令行有一个Edit+/-,可以点一下Edit+/-就可以变成如图所示的空白格,输完数据后,为了避免不小心改变数据,可以再点一下Edit+/-,这时数据就不能被修改了。 F1-7 2)从文本文件和数据表输入数据,见图F1-8 在Workfile窗口下,单击Procs/import/readtex-lotus-excel F1-8文本文件和数据表输入数据 选择需要输入数据的文件。 我们选择的数据在移动存储上,如果数据是文本文件格式,点击打开命令,会得到窗口F1-9;如果是数据表文件会得到窗口F1-10。 图F1-9 F1-9下方的最大的白框中是对数据的预览,可以看到有3列数字,数据按列排列。 第一行是变量名,从第二行开始是数据。 我们要作的工作是在左上方填入变量名,名称可以与数据源中的名称不同,变量名用空格隔开。 然后是左变中间的白框,填入数据前的说明文字占的行数,默认是1,如本例,如果还有一些其他说明例如数据来自统计局等,可能会有2行说明文字,这时把1修改成2。 总之要数据前面的文字部分所占的行数填写在此。 第一列数据是年份,第二列数据是月份,第三列数据是股票价格,希望读入价格,在右上方colums填入2,如图F1-9,会跳过前面两列数据,只读入第三列数据。 按OK数据已经输入该工作文件。 如果数据保存在EXCEL表中,得到图F1-10.需要给出第一个数据在EXCEL表中的位置,通常在B2的位置。 然后在左边中间的白框填写变量名,这里填写的变量名是在Eveiws中的名称,可以与数据表的变量名不同。 不同变量用空格隔开,输几个变量名,会输入几列相邻排列的数据。 在程序中进行操作后,从模型可以计算出一些数据,或者对原有数据进行了变换,可以从Eviews中输出这些数据。 首先选中希望输出的变量名,点击workfile窗口中的proc,选择export从中选择输出数据格式,常用的是最后一个选项保存为文本格式或者EXCEL表格式。 见F1-11。 如果保存成文本格式,只要直接保存即可。 如果保存成EXCEL格式,会弹出窗口F1-12,给出数据在EXCEL表中的排列。 可以修改变量排列的顺序和第一个数据保存的位置,然后保存即可。 图F1-10 F1-11 图F1-12 输入数据后,对数据进行描述性分析。 建立了workfile,并且输入了数据。 可以进行你想作的工作了。 本章主要是对数据进行描述统计,了解数据的统计特征,以方便后面的建模。 下面我们结合描述统计介绍对Eviews的基本操作。 描述统计的全部的工作就是点击workfile窗口的不同命令。 图F1-13是输入SP500闭盘价的窗口。 图F1-13 F1-13中c是Eviews中自动给出的一个量,用来保存模型估计出的未知参数,resid是用来保存模型的残差序列。 P是我们数据的数据。 改变样本区间 有时我们会分阶段对数据进行分析,例如希望比较2000年前的数据与2000年后的数据的不同,所以不总是对工作窗口中的所有数据进行分析,这时可以改变样本长度。 单击Sample,输入希望的区间,按OK。 改变变量名称 单击需要改变名称的变量选中该变量,变量名变色说明已经选中,把光标放在该变量上右击,选中rename输入希望的名字即可。 改变workfile的区间 有时会发现因为偶然的错误或需要预测,workfile的长度不够用。 例如我们想对2004: 09到2004: 12进行预测,可是一开始设计的区间是到2004: 08,因此必须扩展区间。 点击Eviews窗口的procs,选择structure/resizecurrentpage,见图F1-14 F1-14 F1-15 对变量进行变换 输入的原始数据经常需要变换形式,例如我们例题中的数据是月度SP500指数,在分析中我们可能希望对收益率进行研究,所以要得到指数收益率数据。 点击genr命令,得到窗口F1-15。 在窗口中输入公式,下面是经常用到的一些运算 加减乘除+-*/ 差分d()求自然对数后差分dlog()自然对数log()指数exp()平方sqr() 滞后运算: price(-1)表示变量名是price的一阶滞后 例如用price表示价格指数, 差分d(price)=price-price(-1) 连续收益率 r=dlog(price) 虚拟变量如果收入超过10000,则赋值为1, high_inc=income>10000 对计算得到的收益率变量进行描述统计 进行描述性分析: 双击变量,打开一个新窗口;单击View见F1-16: 1)Spreadsheet数据以列表形式出现;Line直线图;Bar柱图 2)DescriptiveStatistics/HistogramandStats做直方图和计算各样本统计量 3)DistributionGraphs/Quantile-Quantile画Q-Q图 F1-16 F1-17 图F1-17是划折线图的选项,背景是画出的折线图。 DescriptiveStatistics/HistogramandStats做直方图和计算各样本统计量结果如图F1-18。 JB检验在图F1-18右下角处,该组数据服从正态分布。 F1-18 EVIEW操作指南: 建立ARMA模型 使用美国三个月期国债利率,时间1954年1月到2007年10月,周数据。 利率用百分数表示。 周数据输入只要输入1954/1/12007/10/4来表示1954年一月第一周到2007年10月第4周,Eviews会自动匹配相应时间,债券利率命名为tbillrate,数据输入后见图F4-1。 F4-1: 建立ARMA模型图1. 输入数据后,首先观察数据的折线图和样本自相关函数图和偏自相关函数图。 分别见图F4-2和图F4-3。 从图F4-2和图F4-3,数据不频繁穿过某一水平线,样本自相关函数图收敛速度非常慢,都意味着TBILLRATE是非平稳的,因此把数据进行一次差分,然后再观察折线图和样本自相关函数图和偏自相关函数图。 图F4-2: TBILLRATE折线图 图F4-3: TBILLRATE样本自相关函数和偏自相关函数图 图F4-4: 差分后数据的折线图 图F4-5: r的样本自相关函数和偏自相关函数图 画样本自相关函数图的命令是双击时间序列数据r的名字,点view-correlogram见图F4-6,可以得到样本自相关函数和偏自相关函数的图形和数值,见图F4-5。
F4-6: 画样本自相关函数的命令 从图F4-4可以看出数据围绕一条水平线波动,已经平稳化。 并且具有一簇一簇的特征,这种特征叫波动率聚类性,下一章对这种特性建立模型。 本章先忽略这一特点。 下面可以对r建立ARMA模型了。 点击workfile窗口的object命令,选择equation,输入equation的名称armatemp,得到窗口F4-6。 F4-7: 建立ARMA模型的窗口 下面是输入模型的几个例子。 例如建立一个AR (1)模型可以如下输入: rcr(-1) 等价于模型: 或者输入: rcar (1) 等价于模型: 两种输入方法估计结果的区别是后者的c是r的均值,而前者的c是回归模型的截距项,斜率估计值相同。 建立ARMA(1,1)模型可以如下输入 rcr(-1)ma (1) 等价于模型: rcar (1)ma (1) 等价于模型: 如果滞后长度比较长,例如AR(6)模型可以如下输入 rcr(-1to-6) 等价于模型: 如果滑动平均部分包括很多滞后项,只能分别写出,例如一个MA(4)模型: rcma (1)ma (2)ma(3)ma(4) 建立乘法季节模型可以如下输入: yar (1)ar (2)sar(4) 等价于下面的模型 yma (1)ma (2)sma(4) 等价于下面的模型 输入模型的表达式后,可以在sample部分修改估计样本的区间。 使用2000年12月29号的数据到2007年9月28号的周数据建立模型。 根据样本自相关函数建立模型ARMA(5,1),见图F4-7,估计结果见图F4-8: F4-8: ARMA(5,1)估计结果 其中Akaikeinfocriterion是AIC准则,Schwarzcriterion是BIC准则。 去掉不显著的解释变量,最终模型见图F4-9。 模型估计结束后,可以点击equation窗口的view-actual,fitted,residual得到真实值,拟和值和残差图形;点击procs然后选择makeresidualseries可以保存残差。 点击view选择residualtests再选择Qtest可以检验残差是否是白噪声过程。 见图F4-10。 图F4-9: 最终ARMA(5,1)模型。 图F4-10: Q检验命令 图F4-11: Q检验结果 F4-11是Q检验结果,Q检验的p值都大于5%,在5%显著水平上,说明这时残差是白噪声过程。 预测2007年9月29号到2007年10月11日的周数据进行样本外预测,选择staticforecast,预测值保存在rf中。 见图F4-12。 预测图形见图F4-13.
图F4-12: 预测的设置 图F4-13 因为原始数据是债券利率是非平稳的,因此对差分后的数据建立模型,如果希望直接对债券利率进行预测,可以如F4-14输入模型公式。 在这种输入方式下,模型估计后进行预测的窗口见图F4-15。 在F4-15中,预测有两个选项一个是TBILLRATE,一个是D(TBILLRATE)。 选择TBILLRATE可以直接对债券利率预测。 图F4-14: 用原始数据输入模型 使用AIC准则建立AR(P)模型定阶的程序: 'subroutineend是子程序,laglength是子程序名称,该子程序调用时需要给出两个量,一个是常数最大滞后长度,一个是对哪个时间序列建立模型。 subroutinelaglength(scalarmaxlag,seriesr) 'thefollowingfornextloopwillcomputetheAICandBIC for! i=1tomaxlag equationeq{! i}.lsrcr(-1to-! i) scalaraicl! i=eq{! i}.@aic scalarbicl! i=eq{! i}.@schwarz next 'tablewillmakeatabletoincludetheresults 'firsttherowthethecolumthetable'snameislaglength table(maxlag+1,3)laglength '表格的宽度第1列2个字符,第2列,2列9个字符 Setcolwidth(laglength,1,2) Setcolwidth(laglength,2,9) Setcolwidth(laglength,3,9) '表格内填的数字,第1行2列写入AIC,1行3列写入BIC Setcell(laglength,1,2,"AIC") Setcell(laglength,1,3,"BIC") '第2行到最后一行写入1到最大滞后长度 for! i=1tomaxlag Setcell(laglength,! i+1,1,@str(! i)) next '分别把相应AIC填入相应位置 for! i=1tomaxlag Setcell(laglength,1+! i,2,aicl! i) Setcell(laglength,1+! i,3,bicl! i) next '去掉不需要的结果 for! i=1tomaxlag deleteaicl! ibicl! ieq! i next endsub '调用子程序,假设滞后长度8,对r进行分析 calllaglength(8,r) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |