统计学 |
您所在的位置:网站首页 › spss多元线性回归实例 › 统计学 |
前言:
由于spss并不能直接得到最终的主成分回归模型,以下以“发电站需求模型”一题为实例,进行利用spss进行的主成分回归 案例 题目影响电的需求量的指标有: (1)钢的产量x1; (2)生铁产量x2; (3)钢材产量x3; (4)有色金属产量x4; (5)原煤产量x5; (6)水泥产量x6; (7)机械工业总产值x7; (8)化肥产量x8; (9)硫酸产量x9; (10)烧碱产量x10; (11)棉纱产量x11 共11个指标。收集了23年的指标值,建立发电站需求模型。 数据如下:23年指标值,X1~X11为自变量,Y为电量需求 X1X2X3X4X5X6X7X8X9X10X11Y475648.37777202832.27.310.31.211.4326.210.762.611059.613743350033.29.611.82.281.932817.7681256012269380055.612.853.35.391.927.626.835.357.625.64582260024.46.7610.65.361.541124.231.320.623.53891129617.95.0813.75.611.3310.220.135.218.226.55061105224.85.5416.97.511.4714.219.345.323.738.57686100137.87.14348.641.5720.422.949.528.2509526113478.811.260.813.871.9226.628.959.730.569.2105151545101.615.89103.920.052.8633.239.147.819.652.77580128774.910.8688.115.752.4123.939.117.78.117.2233399840.25.131.36.691.5517.626.83610.437.22099134773.313.1447.813.631.5727.237.26229.357.7105891953138.625.5490.918.862.6336.354.19777.978.313004252224731.31137.328.51441.577.495.297.474.612593273327028.7915428.934.2440.284118.4102.258.3109362557233.528.03169.128.243.7638.288.499.986.5507810244020526.5143.622.173.0731.586.3151111110.79400308628838.6118929.175.0346.910810884.176.984762895262.231.46216.526.364.4638.6103162.5138.3132116323678358.646.21405.830.426.2352.5119238.2224202161633794454.855.86542.8507.8356139292.9274.4251.5187963838519.263.77581.356.689.4962.2156329287.6259.2213003898551.161.88632.460.2210.866.8164 SPSS操作及分析 1. 相关性分析及主成分/公因子提取 SPSS操作:分析-降维-因子
提取项选择如图: 由于进行主成分回归分析,为确保所有数据信息均被提取,在此不进行降维,因子数量与自变量数量一致,提取11个因子 1. 相关性分析 因子分析需要变量间有相关性,所以首先要进行相关性检验,首先输出的是变量之间的相关系数矩阵。可以直观看到变量间是存在一定的相关性,如 X1 和 X3 相关性较大。 (1)相关性矩阵
2.提取主成分和公因子 在本例中,公因子方差数据,从表中最后一列可以看出所有原始变量均被提取信息。 接下来输出主成分结果,表中第一列为11个成分,第二列总计项为对应的特征值,表示所解释的方差的大小,第三列为对应的成分所包含的方差占总方差的百分比,第四列为累计的百分比。 接下来输出成分得分系数矩阵: 该因子载荷矩阵并不是主成分的特征向量,即不是主成分的系数。为了获取主成分系数,需要根据该矩阵除以特征根的平方根即可得到主成分表达式, excel 操作在excel中将spss中得到的成分得分系数矩阵分别除以对应特征根的平方根得到以下主成分得分系数矩阵: 变量1234567891011X10.31441-0.052140.00318-0.281040.01261-0.42351-0.23425-0.00395-0.317870.610260.33402X20.302650.294490.03709-0.438830.16076-0.36564-0.25747-0.253230.31081-0.32925-0.36438X30.31018-0.04688-0.17581-0.36586-0.49298-0.022230.58310-0.01771-0.02978-0.278100.27344X40.278310.36951-0.791060.188550.205700.22859-0.07311-0.04499-0.147350.012040.02992X50.251900.720290.492110.143530.030630.193560.213830.137750.061500.164910.14451X60.31096-0.192380.189840.208870.28023-0.02281-0.277050.12172-0.12975-0.565510.52856X70.31153-0.138800.218860.269240.002460.027250.17939-0.51324-0.55942-0.04301-0.39005X80.30764-0.242090.10351-0.25121-0.142150.70716-0.32651-0.224470.247900.181660.03465X90.30340-0.33688-0.033070.143190.52358-0.093580.47170-0.012710.460880.23390-0.01388X100.31451-0.147590.02362-0.132970.010990.10184-0.024120.76355-0.21809-0.02754-0.46760X110.30508-0.05344-0.058830.56659-0.56101-0.27617-0.221680.052460.353210.06622-0.08691 2. 主成分分析 SPSS操作(1)数据描述:数据标准化 SPSS操作: 分析-描述统计-描述 (3)线性分析 1)用SPSS做出𝑦与𝐹1~𝐹11 的散点图 SPSS操作:图形-旧对话框-散点图/点图-矩阵散点图 输出: 用SPSS做出ZY与𝐹1~𝐹11 的正态Q-Q图 SPSS操作: 输出:各正态Q-Q图,总共12个图,此处略,仅展示缩略图 可以看出数据基本符合正态分布 2)线性回归 用SPSS中“分析-回归-线性”,设置ZY(Y标准化后)为因变量,F1~F11为自变量,选择步进,进行多元线性回归 (b)模型检验-残差分析
以上就是大致的过程,对数据的分析过程也许有所疏漏或者错误,望能指出,欢迎评论区交流~ 后续也许能把计算的excel或者整理一份python代码,因为spss确实不算特别方便。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |