采用Minitab进行logistic回归分析 |
您所在的位置:网站首页 › minitab相关性分析图 › 采用Minitab进行logistic回归分析 |
在研究Y与X之间的因果关系时,如果Y不是一个定比或定距变量时,就需要进行logistic回归。logistic回归是一种广义线性回归(generalized linear model)。logistic回归根据Y的取值分为三类:
1 二元 logistic回归 二元logistic回归的基本思想是对取某个类别值的概率p进行logit变换,令: 如果: y=ax+b 则:
2 多元logistic回归 多元logistic回归的基本思想是将取y的某个类别值概率pK作为参照物,将取其他类别值的概率与其相除后取对数,记为yi: 然后对yi进行回归分析得到: yi=𝛃0+𝛃1*x1+𝛃2*x2…… 则:
3 顺序logistic回归 当y是有n(n>2)个取值的定序数据时,分析时可以拆分为n-1个二元logistic回归,分别为(1 vs 2+…+n-1) 、(1+2 vs …+n-1)、(1+…vs n-1),均是较低级与较高级的对比。 logit(p1)=α1+𝛃1*x1+𝛃2*x2+…… logit(p1+p2)=α2+𝛃1*x1+𝛃2*x2+…… y有n个级别,则有n-1个方程。
以下以顺序逻辑回归为例说明在Minitab中如何进行logistic回归分析: 某公司积累了22个项目的历史数据,包括:客户满意度、系统测试时发现的缺陷密度(缺陷个数/功能点)以及项目采用的生命周期模型(瀑布或迭代)。客户满意度为定序刻度,包含 了5个等级:
5很满意 4 满意 3 一般 2 不太满意 1 很不满意 序号 客户满意度 累计测试的缺陷密度 LCM P1 1 1.1121 瀑布模型 P2 3 0.5385 迭代模型 P3 5 0.0000 迭代模型 P4 2 0.6656 瀑布模型 P5 5 0.2443 迭代模型 P6 2 0.6262 瀑布模型 P7 3 0.5767 迭代模型 P8 5 0.2434 迭代模型 P9 5 0.2671 瀑布模型 P10 3 0.7158 迭代模型 P11 4 0.5423 迭代模型 P12 2 1.0438 瀑布模型 P13 1 2.4690 瀑布模型 P14 3 0.7160 瀑布模型 P15 3 0.8739 瀑布模型 P16 2 1.0970 瀑布模型 P17 3 0.8531 迭代模型 P18 3 1.0130 迭代模型 P19 4 0.7168 迭代模型 P20 3 0.6926 瀑布模型 P21 4 0.7792 迭代模型 P22 2 0.9906 瀑布模型
我们拟建立客户满意度与累积测试的缺陷密度和生命周期模型之间的回归关系,因为客户满意度为定序刻度,所以采用有序logistic回归。在Minitab中选中顺序logistic菜单项:
然后设置好模型:
Minitab对上述数据执行分析后,结果如下:
根据上述的结果,可以得到模型如下:
满意度等级 瀑布模型 迭代模型 等级1的概率 1/(1+exp(-(-14.3302+2.78502+9.64861*累计测试缺陷密度))) 1/(1+exp(-(-14.3302-2.78502+9.64861*累计测试缺陷密度))) 等级1和2的概率 1/(1+exp(-(-10.3946+2.78502+9.64861*累计测试缺陷密度))) 1/(1+exp(-(-10.3946-2.78502+9.64861*累计测试缺陷密度))) 等级1,2,3的概率 1/(1+exp(-(-6.33092+2.78502+9.64861*累计测试缺陷密度))) 1/(1+exp(-(-6.33092-2.78502+9.64861*累计测试缺陷密度))) 等级1,2,3,4的概率 1/(1+exp(-(-4.42629+2.78502+9.64861*累计测试缺陷密度))) 1/(1+exp(-(-4.42629-2.78502+9.64861*累计测试缺陷密度))) 当采用了瀑布生命周期模型,累计测试缺陷密度为1时,根据上表可以进行预测: 序号 满意度等级 瀑布模型 1 等级1的概率 0.1305 2 等级1和2的概率 0.8848 3 等级1,2,3的概率 0.9978 4 等级1,2,3,4的概率 0.9997 5 等级2的概率=(2)-(1) 0.7543 6 等级3的概率=(3)-(2) 0.1129 7 等级4的概率=()-(1) 0.0019 8 等级5的概率=1-(4) 0.0003 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |