采用Minitab进行logistic回归分析

您所在的位置:网站首页 minitab相关性分析图 采用Minitab进行logistic回归分析

采用Minitab进行logistic回归分析

2023-09-03 13:23| 来源: 网络整理| 查看: 265

       在研究Y与X之间的因果关系时,如果Y不是一个定比或定距变量时,就需要进行logistic回归。logistic回归是一种广义线性回归(generalized linear model)。logistic回归根据Y的取值分为三类:

 

      1 二元 logistic回归

       二元logistic回归的基本思想是对取某个类别值的概率p进行logit变换,令:

      

如果:

         y=ax+b

则:

        

 

 

       2 多元logistic回归

       多元logistic回归的基本思想是将取y的某个类别值概率pK作为参照物,将取其他类别值的概率与其相除后取对数,记为yi:

       

然后对yi进行回归分析得到:

         yi=𝛃0+𝛃1*x1+𝛃2*x2……

则:

         

 

       3 顺序logistic回归

       当y是有n(n>2)个取值的定序数据时,分析时可以拆分为n-1个二元logistic回归,分别为(1 vs 2+…+n-1) 、(1+2 vs …+n-1)、(1+…vs n-1),均是较低级与较高级的对比。

       logit(p1)=α1+𝛃1*x1+𝛃2*x2+……  

       logit(p1+p2)=α2+𝛃1*x1+𝛃2*x2+……

       y有n个级别,则有n-1个方程。

 

       以下以顺序逻辑回归为例说明在Minitab中如何进行logistic回归分析:

       某公司积累了22个项目的历史数据,包括:客户满意度、系统测试时发现的缺陷密度(缺陷个数/功能点)以及项目采用的生命周期模型(瀑布或迭代)。客户满意度为定序刻度,包含 了5个等级:

 

     5很满意

     4 满意

     3 一般

     2 不太满意

     1 很不满意

序号

客户满意度

累计测试的缺陷密度

LCM

P1

1

1.1121

瀑布模型

P2

3

0.5385

迭代模型

P3

5

0.0000

迭代模型

P4

2

0.6656

瀑布模型

P5

5

0.2443

迭代模型

P6

2

0.6262

瀑布模型

P7

3

0.5767

迭代模型

P8

5

0.2434

迭代模型

P9

5

0.2671

瀑布模型

P10

3

0.7158

迭代模型

P11

4

0.5423

迭代模型

P12

2

1.0438

瀑布模型

P13

1

2.4690

瀑布模型

P14

3

0.7160

瀑布模型

P15

3

0.8739

瀑布模型

P16

2

1.0970

瀑布模型

P17

3

0.8531

迭代模型

P18

3

1.0130

迭代模型

P19

4

0.7168

迭代模型

P20

3

0.6926

瀑布模型

P21

4

0.7792

迭代模型

P22

2

0.9906

瀑布模型

 

       我们拟建立客户满意度与累积测试的缺陷密度和生命周期模型之间的回归关系,因为客户满意度为定序刻度,所以采用有序logistic回归。在Minitab中选中顺序logistic菜单项:

       

然后设置好模型:

 

       Minitab对上述数据执行分析后,结果如下:

 

 

 

 

       根据上述的结果,可以得到模型如下:

 

满意度等级

瀑布模型

迭代模型

等级1的概率

1/(1+exp(-(-14.3302+2.78502+9.64861*累计测试缺陷密度)))

1/(1+exp(-(-14.3302-2.78502+9.64861*累计测试缺陷密度)))

等级1和2的概率

1/(1+exp(-(-10.3946+2.78502+9.64861*累计测试缺陷密度)))

1/(1+exp(-(-10.3946-2.78502+9.64861*累计测试缺陷密度)))

等级1,2,3的概率

1/(1+exp(-(-6.33092+2.78502+9.64861*累计测试缺陷密度)))

1/(1+exp(-(-6.33092-2.78502+9.64861*累计测试缺陷密度)))

等级1,2,3,4的概率

1/(1+exp(-(-4.42629+2.78502+9.64861*累计测试缺陷密度)))

1/(1+exp(-(-4.42629-2.78502+9.64861*累计测试缺陷密度)))

当采用了瀑布生命周期模型,累计测试缺陷密度为1时,根据上表可以进行预测:

序号

满意度等级

瀑布模型

1

等级1的概率

0.1305

2

等级1和2的概率

0.8848

3

等级1,2,3的概率

0.9978

4

等级1,2,3,4的概率

0.9997

5

等级2的概率=(2)-(1)

0.7543

6

等级3的概率=(3)-(2)

0.1129

7

等级4的概率=()-(1)

0.0019

8

等级5的概率=1-(4)

0.0003



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3