SPSS教程：手把手教你设置哑变量以及解读结果

您所在的位置：网站首页 › spss怎么添加虚拟变量 › SPSS教程：手把手教你设置哑变量以及解读结果

SPSS教程：手把手教你设置哑变量以及解读结果

2024-07-15 00:30| 来源: 网络整理| 查看: 265

今天我们将结合SPSS软件，向大家介绍在回归模型中何如实现哑变量的设置，并对引入哑变量后的模型结果进行解读。

Logistic /Cox回归

在SPSS中，Logistic回归和Cox回归设置哑变量的方式是一致的，因此本文以Logistic回归为例进行说明。

一、研究实例

某研究人员拟探讨不同种族人群中某疾病发病风险有无差异，收集了4种不同种族人群的相关数据资料（1=Black美国黑人，2=White美国白人，3=Indian美国印第安人，4=Asian亚裔美国人）。

根据数据类型判断，种族为无序多分类资料，需要将种族转化为哑变量后，进行Logistic回归。

二、SPSS操作

1. Analyze → Regression → Binary Logistic，进入到Logistic回归模块

2. 将Event选入Dependent框中，将Gender、Age、Race选入Covariates框中

3. 点击Categorical进入定义分类变量的对话框，将需要转化的变量Race选入Categorical Covariates框中，点击Contrast旁的下拉框选择Indicator，Reference Category设置为First，即设定第一个分类为参照。

在本次研究中，Race=1为黑人，即我们选择黑人作为参照。最后再点击Change确认更改为Race（Indicator（first））。

在选择哑变量编码方式时，Contrast下拉选项一共提供了7种编码方式：

(1) Indicator（指示对比）：用于指定某一分类为参照，指定的参照取决于Reference Category中选择Last还是First，即只能以该变量的第一类或者最后一类作为参照。Indicator为默认方法，也是我们最常用的设置参照类的方法。

(2) Simple（简单对比）： Simple和Indicator两个方法虽然参数编码不同，但其实质是一样的，均为各分类分别与参照进行相比。

(3) Difference（差异对比）：即该分类变量的某个分类，与前面所有分类的平均值进行比较，此法与Helmert法相反，因此也叫做反Helmert法。此选项常用于有序分类变量。

(4) Helmert（赫尔默特对比）：即该分类变量的某个分类，与其后面所有分类的平均值进行比较，同样也适用于有序分类变量。

(5) Repeated（重复对比）：即该分类变量的各个分类，均与前面相邻的一个分类进行比较，此时前一分类为参照。

(6) Polynomial（多项式对比）：它假设各个分类间隔是等距的，只能用于数值型的变量。（注意：如果此时原始变量为字符型，例如A、B、C、D，在SPSS中使用该方法时它会提示Polynomial contrasts may not be specified for string variables。而对于其他6种方法是允许原始变量是字符型，SPSS可以将其自动转化为0或1形式的哑变量。）

(7) Deviation（偏差对比）：即除参照外，其余每一个分类都与总体水平相比，此时每个分类的回归系数都是相对于总体水平而言的改变量。

4. 点击Continue回到主对话框，再点击OK完成操作。

三、结果解读

1. 结果显示， SPSS将 Race自动转化为3个哑变量，分别为Race(1) (2) (3)，代表白人、印第安人和亚裔人，参照为黑人。在α=0.05的检验水准下，Race(1) (2) (3) 回归系数检验P值均Output Variable框中，在Name框中输入转变的第一个哑变量名字Race1，并点击Change进行命名

2. 点击Old and New Values进入重新编码的对话框

在Old Value中的Value框中填写1，在New Value中的Value框中填写1，并点击Add添加，得到1->1。

然后选择Old Value中的All other values，在New Value中的Value框中填写0，并点击Add添加，得到ELSE->0

上述步骤表示将原有变量Race中第1分类，在哑变量Race1中赋值为1，将其他所有分类在哑变量Race1中赋值为0。

按照同样的方法，我们可以生成Race2和Race3，共3个哑变量。如果觉得生成3个哑变量很麻烦，我们可以进入程序编辑页面，编写一条简单的程序进行重新编码赋值，如下图所示。