决策树模型 IBM SPSS Modeler 18.0

您所在的位置:网站首页 clementine决策树分析 决策树模型 IBM SPSS Modeler 18.0

决策树模型 IBM SPSS Modeler 18.0

2024-07-10 08:44| 来源: 网络整理| 查看: 265

(该文为个人的一个记录,也许有错,可以参考下)

决策树模型建立

1.点击源、Excel,在空白处得到一个Excel

点击生成的Excel,导入要处理的数据,再点确定

 PS:点击上图中的预览可以查看表格数据

 2.点击字段选项、类型,在空白得到一个类型图标

 点生成的类型图标,点选取值,选择输入的数据和要预测的目标(目标测量要为分类,不能是连续),最后点确定即可。

3.点击 分区,在空白处得到分区图标

 点生成的分区图标,一般训练、测试分区设为70:30,之后可以根据所需调整比例,最后点确定

 4.点 建模、C 5.0,

 点得到的 C 5.0,点击 运行,得到结果

 

5.点击 结果,得到下图

 

 预测变量重要性图

(个人感觉就是一些变量对目标的重要性,重要性越大,对目标影响越大)

决策树模型

(点击那个按钮可以复制这个模型) 

(那个按钮右边为放大、缩小按钮,再右边三个按钮为展现数据的形式,再右边三个按钮为展现 竖立、右横着、左横着 的模型形式,可以自己试试,描述不是很清楚)

6.点 输出、分析

 点击 分析,勾选你想要的数据(我举例子就不勾选数据了,直接默认输出),再点 运行,得到结果如下下图

 

 

 

(这个结果说明 训练集预测正确率、错误率为65.31%、34.69%,预测集预测正确率、错误率为53.1%、46.9%)

(预测集正确性越高,模型准确率越高,80%以上好些)

(要提高模型准确率,可以调整训练集测试集比例、调整输入的数据)

7.结果分析(可以参考下)

比如:评估度量

 

 (1)AUC值

AUC值一般在[0.5,1]中,0.5代表模型没有分类效果,小于0.5表示不如随机预测,大于0.5表示得到的模型比随机猜测好,AUC值越高越好。此外,AUC比准确率在对数据不平衡的数据集构建的模型有更好的评价意义。

(2)Gnini(基尼指数)

基尼指数表示在样本集合中一个随机选中的样本被分错的概率。Gini越小,表示集合中被选错的样本被参错的概率越小,也可以说是集合的纯度越高,特征越好,反之则纯度不高。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3