统计学(11) |
您所在的位置:网站首页 › 统计数据分组原则 › 统计学(11) |
如果将连续资料划分为分类资料纳入模型,就会有一个问题: 如何划分? 实际上并没有很理想的划分,可以通过以下几个方面: 1、根据专业和实际经验这种情况主要用于一些常规变量,如年龄可按每10岁划分为一个年龄段,BMI可根据已有的标准划分为正常、超重、肥胖等。 当然,划分时必须结合自己的实际情况,例如研究的是18岁以下儿童,按10岁一个年龄段划分就不合适了,这时可能在低年龄组需要划分得更细。 当样本量较小时,尽量划分得不要太多,最好只分为两类,否则容易导致估计结果不可靠。尽管有时你可能觉得从专业上应该分4类,但如果估计不出结果,那么专业划分再有意义也无济于事。我们必须综合考虑专业和数据本身。 即使你的样本量足够大,但在划分时仍需谨慎。 有一个问题一定要注意:作为参照组的那一类例数绝不能太少,否则你会发现所有估计结果都是不稳定的。 例1. 如果把年龄重新划分,分为50 岁三组,以40岁组作为参照组 可以发现, 41~50 岁组与50 岁组与 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |