统计学(11)

您所在的位置:网站首页 统计数据分组原则 统计学(11)

统计学(11)

2024-07-04 06:56| 来源: 网络整理| 查看: 265

如果将连续资料划分为分类资料纳入模型,就会有一个问题: 如何划分? 实际上并没有很理想的划分,可以通过以下几个方面:

1、根据专业和实际经验

这种情况主要用于一些常规变量,如年龄可按每10岁划分为一个年龄段,BMI可根据已有的标准划分为正常、超重、肥胖等。 当然,划分时必须结合自己的实际情况,例如研究的是18岁以下儿童,按10岁一个年龄段划分就不合适了,这时可能在低年龄组需要划分得更细。 当样本量较小时,尽量划分得不要太多,最好只分为两类,否则容易导致估计结果不可靠。尽管有时你可能觉得从专业上应该分4类,但如果估计不出结果,那么专业划分再有意义也无济于事。我们必须综合考虑专业和数据本身。 即使你的样本量足够大,但在划分时仍需谨慎。 有一个问题一定要注意:作为参照组的那一类例数绝不能太少,否则你会发现所有估计结果都是不稳定的。 例1. 如果把年龄重新划分,分为50 岁三组,以40岁组作为参照组

image.png

可以发现, 41~50 岁组与50 岁组与



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3