NHANES数据库权重计算 |
您所在的位置:网站首页 › 数据权是什么权 › NHANES数据库权重计算 |
目录 1、复杂多阶段抽样调查 2、如何让你的软件知道抽样设计为复杂多阶段抽样? 3、如何正确选择并计算权重 (1)权重类型(只针对2001年后的数据) (2)权重选择 (3)结合周期计算权重 在讲权重选择和计算之前,大家是否还记得小编在 NHANES数据库数据下载 一文的文末提到下载好的数据不能够利用常规的统计方法直接分析,今天跟大家分享一下,正确分析的前提是什么,也就是如何选择并计算权重 1、复杂多阶段抽样调查一般情况下,当我们使用统计软件进行数据分析时,软件默认数据的抽样设计是简单随机抽样。但是由于简单随机抽样不适用于大范围的调查,NHANES采用的是复杂多阶段抽样(counties、segments、household和individual),每个人被抽中的概率不等,各阶段抽样数据不独立。所以当我们面对nhanes数据时,如果直接采用常规的统计方法(描述性统计:如计算均值、标准差、百分比;统计推断和模型:如区间估计、T检验、方差分析、回归等)分析会出现问题。这就要求我们在进行这些分析之前经过一定的调整,也就让统计软件知道具体的抽样设计。 2、如何让你的软件知道抽样设计为复杂多阶段抽样?在上一篇文章中,我们提到下载nhanes数据的时候,除了需要下载参与者的信息外还需要下载抽样调查相关信息(weight,strata,psu)。之所用要下载这部分数据,就是为了在正确分析数据之前,先告诉统计软件nhanes的抽样设计是复杂多阶段抽样。 在R中,利用survery包中的svydesign()方法可以设置抽样方法 nhanesDesign |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |