R语言定量资料的统计描述

您所在的位置:网站首页 箱式图主要用于描述什么资料 R语言定量资料的统计描述

R语言定量资料的统计描述

2024-07-08 12:42| 来源: 网络整理| 查看: 265

在统计学中,对定量资料(连续变量或者数值变量)的统计描述主要包括集中趋势和离散趋势两个方面。其中集中趋势包括均数、中位数、众数等指标,离散趋势包括方差、标准差、分位数(以上下四分位数最为常用)、最大值、最小值等指标。这些指标在R语言中都有相应的函数。

data summary(data) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.0 3.5 6.0 6.0 8.5 11.0

 psych包中的describe()函数可以得到非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误这些指标。describBy()函数可以添加分组变量,分组查看各变量的统计描述指标。

> library(psych) > describe(data) vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 11 6 3.32 6 6 4.45 1 11 10 0 -1.53 1 > myvars describe(mtcars[myvars]) #可查看多个变量的统计描述指标 vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 32 20.09 6.03 19.2 19.70 5.41 10.4 33.9 23.5 0.61 -0.37 1.07 cyl 2 32 6.19 1.79 6.0 6.23 2.97 4.0 8.0 4.0 -0.17 -1.76 0.32 > describeBy(mtcars[myvars], list(am=mtcars$am)) #分组列出多个变量的统计描述指标 Descriptive statistics by group am: 0 vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 19 17.15 3.83 17.3 17.12 3.11 10.4 24.4 14 0.01 -0.80 0.88 cyl 2 19 6.95 1.54 8.0 7.06 0.00 4.0 8.0 4 -0.95 -0.74 0.35 ----------------------------------------------------------------------------------- am: 1 vars n mean sd median trimmed mad min max range skew kurtosis se mpg 1 13 24.39 6.17 22.8 24.38 6.67 15 33.9 18.9 0.05 -1.46 1.71 cyl 2 13 5.08 1.55 4.0 4.91 0.00 4 8.0 4.0 0.87 -0.90 0.43

可以使用sapply()函数,把需要呈现的统计描述指标加入其中即可分析。结果呈现更具有针对性。

mystats


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3