数据分析与R语言

您所在的位置:网站首页 r语言summary函数输出的结果含义 数据分析与R语言

数据分析与R语言

#数据分析与R语言| 来源: 网络整理| 查看: 265

数据结构

创建向量和矩阵

函数c(), length(), mode(), rbind(), cbind()

求平均值,和,连乘,最值,方差,标准差

函数mean(), sum(), min(), max(), var(), sd(), prod()

帮助文档

函数help()

生成向量

seq()

生成字母序列letters

新建向量

Which()函数,rev()函数,sort()函数

生成矩阵

函数matrix()

矩阵运算

函数t(),矩阵加减

矩阵运算

矩阵相乘,函数diag()

矩阵求逆,函数rnorm(),solve()

解线性方程组

函数solve(a,b)

矩阵的特征值与特征向量

函数eigen()

数据的R语言表示——数据框矩阵形式,但列可以不同数据类型每列是一个变量,每行是一个观测值

作图

画散点图

函数plot()

对x1进行直方图分析

绘制直方图函数hist() hist(x$x1)

探索各科成绩的关联列联表分析

列联函数table(),柱状图绘制函数barplot() barplot(table(x$x1))

饼图

饼图绘制函数pie() pie(table(x$x1))

箱尾图

箱子的上下横线为样本的25%和75%分位数 箱子中间的横线为样本的中位数 上下延伸的直线为尾线,尾线的尽头为最高值和最低值 异常值 boxplot(x$x1,x$x2,x$x3)

箱线图

boxplot(x[2:4],col = c("red","green","blue",notch=T)) 水平放置的箱尾图 boxplot(x$x1,x$x2,x$x3,horizontal = T)

星相图

每个观测单位的数值表示一个图形 每个图形的每个角落表示一个变量,字符串类型会标注在图的下方 角线的长度表示值的大小 stars(x[c("x1","x2","x3")],full = T,draw.segments = T)

脸谱图

安装aplpack包 faces(x[c("x1","x2","x3")]) 用五官的宽度和高度来描绘数值 人对脸谱高度敏感和强记忆 适合较少样本的情况

其他脸谱图

安装TeachingDemos包 faces2(x)

茎叶图

stem(x$x1)

QQ图

可用于判断是否正态分布 直线的斜率是标准差,截距是均值 点的散步越接近直线,则越接近正态分布 qqnorm(x1) qqline(x1) qqnorm(x3) qqline(x3)

散点图的进一步设置

plot(x$x1,x$x2,main = "数学分析与线性代数成绩的关系",xlab = "数学分析",ylab = "线性代数",xlim = c(0,100),ylim = c(0,100),xaxs="i",yaxs="i",col = "red",pch = 19)

连线图

a = c(2,3,4,5,6) b = c(4,7,8,9,12) plot(a,b,type = "l")

多条曲线的效果

plot(rain$Tokyo,type = "l",col = "red",ylim = c(0,300),main = "Monthly Rainfall in major cities", xlab = "Month of Year", ylab = "Rainfall(mm)", lwd = 2) lines(rain$NewYork,type = "l",col = "blue", lwd = 2) lines(rain$London,type = "l",col = "green", lwd = 2) lines(rain$Berlin,type = "l",col = "orange", lwd = 2)

密度图

函数density() plot(density(rnorm(1000)))

R内置数据集函数data()列出内置数据

热力图

利用内置的mtcars数据集绘制 data("mtcars") heatmap(as.matrix(mtcars),Rowv = NA,Colv = NA,col = heat.colors(256),scale = "column",margins = c(2,8),main = "Car characteristics by Model") Iris(鸢尾花)数据集 Sepal 花萼 Petal 花瓣 Species 种属

向日葵散点图

用来克服散点图中数据点重叠问题 在有重叠的地方用一朵“向日葵花”的花瓣数目来表示重叠数据的个数 sunflowerplot(iris[,3:4],col = "gold",seg.col = "gold")

散点图集

遍历样本中全部的变量配对画出二元图 直观地了解所有变量之间的关系 pairs(iris[,1:4]) 用plot也可以实现同样的效果 plot(iris[,1:4],main = "Relationship between characteristics of iris flowers",pch = 19,col = "blue",cex = 0.9) 利用par()在同一个device输出多个散点图 Par命令博大精深,用于设置绘图参数,help(par) par(mfrow=c(3,1)) plot(x1,x2) plot(x2,x3) plot(x3,x1)

关于绘图参数

Help(par) 有哪些颜色?Colors() 关于绘图参数 绘图设备

位置控制参数Main参数:

Oma参数:

三维散点图

安装scatterplot3d包 scatterplot3d(x[2:4])

三维作图

x


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3