文章目录
一、单变量分析二、多变量分析图2.1 散点图2.2 sns.jointplot()双变量联合分布图2.2.1 生成数据2.2.2 x, y, data:x轴数据,y轴数据,dataframe数据2.2.3 kind样式2.2.3.1 scatter散点2.2.3.2 reg回归2.2.3.3 resid2.2.3.4 kde密度图2.2.3.5 hex热度图
2.2.4 color颜色2.3.5 dropna在画图之前是否删除空值
2.3 sns.pairplot()多变量联合分布图2.3.1 加载鸢尾花数据iris2.3.2 data数据2.3.3 hue:指定列名,按照列名类别,标记不同颜色2.3.4 palette:调色板2.3.5 kind样式2.3.6 dropna在画图之前是否删除空值
一、单变量分析
单变量分析就是直方图 参考博文:https://blog.csdn.net/u010916338/article/details/106036759
二、多变量分析图
2.1 散点图
参考博文:https://blog.csdn.net/u010916338/article/details/106018903
2.2 sns.jointplot()双变量联合分布图
seaborn.jointplot(x, y, data=None, kind=’scatter’, stat_func=, color=None, size=6, ratio=5, space=0.2, dropna=True, xlim=None, ylim=None, joint_kws=None, marginal_kws=None, annot_kws=None, **kwargs)
2.2.1 生成数据
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510165613451.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.2.2 x, y, data:x轴数据,y轴数据,dataframe数据
![在这里插入图片描述](https://img-blog.csdnimg.cn/2020051016574126.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.2.3 kind样式
(1)kind={ “scatter” | “reg” | “resid” | “kde” | “hex” }
2.2.3.1 scatter散点
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510170329176.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.2.3.2 reg回归
![在这里插入图片描述](https://img-blog.csdnimg.cn/2020051017044281.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.2.3.3 resid
![在这里插入图片描述](https://img-blog.csdnimg.cn/2020051017060055.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.2.3.4 kde密度图
(1)颜色越重,该区域出现的点的次数越多,频率越高,概率越大
2.2.3.5 hex热度图
(1)颜色越重,该区域出现的点的次数越多
2.2.4 color颜色
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510171151743.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.3.5 dropna在画图之前是否删除空值
2.3 sns.pairplot()多变量联合分布图
seaborn.pairplot(data, hue=None, hue_order=None, palette=None, vars=None, x_vars=None, y_vars=None, kind='scatter', diag_kind='auto', markers=None, height=2.5, aspect=1, dropna=True, plot_kws=None, diag_kws=None, grid_kws=None, size=None)
2.3.1 加载鸢尾花数据iris
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510172457500.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.3.2 data数据
(1)文本数据不参与分析计算
2.3.3 hue:指定列名,按照列名类别,标记不同颜色
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510172738878.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.3.4 palette:调色板
调色板设置,参考博文:https://blog.csdn.net/u010916338/article/details/106031515 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200510173043802.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTA5MTYzMzg=,size_16,color_FFFFFF,t_70)
2.3.5 kind样式
(1)kind={ “scatter” | “reg”}
2.3.6 dropna在画图之前是否删除空值
|