Python数据分析第十二课:单变量、双变量及多变量分析图

您所在的位置:网站首页 数据分析分布图 Python数据分析第十二课:单变量、双变量及多变量分析图

Python数据分析第十二课:单变量、双变量及多变量分析图

2023-07-23 12:31| 来源: 网络整理| 查看: 265

一、单变量分析绘图

什么是单变量分析?

单变量其实就是我们通常接触到的数据集中的一列数据。

单变量分析是数据分析中最简单的形式,其中被分析的数据只包含一个变量。因为它是一个单一的变量,它不处理原因或关系

单变量分析的主要目的是描述数据并找出其中存在的模式,也就是“用最简单的概括形式反映出大量数据资料所容纳的基本信息”。

本节我们研究的是连续数值型数据的分布。

那么什么样的数据是连续数值型数据呢?什么样的数据是离散型数据呢?

连续型数据一般应用在计算机领域,在数据挖掘、数据分类时会遇到此类数据,因其数据不是单独的整十整百的数字,包含若干位小数且取值密集,故称为连续型数据,例如,身高、体重、年龄等都是连续变量。 由记录不同类别个体的数目所得到的数据,称为离散型数据。例如,某一类别动物的头数,具有某一特征的种子粒数,血液中不同的细胞数目等。所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度

我们要如何使用seaborn绘制单变量分布呢?

首先,使用Numpy模块从标准整体分布中随机抽取1000个数,作为我们的连续数值型数据

data = np.random.normal(size=1000)

random是Numpy中一个随机模块,在random模块中的normal方法表示从正态分布中随机产生size数值



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3