数据清洗技术 |
您所在的位置:网站首页 › 报表数据处理中不包括的内容 › 数据清洗技术 |
数据清洗技术——Excel数据清洗
一、实验目的和要求二、实验环境三、实验内容和实验步骤
一、实验目的和要求
1、了解 Excel 的基本功能和用途 2、掌握 Excel 数据清洗的基本步骤 3、了解 Excel 数据清洗的方法 4、掌握 Excel 常用的数据分析函数 5、掌握 Excel 数据清洗常用的函数 二、实验环境操作系统:Windows XP/7/8/10… Excel版本:2007/2019… JDK版本:1.7.0 Kettle版本:4.4.0 MySQL版本:8.0 三、实验内容和实验步骤实验内容: 现有一个企业招聘职位信息的数据集,约有 5000条数据,客户提出需要了解数据分析师岗位情况,包括岗位分布和特点、能力要求、工资和薪酬等。由于数据集没有经过处理,所以表中的数据还很不规范,含有大量数据重复、缺失、单列数据粒度过大等问题,因此,在进行数据分析前,需要进行数据清洗操作,以使数据规范化。 实验步骤: 1、数据预览 拿到数据后,不要急着动手处理,先对数据集做总体的观察。如图 1-1 所示,可以看到,数据集表头由城市、公司名称、公司编号、公司福利、公司规模、经营区域、经营范围、教育程度、职位编号、职位名称、薪水和工作年限要求等属性组成。
2、进行数据清洗 在 Excel 中新建一个工作表执行数据清洗,方便和原始数据区分开来。 (1) 清洗薪水数据 采用分列操作(数据-分列),以“-”为分隔符号,得到两列数据,将属性修改为最低薪水和最高薪水,如图所示。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |