数据分析(二):Excel数据清洗步骤 |
您所在的位置:网站首页 › 数据清洗原理和步骤 › 数据分析(二):Excel数据清洗步骤 |
一. 数据分析的步骤 如上图所示:转载知乎@Cindy 数据分析的步骤分为5步:1.提出问题,2.理解数据,3.数据清洗,4.构建模型,5.数据可视化 1.1 提出问题 在数据分析之前要明确分析的问题,明确分析的目的是什么,思考从当前数据集中要分析出什么业务数据 1.2 理解数据 整体上理解数据,上边文章已经了解数据集中的的字段意义,本文除了要理解数据字段的意义还需要理解数据集的数据类型:文本型,数值型,逻辑性,错误值 1.3 数据清洗 数据清洗也叫做数据预处理,一般进行数据清洗需要通过通过7个步骤进行处理: 选择子集,列名重命名,删除重复值,缺失值处理,一致化处理,数据排序处理,异常值处理 a. 选择子集:即选择需要进行分析的数据集中的数据列,为避免干扰可对其他不参与分析的数列进行隐藏处理 b. 列名重名命:若数据集中出现同样列名称,或含义相同的两个列名,为避免干扰分析结果则需要针对某一个数据列的列名进行重命名 c. 删除重复值:删除数据中的重复数据值,注意只会保留重复数据的第一条数据 d. 缺失值处理:原始数据中可能会出现数据值缺失,即数据集中存在无数据的数据单元格。在数据分析时会影响结果,需要将缺失的数据值进行补全。 可人工手动一次性补全缺失值:首先通过定位条件查找的方式,查找到缺失值。然后Ctrl选中所有缺失值,在公式输入框输入对应内容,使用Ctrl+Enter可补全选中的缺失值 e. 一致化处理:数据集中会存在某一个数据列的数据至标准不一致或命名规则不一致的情况,可以使用分列功能将不一致的数据列中的数据值进行拆分 f. 数据值函数应用:对列数据集中的数据进行筛选排序,升序,降序排列等函数的应用 LEN(字符串所在单元格的位置),获取整个字符串的长度,例如LEN(A2)=6 Find(要查找的字符串,字符串所在单元格的位置),例如查找"k"的位置,通过Find("k",A2) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |