数据仓库数据挖掘实践答案

您所在的位置:网站首页 数据挖掘第三版第五章课后答案 数据仓库数据挖掘实践答案

数据仓库数据挖掘实践答案

2022-05-17 22:07| 来源: 网络整理| 查看: 265

数据仓库与数据挖掘技术 答案 一、简答 1.为什么需要对数据进行预处理?数据预处理主要包括哪些工作(需要对数据进行哪些方面预处理)? (1)现实世界的数据是杂乱的,数据多了什么问题会出现。数据库极易受到噪音数据(包含错误或孤立点)、遗漏数据(有些感兴趣的属性缺少属性值或仅包含聚集数据)和不一致数据(在编码或者命名上存在差异)的侵扰,因为数据库太大,常常多达几G或更多。进行数据预处理,提高数据质量,从而提高挖掘结果质量。 (2)数据预处理主要包括:数据清理:去除数据中的噪音、纠正不一致;数据集成:将数据由多个源合并成一致的数据存储,如数据仓库或数据方;数据交换:规范化或聚集可以改进涉及(全文还有3433字)

【查看原文】


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3