清华大学出版社

您所在的位置:网站首页 数据挖掘导论电子版 清华大学出版社

清华大学出版社

2024-04-12 03:32| 来源: 网络整理| 查看: 265

本教材以数据挖掘的经典算法为主线,基础部分讲清楚数据挖掘的过程和经典算法:数据探索、数据预处理、分类与回归、聚类分析、关联规则挖掘、偏差检测等。同时增加实现应用部分,在应用实现部分,以Python作为描述语言,以解决某个应用的挖掘目标为前提,介绍案例背景,阐述分析方法与过程,完成模型构建,给出算法的具体实现,通过此项目的方法提升学生的算法理解和应用能力,适应当今大数据时代对于高级工程师的数据分析能力。

more >

数据挖掘是计算机科学和人工智能中非常重要的一个领域,融合了数据库、人工智能、统计学、机器学习、模式识别等多个领域的理论与技术。在过去的几十年中,各种信息系统以及互联网产生的大量数据已经将人们湮没在信息的汪洋大海中。存储数据的爆炸性增长激起了社会对新技术和自动工具的需求,以便帮助人们将海量数据转换成信息和知识。数据挖掘作为一种大有前途的工具和方法引起了产业界和学术界的极大关注,并形成了信息领域的热点,大数据作为其产业化的表现已经上升到国家战略层面。本书中的算法采用Python语言编写。Python代码简单优雅、易于上手,科学计算软件包十分丰富,已成为不少大学和研究机构进行教学和科学计算的语言。相信用Python编写的数据挖掘算法能让读者尽快领略到这门学科的精妙之处。 本书作为数据挖掘领域的入门教材,在内容上尽可能涵盖数据挖掘经典算法及典型应用。全书共14章,大致分为3个部分: 第1部分(第1~6章)介绍数据挖掘的基础知识(数据挖掘过程、数据探索和数据预处理)和经典算法(关联规则、聚类、贝叶斯分类器、决策树、集成学习、智能优化、神经网络和支持向量机等)。第1部分是数据挖掘概念和算法的描述,本质上和具体编程语言无关,读者可以使用任何自己熟悉的计算机语言来描述。 第2部分(第7、8章)讨论Python数据分析和挖掘。第7章作为数据挖掘过程的Python描述的铺垫,讨论Python数据分析(NumPy、Pandas和ScikitLearn),Python数据可视化(Matplotlib、Seaborn和Bokeh)。第8章讨论数据挖掘的Python实现,与第1~6章相呼应,给出了数据挖掘过程中数据探索、数据预处理、聚类算法、关联规则算法以及分类算法的Python实现。 第3部分(第9~14章)是数据挖掘算法应用部分,介绍了来自日常生活和学术研究的6个真实应用案例,这6个案例包括基于线性回归和随机森林的泰坦尼克号乘客生存预测、基于关联规则Apriori算法的电影推荐、航空公司价值客户分析、基于协同过滤的音乐推荐、基于支持向量机的手写数字图片识别和基于神经网络的代码坏味检测等,通过对这6个案例的数据挖掘全过程深入浅出的剖析,用Python语言实现案例全过程,使读者逐渐加深对经典算法的理解,获得数据挖掘应用项目经验,提高编程能力,同时快速领悟看似难懂的数据挖掘理论。 本书3个部分的内容呈现递进深入的关系: 第1部分是经典算法;第3部分是用Python实现的算法应用案例;第2部分介绍的数据挖掘算法Python实现则是第1部分和第3部分的衔接,提供了数据挖掘过程的Python描述,读者可根据自己的知识储备、兴趣和时间情况选择阅读。本书通过经典算法、算法的Python实现和实际项目应用案例“三位一体”的方法强化读者对经典算法的理解和掌握,对经典算法真正达到“精”和“通”的水平。根据课时情况,一个学期32学时的本科生课程可考虑讲授前5章中的部分经典内容;一个学期48学时的本科生课程可考虑讲授前6章中的经典内容;第2部分(第7、8章)对于有Python基础的学生可作为课内实验的参考;想更深入地学习数据挖掘算法的本科生或研究生可以选择第3部分的部分或全部应用案例。 本书的第1~12章由孙家泽编写,第13、14章由王曙燕编写。孙家泽负责全书的统稿工作。感谢西安邮电大学可信软件研究团队的各位老师和同学在书稿检查和项目案例编写、测试中给予的帮助和支持。还有要感谢很多领域的专家在网络上共享的资源,这些资源对于本书的编写有很大的启发。这里还要特别感谢本书编辑龙启铭对本书出版给予的热情而专业的帮助。 数据挖掘技术的发展日新月异,大数据作为数据挖掘产业化最明显的表现以及创新和生产力提升的前沿已经上升到国家战略层面,与几乎所有的学科都有深度交叉。限于作者的才学、时间和精力,书中不妥之处在所难免,恳请读者批评指正。 孙家泽2020年10月

more > 课件下载 样章下载 暂无网络资源 扫描二维码 下载APP了解更多

版权图片链接



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3