机器学习（第2版）

2023-12-05 22:41| 来源: 网络整理| 查看: 265

第1章　机器学习基础 1 1.1　机器学习概述 2 1.1.1　机器学习简史 2 1.1.2　机器学习主要流派 4 1.2　机器学习、人工智能和数据挖掘 5 1.2.1　什么是人工智能 5 1.2.2　什么是数据挖掘 6 1.2.3　机器学习、人工智能和数据挖掘的关系 6 1.3　机器学习应用的典型领域 7 1.4　机器学习算法 13 1.5　机器学习的流程 19 第2章　机器学习基本方法 21 2.1　统计分析 22 2.1.1　统计基础 22 2.1.2　常见概率分布 27 2.1.3　参数估计 28 2.1.4　假设检验 30 2.1.5　线性回归 30 2.1.6　逻辑回归 34 2.1.7　判别分析 35 2.1.8　非线性模型 36 2.2　高维数据降维 37 2.2.1　主成分分析 37 2.2.2　奇异值分解 39 2.2.3　线性判别分析 40 2.2.4　局部线性嵌入 43 2.2.5　拉普拉斯特征映射 44 2.3　特征工程 45 2.3.1　特征构造 45 2.3.2　特征选择 46 2.3.3　特征提取 47 2.4　模型训练 47 2.4.1　模型训练常见术语 47 2.4.2　训练数据收集 48 2.5　可视化分析 48 2.5.1　可视化分析的作用 49 2.5.2　可视化分析的基本流程 49 2.5.3　可视化分析方法 49 2.5.4　可视化分析常用工具 51 2.5.5　常见的可视化图表 52 2.5.6　可视化分析面临的挑战 61 第3章　决策树与分类算法 63 3.1　决策树 64 3.1.1　分支处理 65 3.1.2　连续属性离散化 70 3.1.3　过拟合问题 72 3.1.4　分类性能评价 75 3.2　集成学习 79 3.2.1　装袋法 79 3.2.2　提升法 80 3.2.3　GBDT算法 82 3.2.4　XGBoost算法 82 3.2.5　随机森林算法 86 第4章　聚类分析 89 4.1　聚类分析概述 89 4.1.1　聚类算法分类 90 4.1.2　良好聚类算法的特征 91 4.2　聚类分析的度量 91 4.2.1　外部指标 92 4.2.2　内部指标 92 4.3　基于划分的聚类 94 4.3.1　k-均值算法 94 4.3.2　k-medoids算法 99 4.3.3　k-prototype算法 99 4.4　基于密度的聚类 100 4.4.1　DBSCAN算法 100 4.4.2　OPTICS算法 102 4.5　基于层次的聚类 103 4.5.1　BIRCH聚类 103 4.5.2　CURE算法 106 4.6　基于网格的聚类 108 4.7　基于模型的聚类 109 4.7.1　基于概率模型的聚类 109 4.7.2　模糊聚类 113 4.7.3　基于Kohonen神经网络模型的聚类 114 第5章　文本分析 119 5.1　文本分析概述 120 5.2　文本特征提取及表示 120 5.2.1　TF-IDF算法 120 5.2.2　信息增益 121 5.2.3　互信息 122 5.2.4　卡方统计量 122 5.2.5　词嵌入 123 5.2.6　语言模型 124 5.2.7　向量空间模型 125 5.3　知识图谱 126 5.3.1　知识图谱相关概念 127 5.3.2　知识图谱的存储 128 5.3.3　知识图谱的挖掘与计算 129 5.3.4　知识图谱的构建过程 130 5.4　词法分析 134 5.4.1　文本分词 134 5.4.2　命名实体识别 136 5.4.3　词义消歧 136 5.5　句法分析 137 5.6　语义分析 139 5.7　文本分析应用 140 5.7.1　文本分类 140 5.7.2　信息抽取 142 5.7.3　问答系统 143 5.7.4　情感分析 144 5.7.5　自动摘要 145 第6章　神经网络 147 6.1　神经网络概述 148 6.1.1　前馈神经网络 148 6.1.2　反馈神经网络 153 6.1.3　自组织神经网络 155 6.2　神经网络相关概念 156 6.2.1　激活函数 156 6.2.2　损失函数 165 6.2.3　学习率 168 6.2.4　过拟合与正则化 172 6.2.5　数据预处理 174 6.2.6　训练方式 175 6.2.7　神经网络模型训练中的问题 176 6.2.8　网络模型效果评价 182 6.3　神经网络应用 182 第7章　贝叶斯网络 188 7.1　贝叶斯定理 189 7.2　朴素贝叶斯分类模型 189 7.3　贝叶斯网络推理 192 7.4　贝叶斯网络的应用 198 7.4.1　中文分词 198 7.4.2　机器翻译 198 7.4.3　故障诊断 198 7.4.4　疾病诊断 199 第8章　支持向量机 202 8.1　线性可分支持向量机 203 8.1.1　间隔与超平面 203 8.1.2　支持向量 203 8.1.3　对偶问题求解 205 8.1.4　软间隔 206 8.2　非线性可分支持向量机 207 8.2.1　非线性可分支持向量机原理 207 8.2.2　常见核函数 207 8.3　支持向量机应用 208 第9章　分布式机器学习 213 9.1　分布式机器学习基础 214 9.2　分布式机器学习框架 215 9.3　并行决策树 220 9.4　并行k-均值算法 221 第10章　深度学习基础 224 10.1　卷积神经网络 225 10.1.1　卷积神经网络概述 225 10.1.2　卷积神经网络的结构 226 10.1.3　卷积神经网络的训练 234 10.1.4　常见卷积神经网络 236 10.2　目标检测 251 10.2.1　目标检测基本概念 251 10.2.2　目标检测典型算法 252 10.3　图像分割 257 10.3.1　全卷积神经网络 258 10.3.2　U-Net算法 259 10.3.3　Mask R-CNN 260 10.4　循环神经网络 261 10.4.1　循环神经网络基本原理 261 10.4.2　长短期记忆网络 268 10.4.3　门限循环单元 273 10.4.4　循环神经网络的其他改进 273 10.5　深度学习流行框架 277 第11章高级深度学习 280 11.1　自注意力和BERT模型 281 11.1.1　常见词嵌入模型 281 11.1.2　自注意力 283 11.1.3　多头注意力 284 11.1.4　Transformer模型 286 11.1.5　BERT模型 288 11.2　无监督深度学习 289 11.2.1　深度信念网络 290 11.2.2　自动编码器网络 291 11.3　生成对抗网络 293 11.3.1　生成对抗网络基本原理 293 11.3.2　常见的生成对抗网络 296 11.4　迁移学习 300 11.5　对偶学习 302 11.6　知识蒸馏 303 11.7　小样本学习 305 第12章推荐系统 307 12.1　推荐系统概述 308 12.1.1　推荐系统的应用场景 308 12.1.2　相似度计算 309 12.2　推荐系统通用模型 311 12.2.1　推荐系统结构 311 12.2.2　基于人口统计学的推荐 311 12.2.3　基于内容的推荐 312 12.2.4　基于协同过滤的推荐 312 12.2.5　基于图的推荐 315 12.2.6　基于关联规则的推荐 317 12.2.7　基于知识的推荐 322 12.2.8　基于标签的推荐 323 12.3　推荐系统评测 324 12.3.1　评测方法 324 12.3.2　评测指标 325 12.4　推荐系统常见问题 329 12.5　推荐系统实例 332 12.6　深度学习在推荐系统中的应用 339 第13章强化学习 344 13.1　强化学习概述 345 13.2　强化学习基础 345 13.2.1　马尔可夫链 345 13.2.2　强化学习基本概念 346 13.2.3　强化学习的目标函数 348 13.2.4　价值函数 349 13.3　强化学习基本算法 352 13.3.1　蒙特卡洛强化学习 352 13.3.2　时序差分算法 353 13.3.3　SARSA算法 354 13.3.4　Q-Learning算法 354 13.4　深度强化学习 359 13.4.1　DQN算法 360 13.4.2　演员-评论家算法 366

【本文地址】

机器学习（第2版）

机器学习（第2版）

今日新闻

推荐新闻