第1章 机器学习基础 1
1.1 机器学习概述 2
1.1.1 机器学习简史 2
1.1.2 机器学习主要流派 4
1.2 机器学习、人工智能和数据挖掘 5
1.2.1 什么是人工智能 5
1.2.2 什么是数据挖掘 6
1.2.3 机器学习、人工智能和数据挖掘的关系 6
1.3 机器学习应用的典型领域 7
1.4 机器学习算法 13
1.5 机器学习的流程 19
第2章 机器学习基本方法 21
2.1 统计分析 22
2.1.1 统计基础 22
2.1.2 常见概率分布 27
2.1.3 参数估计 28
2.1.4 假设检验 30
2.1.5 线性回归 30
2.1.6 逻辑回归 34
2.1.7 判别分析 35
2.1.8 非线性模型 36
2.2 高维数据降维 37
2.2.1 主成分分析 37
2.2.2 奇异值分解 39
2.2.3 线性判别分析 40
2.2.4 局部线性嵌入 43
2.2.5 拉普拉斯特征映射 44
2.3 特征工程 45
2.3.1 特征构造 45
2.3.2 特征选择 46
2.3.3 特征提取 47
2.4 模型训练 47
2.4.1 模型训练常见术语 47
2.4.2 训练数据收集 48
2.5 可视化分析 48
2.5.1 可视化分析的作用 49
2.5.2 可视化分析的基本流程 49
2.5.3 可视化分析方法 49
2.5.4 可视化分析常用工具 51
2.5.5 常见的可视化图表 52
2.5.6 可视化分析面临的挑战 61
第3章 决策树与分类算法 63
3.1 决策树 64
3.1.1 分支处理 65
3.1.2 连续属性离散化 70
3.1.3 过拟合问题 72
3.1.4 分类性能评价 75
3.2 集成学习 79
3.2.1 装袋法 79
3.2.2 提升法 80
3.2.3 GBDT算法 82
3.2.4 XGBoost算法 82
3.2.5 随机森林算法 86
第4章 聚类分析 89
4.1 聚类分析概述 89
4.1.1 聚类算法分类 90
4.1.2 良好聚类算法的特征 91
4.2 聚类分析的度量 91
4.2.1 外部指标 92
4.2.2 内部指标 92
4.3 基于划分的聚类 94
4.3.1 k-均值算法 94
4.3.2 k-medoids算法 99
4.3.3 k-prototype算法 99
4.4 基于密度的聚类 100
4.4.1 DBSCAN算法 100
4.4.2 OPTICS算法 102
4.5 基于层次的聚类 103
4.5.1 BIRCH聚类 103
4.5.2 CURE算法 106
4.6 基于网格的聚类 108
4.7 基于模型的聚类 109
4.7.1 基于概率模型的聚类 109
4.7.2 模糊聚类 113
4.7.3 基于Kohonen神经网络模型的聚类 114
第5章 文本分析 119
5.1 文本分析概述 120
5.2 文本特征提取及表示 120
5.2.1 TF-IDF算法 120
5.2.2 信息增益 121
5.2.3 互信息 122
5.2.4 卡方统计量 122
5.2.5 词嵌入 123
5.2.6 语言模型 124
5.2.7 向量空间模型 125
5.3 知识图谱 126
5.3.1 知识图谱相关概念 127
5.3.2 知识图谱的存储 128
5.3.3 知识图谱的挖掘与计算 129
5.3.4 知识图谱的构建过程 130
5.4 词法分析 134
5.4.1 文本分词 134
5.4.2 命名实体识别 136
5.4.3 词义消歧 136
5.5 句法分析 137
5.6 语义分析 139
5.7 文本分析应用 140
5.7.1 文本分类 140
5.7.2 信息抽取 142
5.7.3 问答系统 143
5.7.4 情感分析 144
5.7.5 自动摘要 145
第6章 神经网络 147
6.1 神经网络概述 148
6.1.1 前馈神经网络 148
6.1.2 反馈神经网络 153
6.1.3 自组织神经网络 155
6.2 神经网络相关概念 156
6.2.1 激活函数 156
6.2.2 损失函数 165
6.2.3 学习率 168
6.2.4 过拟合与正则化 172
6.2.5 数据预处理 174
6.2.6 训练方式 175
6.2.7 神经网络模型训练中的问题 176
6.2.8 网络模型效果评价 182
6.3 神经网络应用 182
第7章 贝叶斯网络 188
7.1 贝叶斯定理 189
7.2 朴素贝叶斯分类模型 189
7.3 贝叶斯网络推理 192
7.4 贝叶斯网络的应用 198
7.4.1 中文分词 198
7.4.2 机器翻译 198
7.4.3 故障诊断 198
7.4.4 疾病诊断 199
第8章 支持向量机 202
8.1 线性可分支持向量机 203
8.1.1 间隔与超平面 203
8.1.2 支持向量 203
8.1.3 对偶问题求解 205
8.1.4 软间隔 206
8.2 非线性可分支持向量机 207
8.2.1 非线性可分支持向量机原理 207
8.2.2 常见核函数 207
8.3 支持向量机应用 208
第9章 分布式机器学习 213
9.1 分布式机器学习基础 214
9.2 分布式机器学习框架 215
9.3 并行决策树 220
9.4 并行k-均值算法 221
第10章 深度学习基础 224
10.1 卷积神经网络 225
10.1.1 卷积神经网络概述 225
10.1.2 卷积神经网络的结构 226
10.1.3 卷积神经网络的训练 234
10.1.4 常见卷积神经网络 236
10.2 目标检测 251
10.2.1 目标检测基本概念 251
10.2.2 目标检测典型算法 252
10.3 图像分割 257
10.3.1 全卷积神经网络 258
10.3.2 U-Net算法 259
10.3.3 Mask R-CNN 260
10.4 循环神经网络 261
10.4.1 循环神经网络基本原理 261
10.4.2 长短期记忆网络 268
10.4.3 门限循环单元 273
10.4.4 循环神经网络的其他改进 273
10.5 深度学习流行框架 277
第11章 高级深度学习 280
11.1 自注意力和BERT模型 281
11.1.1 常见词嵌入模型 281
11.1.2 自注意力 283
11.1.3 多头注意力 284
11.1.4 Transformer模型 286
11.1.5 BERT模型 288
11.2 无监督深度学习 289
11.2.1 深度信念网络 290
11.2.2 自动编码器网络 291
11.3 生成对抗网络 293
11.3.1 生成对抗网络基本原理 293
11.3.2 常见的生成对抗网络 296
11.4 迁移学习 300
11.5 对偶学习 302
11.6 知识蒸馏 303
11.7 小样本学习 305
第12章 推荐系统 307
12.1 推荐系统概述 308
12.1.1 推荐系统的应用场景 308
12.1.2 相似度计算 309
12.2 推荐系统通用模型 311
12.2.1 推荐系统结构 311
12.2.2 基于人口统计学的推荐 311
12.2.3 基于内容的推荐 312
12.2.4 基于协同过滤的推荐 312
12.2.5 基于图的推荐 315
12.2.6 基于关联规则的推荐 317
12.2.7 基于知识的推荐 322
12.2.8 基于标签的推荐 323
12.3 推荐系统评测 324
12.3.1 评测方法 324
12.3.2 评测指标 325
12.4 推荐系统常见问题 329
12.5 推荐系统实例 332
12.6 深度学习在推荐系统中的应用 339
第13章 强化学习 344
13.1 强化学习概述 345
13.2 强化学习基础 345
13.2.1 马尔可夫链 345
13.2.2 强化学习基本概念 346
13.2.3 强化学习的目标函数 348
13.2.4 价值函数 349
13.3 强化学习基本算法 352
13.3.1 蒙特卡洛强化学习 352
13.3.2 时序差分算法 353
13.3.3 SARSA算法 354
13.3.4 Q-Learning算法 354
13.4 深度强化学习 359
13.4.1 DQN算法 360
13.4.2 演员-评论家算法 366
|