MapReduce设计模式【全本

您所在的位置:网站首页 mapreduce论文 MapReduce设计模式【全本

MapReduce设计模式【全本

#MapReduce设计模式【全本| 来源: 网络整理| 查看: 265

内容提要

作者简介

第1章 设计模式与MapReduce

1.1 设计模式

1.2 MapReduce简史

1.3 MapReduce和Hadoop简介

1.4 Hadoop示例:单词计数

1.5 Pig和Hive

第2章 概要模式

2.1 数值概要

2.2 倒排索引概要

2.3 计数器计数

第3章 过滤模式

3.1 过滤

3.2 布隆过滤

3.3 Top 10

3.4 去重

第4章 数据组织模式

4.1 分层结构

4.2 分区

4.3 分箱

4.4 全排序

4.5 混排

第5章 连接模式

5.1 连接简介

5.2 reduce端连接

5.3 复制连接

5.4 组合连接

5.5 笛卡儿积

第6章 元模式

6.1 作业链

6.2 链折叠

6.3 作业归并

第7章 输入和输出模式

7.1 在Hadoop中自定义输入和输出

7.2 生成数据

7.3 外部源输出

7.4 外部源输入

7.5 分区裁剪

第8章 最后的思考与设计模式的未来

8.1 数据的本质趋势

8.2 YARN的影响

8.3 作为库或者组件的模式

8.4 读者可以帮到什么

附录A 布隆过滤器

A.1 综述

A.2 用例

A.3 缺点

A.4 调整你的布隆过滤器



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3