Hadoop的起源及发展历程 |
您所在的位置:网站首页 › hadoop发展 › Hadoop的起源及发展历程 |
Hadoop之父 Doug Cutting 狭义上来说,Hadoop就是单独指代Hadoop这个软件(HDFS+MAPREDUCE) 广义上来说,Hadoop指代大数据的一个生态圈(Hadoop生态圈),包括很多其他的软件。 0.x系列版本:Hadoop当中最早的一个开源版本,在此基础上演变而来的1.x以及2.x的版本 1.x版本系列:Hadoop版本当中的第二代开源版本,主要修复0.x版本的一些bug等 2.x版本系列:架构产生重大变化,引入了yarn平台等许多新特性 1、HDFS:一个高可靠、高吞吐量的分布式文件系统。 (海量数据的存储) HDFS集群包括,NameNode和DataNode以及Secondary Namenode。 管理者:NameNode详细介绍 辅助管理者(无法替代管理者)SecondaryNameNode 用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。最主要作用是辅助namenode管理元数据信息 工作者:DataNode详细介绍 2、MapReduce:一个分布式的离线并行计算框架(海量数据的计算)。 3、YARN:集群资源(调度)管理的框架。 管理者:ResourceManager 工作者:NodeManager 4、Common:支持其他模块的工具模块。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |