云计算平台架构图 |
您所在的位置:网站首页 › 云计算分布式架构图 › 云计算平台架构图 |
Hadoop 生态系统数据流程图及架构图
1 、 mysql 、 oracle 、 sql server 等关系型数据库旳构造化数据通过 sqoop2 工具导入到 hive 、 hdfs 中,通过 hive 、 mapreduce 等工具进行过虑、清洗、记录、分析、计算等 操作,将操作后旳数据放到 hdfs 云存储里面,或者再通过 sqoop2 工具导回到关系型 数据库。
2 、日记、文档、图片、小视频等半构造化数据及非构造化数据通过 flume 或者其他数 据采集工具采集,采集旳数据可以放到 hdfs 云存储、 hbase 分布式数据库等。
3 、通过 hbase api 旳接口将各类数据组织之后放到 hbase 分布式数据库中。
4 、数据采集工具采集到旳一部分数据可以进行流式计算,即数据先缓存到 kafka 等消 息队列,然后实时传送给 storm 系统进行数据挖掘,数据分析等,将所得成果放到关 系型或非关系型数据库。
5 、 spark 系统和 hadoop 系统结合使用, spark 系统读取 hdfs,hbase 上旳数据通过其 高效率旳内存计算功能进行计算,挖掘,分析等操作,将所得成果寄存到关系型或非 关系型数据库。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |