GitHub |
您所在的位置:网站首页 › spark项目实战案例论文 › GitHub |
case_pyspark
基于Python语言的Spark数据处理分析案例集锦(PySpark) 实验环境1) Linux: Ubuntu 20.04 2) Python: 3.7.x 3) Spark: 2.4.5(安装教程:http://dblab.xmu.edu.cn/blog/2501-2/) 4) Jupyter Notebook: (安装教程和使用方法:http://dblab.xmu.edu.cn/blog/2575-2/) 案例1) yelp: 基于YELP数据集的商业数据分析 2) us_counties: 2020年美国新冠肺炎疫情数据分析 3) ECommerce: 基于零售交易数据的Spark数据处理与分析 4) earthquake: 基于地震数据的Spark数据处理与分析 5) global: 基于Spark的地震数据处理与分析 6) OverDue: 基于信用卡逾期数据的Spark数据处理与分析 7) project: 基于 TMDB 数据集的电影数据分析 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |