GitHub

您所在的位置:网站首页 spark项目实战案例论文 GitHub

GitHub

2024-07-14 15:23| 来源: 网络整理| 查看: 265

case_pyspark

基于Python语言的Spark数据处理分析案例集锦(PySpark)

实验环境

1) Linux: Ubuntu 20.04 2) Python: 3.7.x 3) Spark: 2.4.5(安装教程:http://dblab.xmu.edu.cn/blog/2501-2/) 4) Jupyter Notebook: (安装教程和使用方法:http://dblab.xmu.edu.cn/blog/2575-2/)

案例

1) yelp: 基于YELP数据集的商业数据分析 2) us_counties: 2020年美国新冠肺炎疫情数据分析 3) ECommerce: 基于零售交易数据的Spark数据处理与分析 4) earthquake: 基于地震数据的Spark数据处理与分析 5) global: 基于Spark的地震数据处理与分析 6) OverDue: 基于信用卡逾期数据的Spark数据处理与分析 7) project: 基于 TMDB 数据集的电影数据分析



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3