python数据分析案例 │ 美国总统大选数据可视化分析(附源码)

您所在的位置:网站首页 美总统选票图 python数据分析案例 │ 美国总统大选数据可视化分析(附源码)

python数据分析案例 │ 美国总统大选数据可视化分析(附源码)

2023-11-29 18:30| 来源: 网络整理| 查看: 265

■ 图1 2016美国总统大选数据集

本案例的数据文件中可以用于每个月民意调查统计的数据有3列。其中enddate属性表示统计选票数据的结束日期;rawpoll_clinton和rawpoll_trump属性分别表示克林顿和特朗普在这一天获得的选票数。因此,本案例的任务是从enddate属性中提取年份和月份,然后将rawpoll_clinton和rawpoll_trump属性的取值以月份为单位进行统计。

3

实现代码

基于扩展库pandas的Python实现代码如下所示:

代码8~9行使用扩展库pandas提供的to_datetime函数可以将格式不统一的日期字符串转换为Series对象,其中Series对象的值是形如“yyyy-mm-dd”格式的时间日期型标准化数据,然后使用to_period("M")方法将时刻向量df_data["enddate"].dt转换成形如“yyyy-mm”的时期数据。

4

运行结果可视化分析

运行以上代码可视化结果如图2所示。

■ 图2美国总统大选数据可视化

从图2可以看出,基于原始数据的选票统计信息中,克林顿(Clinton)获得的选票数量与川普(Trump)旗鼓相当,有些时间段克林顿获得的选票数量比川普还略胜一筹。然而,在调整后的选票数量对比中发现,克林顿的选票优势逐渐下降,有些时间段比川普获得的选票数量稍逊一筹。这也许就是部分民众对川普2016年当选美国总统颇有微词的可能原因之一吧。

显然,由于扩展库pandas提供了大量用于数据清洗和数据分析的函数和对象方法,使得数据分析工作快捷而有效。对比发现,数值计算工具numpy更擅长科学计算应用,而基于扩展库numpy的数据分析工具pandas更擅长简洁而有效的专业化数据分析工作。

5

源代码下载及运行

关注微信公众号,后台回复关键词 “美国总统大选数据可视化分析” 即可获得完整源代码。

6

参考书籍

《Python数据分析案例教程(微课版)》

作者:于晓梅 李贞 郑向伟 朱磊

定价:99.9元

内容简介

本书内容从Python基础到扩展库,从编程到数据分析,再到机器学习和深度学习,循序渐进,逐步推进知识点的实际应用。首先简要介绍数据分析相关概念和Python基础知识;然后按照数据分析的主要步骤,重点介绍数据获取、数据预处理、数据分析、数据可视化以及机器学习过程相关的扩展库,包括beautifulsoup4、numpy、matplotlib、pandas、pyecharts和sklearn等;最后将Python数据分析知识和实用案例有机结合,通过大量的实用案例演示相关理论和Python语言的应用。本书适合作为高等院校本科生、研究生数据分析等课程的教材,也可以作为数据分析初学者的自学用书,还适合从事相关工作的工程师和爱好者阅读。返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3