数据分析必看!pandas的使用须知

您所在的位置:网站首页 series对象内的数据是有序的 数据分析必看!pandas的使用须知

数据分析必看!pandas的使用须知

2023-06-10 18:41| 来源: 网络整理| 查看: 265

1. pandas是什么? pandas是基于NumPy的一款开源数据分析和可视化工具,用于数据操作和分析。

2. pandas的两大对象是什么? pandas的两大对象是Series和DataFrame。

3. Series是什么? Series是一维数组,与Numpy的ndarray类似。它由值和索引组成。

4.DataFrame是什么? DataFrame是一个二维的表格型数据结构,包含有序的列和索引。

5. 如何创建Series? 可以使用pandas.Series()函数创建Series,例如:s = pd.Series([1,2,3])

6. 如何创建DataFrame? 可以使用pandas.DataFrame()函数创建DataFrame,例如:df = pd.DataFrame([[1, 2, 3], [4, 5, 6]])

7. 如何选取DataFrame中的行列? 可以使用[]运算符选取行或列,例如:df[0:2]  #选取前两行df['col1'] #选取col1列

8. groupby是什么? groupby是pandas中的分组函数,可以将数据分组进行聚合统计。

9. agg是什么? agg是pandas中的聚合函数,用于groupby分组后的数据聚合。

10. pandas的重采样方法有哪些? pandas的重采样方法有: resample - 重采样 asfreq - 根据频率转换时间序列 interpolate - 根据索引进行插值 fillna - 填充缺失数据 dropna - 删除缺失数据 

11. 如何重命名Series和DataFrame? 可以使用.rename()方法重命名,例如:s.rename('new_name')df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})

12. 如何设置Series和DataFrame的索引? 可以使用.set_index()设置索引,例如:s.set_index('new_index')df.set_index('col1')

13. 如何对齐Series和DataFrame?  可以使用.align()方法对齐,例如:s1.align(s2)df1.align(df2)

14. 如何用iloc和loc选取数据? .iloc按位置选取,.loc按标签选取。例如:df.iloc[0, 0] # 选取第一行第一列df.loc['row1', 'col1'] # 选取row1行col1列

15. 如何给Series和DataFrame排序? 可以使用.sort_values()对Series和DataFrame排序,例如:s.sort_values()df.sort_values('col1')

16. cut和qcut方法的用途? cut和qcut用于将连续变量离散化。cut以bin划分,qcut以分位数划分。

17. pandas的缺失值处理方法? dropna删除缺失值,fillna填充缺失值,interpolate插值填充。

18. pandas的合并方法?  pandas的合并方法有: concat - 连接Series、DataFrame merge - 数据库风格的join join - 依据索引将行连接

19. pandas的数据规整方法? 数据规整方法有:pivot_table进行数据透视,melt进行列转行,stack进行层叠。

20. .map()和.apply()方法的区别? .map()用于Series,根据字典或函数对值进行映射。 .apply()既可用于Series也可用于DataFrame,根据函数对每个元素或行列进行计算处理。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3