数据分析必看!pandas的使用须知 |
您所在的位置:网站首页 › series对象内的数据是有序的 › 数据分析必看!pandas的使用须知 |
1. pandas是什么? pandas是基于NumPy的一款开源数据分析和可视化工具,用于数据操作和分析。 2. pandas的两大对象是什么? pandas的两大对象是Series和DataFrame。 3. Series是什么? Series是一维数组,与Numpy的ndarray类似。它由值和索引组成。 4.DataFrame是什么? DataFrame是一个二维的表格型数据结构,包含有序的列和索引。 5. 如何创建Series? 可以使用pandas.Series()函数创建Series,例如:s = pd.Series([1,2,3]) 6. 如何创建DataFrame? 可以使用pandas.DataFrame()函数创建DataFrame,例如:df = pd.DataFrame([[1, 2, 3], [4, 5, 6]]) 7. 如何选取DataFrame中的行列? 可以使用[]运算符选取行或列,例如:df[0:2] #选取前两行df['col1'] #选取col1列 8. groupby是什么? groupby是pandas中的分组函数,可以将数据分组进行聚合统计。 9. agg是什么? agg是pandas中的聚合函数,用于groupby分组后的数据聚合。 10. pandas的重采样方法有哪些? pandas的重采样方法有: resample - 重采样 asfreq - 根据频率转换时间序列 interpolate - 根据索引进行插值 fillna - 填充缺失数据 dropna - 删除缺失数据 11. 如何重命名Series和DataFrame? 可以使用.rename()方法重命名,例如:s.rename('new_name')df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'}) 12. 如何设置Series和DataFrame的索引? 可以使用.set_index()设置索引,例如:s.set_index('new_index')df.set_index('col1') 13. 如何对齐Series和DataFrame? 可以使用.align()方法对齐,例如:s1.align(s2)df1.align(df2) 14. 如何用iloc和loc选取数据? .iloc按位置选取,.loc按标签选取。例如:df.iloc[0, 0] # 选取第一行第一列df.loc['row1', 'col1'] # 选取row1行col1列 15. 如何给Series和DataFrame排序? 可以使用.sort_values()对Series和DataFrame排序,例如:s.sort_values()df.sort_values('col1') 16. cut和qcut方法的用途? cut和qcut用于将连续变量离散化。cut以bin划分,qcut以分位数划分。 17. pandas的缺失值处理方法? dropna删除缺失值,fillna填充缺失值,interpolate插值填充。 18. pandas的合并方法? pandas的合并方法有: concat - 连接Series、DataFrame merge - 数据库风格的join join - 依据索引将行连接 19. pandas的数据规整方法? 数据规整方法有:pivot_table进行数据透视,melt进行列转行,stack进行层叠。 20. .map()和.apply()方法的区别? .map()用于Series,根据字典或函数对值进行映射。 .apply()既可用于Series也可用于DataFrame,根据函数对每个元素或行列进行计算处理。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |