怎么用pandas写数据透视表的计算字段和计算项?

您所在的位置:网站首页 pandas面板数据 怎么用pandas写数据透视表的计算字段和计算项?

怎么用pandas写数据透视表的计算字段和计算项?

2023-06-06 10:05| 来源: 网络整理| 查看: 265

在Pandas中,数据透视表是一个非常有用的工具,可以根据一个或更多的值字段将数据聚合为二维表格。要在数据透视表中添加计算字段和计算项,Pandas提供了灵活 convenient 的方式。

创建数据透视表 使用`.pivot_table()`方法可以轻松创建数据透视表。例如,有这样一个DataFrame:

   | product | region | sales |   :--|:--|:--|:--   0 |   apple  |   east |   100 1 |   apple  |   west |    80   2 |  banana |   east  |    70  3 |  banana |   west |   110

可以这样创建一个数据透视表:

pivot = df.pivot_table(         values='sales',          index='product',         columns='region',         aggfunc=sum,          margins=True   )  

得到的结果为:

   product  east  west  All apple    100.0   80.0  180.0   banana    70.0  110.0  180.0   All      170.0  190.0  360.0

计算项和聚合函数 在`values`参数中指定需要聚合的字段,这将成为**计算项**。然后在`aggfunc`参数中指定聚合函数,如`sum`、`mean`、`count`等,用于计算各计算项的值。 如上例中,我们将`sales`字段指定为计算项,使用`sum`函数计算总销售额,从而得出`east`、`west`和`All`三个计算项的值。

计算字段 在`columns`或`index`参数中指定需要在透视表中添加为行列索引的值字段,这可以成为**计算字段**。 如上例中,我们将`region`字段指定为列计算字段,将`product`字段指定为行计算字段。并使用`margins=True`添加`All`计算字段。

总结 所以,通过灵活地指定`values`、`aggfunc`、`columns`和`index`参数,我们可以在Pandas数据透视表中添加自定义的计算字段和计算项,实现数据的聚合与分析。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3