手把手教你用Python进行帕累托分析(二八定律)

您所在的位置:网站首页 帕累托图的分析 手把手教你用Python进行帕累托分析(二八定律)

手把手教你用Python进行帕累托分析(二八定律)

2023-03-27 00:22| 来源: 网络整理| 查看: 265

导读:本文带你用Python进行贡献度分析。贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。

作者:张良均 谭立云 刘名军 江建明

来源:大数据DT(ID:hzdashuju)

同样的投入放在不同的地方会产生不同的效益。例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品,而其他80%的产品只产生了20%的利润。

就餐饮企业来讲,应用贡献度分析可以重点改善某菜系盈利最高的前80%的菜品,或者重点发展综合影响最高的80%的部门。这种结果可以通过帕累托图直观地呈现出来。图3-10是某个月中海鲜系列的10个菜品A1~A10的盈利额(已按照从大到小的顺序排序)。

▲图3-10 菜品盈利数据帕累托图

由图3-10可知,菜品A1~A7共7个菜品,占菜品种类数的70%,总盈利额占该月盈利额的85.0033%。根据帕累托法则,应该增加对菜品A1~A7的成本投入,减少对菜品A8~A10的成本投入,以获得更高的盈利额。

表3-5是餐饮系统对应的菜品盈利数据,绘制菜品盈利帕累托图,如代码清单3-8所示。

▼表3-5 餐饮系统菜品盈利数据

代码清单3-8 绘制菜品盈利数据帕累托图# 菜品盈利数据帕累托图 import pandas as pd # 初始化参数 dish_profit = '../data/catering_dish_profit.xls'# 餐饮菜品盈利数据 data = pd.read_excel(dish_profit, index_col='菜品名') data = data['盈利'].copy() data.sort_values(ascending=False) import matplotlib.pyplot as plt # 导入图像库 plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号 plt.figure() data.plot(kind='bar') plt.ylabel('盈利(元)') p = 1.0*data.cumsum()/data.sum() p.plot(color='r', secondary_y=True, style='-o',linewidth=2) plt.annotate(format(p[6], '.4%'), xy=(6, p[6]), xytext=(6*0.9, p[6]*0.9), arrow-props=dict(arrowstyle="->", connectionstyle="arc3,rad=.2")) # 添加注释,即85%处的标记。这里包括了指定箭头样式。 plt.ylabel('盈利(比例)') plt.show()

关于作者:张良均,资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验,擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析,对机器学习等AI技术驱动的数据分析也有深入研究。

本文摘编自《Python数据分析与挖掘实战》(第2版),经出版方授权发布。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3