Power BI数据分析实战

您所在的位置:网站首页 excel筛选后形成新的表格怎么做 Power BI数据分析实战

Power BI数据分析实战

2024-06-20 16:34| 来源: 网络整理| 查看: 265

今年刚刚接触数据分析相关的内容,使用的第一款数据分析软件就是Power BI,第二款是Tableau,个人感觉Power BI会比较好用一些,也是免费的数据分析软件。

最近在做一些数据库的数据分析的时候,遇到了一个问题,觉得比较经典,于是记录一下。

场景描述

从数据库拉出一堆数据,结果发现大多数据基于数据库都无法处理,举个简单的例子,从数据库拉出的数据如下:

日期事件人数2023/4/18摸鱼122023/4/18吃饭392023/4/18打螺丝1122023/4/18办公602023/4/18管理202023/4/19摸鱼62023/4/19吃饭502023/4/19打螺丝1302023/4/19办公452023/4/19管理152023/4/20摸鱼102023/4/20吃饭692023/4/20打螺丝1092023/4/20办公672023/4/20管理24

(以上数据纯属瞎写,仅用于举例子)

而我需要的数据是在每一天中摸鱼的人数占总人数的比,或管理人员占打螺丝人数的比,又或是办公室人员占打螺丝人数的比。像这种类似的数据,我觉得在工厂的数据库里应该是比较常见的,如果只是采用excel里面的方法去做的话,工作量无疑是巨大的,因为工厂里面的数据需要分析的少说也有半年一年的,而一天的数据远不止我列举的这些。

解决方法

使用Tableau可以实现上述的问题,只需要一小段代码就可以,但是我个人不喜欢用Tableau的原因有两个,一是它收费,二是对于数据太大的数据库,Tableau查询数据库太慢了(也可能是我操作不当,有时候查询半个小时都没查询完,我都懒得等了),也没有一个进度条,查询数据的时候只告诉你已经查询了几分钟,也不说还剩几分钟。

接下来介绍如何用Power BI去解决这个问题。Power BI有两个函数可以基于原数据表,生成新的数据表,分别是SUMMARIZE()和SUMMARIZECOLUMNS()。两个公式是一个筛选条件和多个筛选条件的关系。从原数据表提取想要的数据,就要有筛选条件,要知道自己想要的是什么数据。

函数详解

SUMMARIZE()可以实现的功能,SUMMARIZECOLUMNS()都可以实现,所以这里主要介绍SUMMARIZECOLUNS()的使用方法。

 这个函数可以包含很多的参数(上限不知道,我使用的时候还没有达到过上限),第一个名称前都是筛选条件,名称后面就必须是一个计算的表达式,当开始了第一个名称,后面必须全部都是名称-表达式,名称-表达式的参数。

问题解决

由于只是举个例子,不会过多的去解决问题,如果有不懂,欢迎评论区留言,一起交流学习。

现在针对每天管理人数占打螺丝人数比例的变化情况进行分析。首先需要把每天的管理人数和打螺丝人数从数据中提取出来,方便后续调用。这里通过新建列的方式用简单的IF()函数就可以实现。

 当我们把需要的数据从数据库从提取出来后,就可以通过新建表的方式来计算占比变化。

  新建的表格通过SUMMARIZECOLUMNS()就可以实现把想要的数据提取出来了,再新建一列,把两个数据一除就可以得到占比。

 用这个函数就可以实现从数据库的一堆数据中筛选出自己想要的数据,筛选条件只需要在“管理”前面继续加就行了,比如班次,区域之类的,我这里只是简单举例,所以筛选条件只放了时间。

 结语

本人也只是个数据分析小白,才刚接触不久,如果有幸让数据分析大师看见了,觉得这个方法不行,太麻烦了,欢迎在评论区指点我一下。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3