数据分析中常犯的14个错误,如何解决?

您所在的位置:网站首页 tableau不等于某值 数据分析中常犯的14个错误,如何解决?

数据分析中常犯的14个错误,如何解决?

#数据分析中常犯的14个错误,如何解决?| 来源: 网络整理| 查看: 265

举个例子:

在某产品开放日,邀请使用该产品的用户到现场给产品打分,结果用户满意度都很高,其实就是一个幸存者偏差的例子,愿意来现场打分的客户,基本上都是忠实客户了,得分自然就高。

避免的方法:

还是样本不具备代表性的问题,避免主观臆断,用科学的方法选择样本。

数据处理阶段

在数据处理阶段,容易犯的错误:

NO.3 不注意数据的清洗

行百里者半九十,都说做数据分析有80%的时间都是在处理数据,其实就在告诉我们数据处理是多么的重要,干净的数据源是一切工作的前提,不然一切都要从头开始。

NO.4 在原始数据上直接处理

尽量不要直接在原始数据上开始修改处理,最好拷贝一份,保留好原始数据。这样做的目的是避免后续处理时出现错误,无法返回到原始数据的情况。

举个例子:

在做异常值处理时,直接把异常值删除了,后面发现其实不是异常值,而是一个值得注意的小概率事件,这就麻烦了,还不如一开始就在原始数据的备份上进行操作。

避免的方法:

在拷贝的原始数据上处理。

数据分析阶段

在数据分析阶段,容易犯的错误:

NO.5 只会工具,不会分析

各种数据分析工具Excel、SQL、Python、Power BI、Tableau运用的炉火纯青,但却没有一个分析的逻辑思维方法,没有深入地去分析现象背后的原因。通常要搞清楚分析的目的是什么,工具都是辅助。

避免的方法:

多学习和总结一些思维和方法,并能够成功地运用,掌握其要领。

NO.6 过于追求高级方法/工具

在分析时,崇尚所谓高级的、时尚的方法,而不从项目自身实际出发,找到适合项目的分析方法。同样,过分追求“高端”工具的使用,比如在数据量很少的情况下,非要用数据库/Python,但其实Excel就可以简单便宜地满足分析的需求。

避免的方法:

合适的才是最好的。

可视化阶段

在可视化阶段,容易犯的错误:

NO.7 不做图表

用文字来表达结果,肯定不如直接上图更显而易见。

避免的方法:

能用图表展示的结论就少用文字来描述。

NO.8 误导性的图表

比不做图表更可怕的是做出具有误导性的图表。常见的比如把Y轴的刻度不从0开始计,这样得到的图形走势就显得差距非常大,给人造成一定程度上的视觉冲击,但实际上,差距并没有那么大。

举个例子:

下图中净利润的增长可以看到Q4增长幅度非常明显,但仔细一看可以发现,纵坐标是从13%开始的,如果把纵坐标调成0%开始,就会发现这个增长幅度其实并不明显。

纵坐标从13%开始

纵坐标从0开始

避免的方法:

保持客观的态度做图表,不要被心里预设的结论所左右,该是什么就是什么。

得出结论阶段

在得出结论时,容易犯的错误:

NO.9 主观臆断

完全抛弃数据,而是以自我经验或想法来给出结论。这样做数据分析就没有意义了,要保持客观的态度,不要总是“我觉得”,“我认为”,要以数据为依据。

避免的方法:

以数据为导向,保持一个数据人应用的科学客观的态度。

NO.10 数据偏见

在得出结论时,仅选择支持你声明的数据,丢弃不支持声明的部分。这就失去了客观性,是建立在数据上的主观臆断,一定要让数据反映出客观事实。

举个例子:

发现了啤酒和尿布的销量一样好,如果我只选择性地关注啤酒的销量,而忽视尿布,那就不会有购物篮分析了。

避免的方法:

客观,客观,还是客观的态度。

NO.11 相关性==因果性

我们经常说相关性不等于因果性,两个变量之间存在相关关系,并不意味着一个变量会影响另一个变量,也不意味着二者存在实际关系。

如果一个指标和另一个指标是一起变化的,说明它们是相关的,而如果是一个指标先变化从而导致了另一个指标的变化,才说明它们是有因果性的。

在数据分析时很容易将相关性判断为因果性,这是不对的。相关性已经很好了,但因果性更佳,很多时候,我们只能发现相关性,但应永不停止寻找因果性。因为发现相关性可以帮助我们预测未来,而发现因果性意外着可以改变未来。

NO.12 唯数据论

由数据分析得到的结果不具备可行性,完全不考虑常识和业务需求,数据脱离了业务,也是常犯的错误。

避免的方法:

多了解业务,多沟通,不要一味搞技术。

其他

NO.13 先预设一个结果,再倒推原因

依据经验常识先预设了一个结果,再从结果出发,为结果找原因,这也是一种主观臆断,颠倒了数据分析的逻辑,我们应当是先分析,再结果,现在变成了先结果,再为结果找一个说辞。

避免的方法:

可以有假设,但假设不能等同于结论,大胆假设,小心求证。

NO.14 忽视黑天鹅事件

在发现澳大利亚的黑天鹅之前,17世纪之前的欧洲人认为天鹅都是白色的。但随着第一只黑天鹅的出现,这个不可动摇的观念崩溃了。

黑天鹅的存在寓意着不可预测的重大稀有事件,它在意料之外,却又改变着一切。人类总是过度相信经验,而不知道一只黑天鹅的出现就足以颠覆一切。

2008年美国次贷危机爆发就是一个典型的黑天鹅事件,大家用通用的风险价值模型预测投资风险,结论是美国商业银行放贷业务崩溃发生的概率只有不到1%,结果我们都知道了,这种不到1%的小概率事件居然发生了。

避免的方法:

所以不要忽视小概率事件,它有可能会造成严重的后果。

- END -

爱数据福利大放送

回复【宝典】即可领取

《数据分析“上分儿”宝典》

理论篇:思维手册+统计学知识导图

技能篇:SQL+Python核心知识思维导图

实战篇:数据集+数据分析实战案例

求职篇:10+大厂笔面试题合集+20份数据分析岗简历模板

《数据分析“上分儿宝典”》内容概览

《统计学思维导图》概览

《数据分析岗简历模板》概览

回复 【宝典】即可领取哦~返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3