Python数据分析

您所在的位置:网站首页 互联网数据分析法 Python数据分析

Python数据分析

2024-06-14 09:28| 来源: 网络整理| 查看: 265

一、对比分析

什么是对比分析?

对比分析就是将两个及以上数据进行比较,通过其中差异揭示业务发展趋势及问题。

优点:简单、直观、量化的特点。

缺点:不易得知问题的严重程度。

对比原则:

1、对比对象要有相似性,如:偏远山区的人均收入和超一线城市的人均收入没有可比性。

2、对比指标同质性,

一是指标口径要一致。如:今天的收入和上个月的收入比,没有可比性。

二是计算方式要一致。如:今天部门总收入和公司人均收入,一个是加法,一个是除法,计算方式不同。

三是计量单位要一致。如:当月收入,不同国家的汇率不同。

问题一:比什么?

(1)绝对值:本身具备价值的数字。如:销售金额、阅读数、DAU、MAU、 (2)比例值:在具体环境中看比例才具备对比价值。如:活跃占比、注册转化率    举例:今日日活下降100人,如果平常日活只有110人,问题就大了,如果平常日活10000人,可能就是正常的数据波动。    缺点:易受到极端值影响 (3)波动对比:通过计算一定时期内标准差、方差、极差、变异系数等指标,比较波动情况。 (4)趋势对比:趋势对比又可从时间、空间维度进行划分。

问题二:怎么比?

环比:连续2个统计周期(比如连续两周)内的量的变化比。    对短期内具备连续性的数据进行分析。    需要根据相邻时间范围的数字对当前时间范围的指标进行设定。

同比:本年第n月与过去某年的第n月比。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与同期发展水平对比而达到    的相对发展速度。    观察更为长期的数据集    观察的时间周期里有较多干扰,希望某种程度上消除这些干扰。

问题三:和谁比?

1、和自己比 (1)从时间维度。如:推送的活动本周和上周活跃人数的比较。 (2)从不同业务线。如:两种方案哪种获得的客户较多。 (3)从过往经验估计(非连续数据)

2、和行业比 (1)是自身因素,还是行业趋势? (2)都跌,自己跌的幅度和同行怎么样 (3)都涨,自己涨的幅度和同行怎么样

二、多维度拆解

注意: (1)维度拆解分析是可以叠加的。 (2)辛普森悖论:在某些情况下,如果没有详细拆解内部数据,得出的结论会背离实际情况。 举例: (1)DAU(Day Active User)用户使用手机的类型看出我们的目标群体。 (2)启动我们app的方式,桌面还是通知栏,看出客户倾向于怎么查看我们的产品。 (3)城市维度,我们主推的城市和其他城市的对比,是否存在地区性的差异。 (4)新老用户的维度,随着这一轮市场推广,日活整体型化不大,但这是因为老用户占比下降、新用户占比不断上升,掩盖了流失。 (5)对业务流程,拆解维度,初期–>中期–>后期,据业务sop看。 (6)设备(ios/android)。 (7)地域维度,省份,城市 (8)性别维度,男,女等 (9)渠道维度,线下,线上,还可以继续具体细分 (10)政策、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会、技术、 多维度拆解的适用场景

1、分析单一指标的构成   适用于,计算分栏目的播放量,新老用户比例、转化率、新客户客单价、老客户复购率等。

2、针对流程进行拆解分析   不同渠道的浏览、购买转化率,如:某渠道流量很高但是转化率低,可考虑减少该渠道投放。   不同省份的活动参与漏斗

3、还原行为发生时的场景   打赏主播的等级、性别、频道、直播类型   是否在WiFi或4G环境下   活动时下单还是活动结束

运作原理   指标/业务流程需要按照多维度拆分,来观察变动

适用场景   需要分析单一指标的构成、比例时   需要针对流程进行拆解分析   需要还原行为发生时的场景

数据涨跌异动如何处理

搞明白每一次涨跌背后的业务逻辑: 一般流程:发现问题–>确定问题–>确定原因–>针对性解决问题 -->执行 (1)跌:采



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3