想成为数据产品经理,先掌握这些数据分析方法论(二) |
您所在的位置:网站首页 › GMV拆解有差异 › 想成为数据产品经理,先掌握这些数据分析方法论(二) |
之前在《想成为数据产品经理,先掌握这些数据分析方法论》一文中,分享了一些基础的数据分析方法,从业务分析、用户分析和产品运营三个方面提供了一些分析的切入角度。接下来,进阶一步,我们再来看看还有哪些实用的分析工具。 在《想成为数据产品经理,先掌握这些数据分析方法论》一文中分享过杜邦分析法,杜邦分析法是财务中常用的拆解指标的方法,可以将核心指标拆解为多个因素乘积的形式,如GMV=访客数*转化率*客单价。 在做完指标拆解后,应该如何进行进一步归因呢?本月GMV上涨了,是访客数增长的贡献还是转化率上升的结果,抑或是因为客单价的提升? 为此,我们需要引入另一个在财务领域广泛应用的分析方法——因素分析法。 1. 因素分析法是什么?因素分析法是在将核心指标拆解为多个因素后,识别各因素对核心指标影响程度的一种方法。 我们将指标拆解后,当然,可以用控制变量法来计算每个因素的贡献,比如,假设上月的GMV、访客数、转化率、客单价分别为GMV0、V0、T0、M0,本月的GMV、访客数、转化率、客单价分别为GMV1、V1、T1、M1,那么 GMV0=V0*T0*M0 GMV1=V1*T1*M1 我们要判断访客数,也即流量的贡献,按照控制变量法,假设转化率和客单价与上月一样,访客数变化所带来的GMV提升为: Attr_V=V1*T0*M0– V0*T0*M0 同样,计算转化率贡献的公式为: Attr_T=V0*T1*M0– V0*T0*M0 这里用到的是传统的控制变量的思想,但要使用控制变量法需注意一个前提,那就是各个变量之间要相对独立,但真实情况下,各个因素之间都是相互影响的,很难保证独立性。 而因素分析法所采用的是连续替代的方法,在计算下一个因素的贡献时,会考虑到上一个因素的变化,可以有效地规避控制变量法中不独立的问题,我们具体看一下如何操作。 首先,我们在上月GMV0的基础上,用本月的访客数V1替换V0,接着再依次用T1替换T0,M1替代M0,可以得到: 上月GMV:GMV0=V0*T0*M0 ① 第一次替代V:V1*T0*M0 ② 第二次替代T:V1*T1*M0 ③ 第三次替代M:V1*T1*M1 ④ 而每一次替代前后的变化,就是对应因素的贡献值,即: Attr_V=②-① Attr_T=③-② Attr_M=④-③ GMV1-GMV0= Attr_V+ Attr_T+ Attr_M 2. 举个栗子下面,我们举个实际的例子来熟悉一下上述方法。 假设9月和10月的数据如下: 那么,用因素分析法依次替代后的结果如下: 9月GMV:GMV0=V0*T0*M0=12w ① 第一次替代V:V1*T0*M0=15*1%*60=9w ② 第二次替代T:V1*T1*M0=15*2%*60=18w ③ 第三次替代M:V1*T1*M1=15*2%*70=21w ④ 各因素的贡献率分别为: Attr_V=②-①=9-12=-3w Attr_T=③-②=18-9=9w Attr_M=④-③=21-18=3w 由此可见,10月的访客数较上月有所减少,导致了3w元GMV的流失,但流量显然更精准,转化率明显提升,且转化率的贡献最大,带来了9w元的GMV增量,此外,流量质量也较高,客单价有所上涨,带来了3w元的GMV提升。 因此,后续应该加强流量的引入,转化率可以分渠道进一步分析,针对高转化率的渠道进行重点运营,而客单价可以进一步分析是产品价格提升了,还是用户买的产品数量更多了。 因素分析法的作用,就在于可以找到关键的正向或负向因素,当精力或资源有限时,可以有的放矢,重点解决关键问题。 3. 替代顺序如何确定?看到这里,不知道大家有没有发现,如果改变一下替代的顺序,各因素的贡献值会发生变化,比如,如果先替换客单价,那客单价的贡献值肯定跟上面的结果有所差异。 那么,我们应该如何保证因素分析法的有效性呢? 因素分析法是建立在某种前置假设的逻辑之下的,既然无法将各因素割裂进行分析,那么就依次考虑各因素的叠加效应,而这个次序需要遵循实际经济意义上的先后逻辑。 比如,以上述的访客数、转化率和客单价为例,自然是先有访客到访浏览,才会有下单转化,之后才会产生交易金额。也即先得有人来,来了才会决定买不买,决定买了再看花多少钱买。 同样,如果我们把GMV拆成价格*销量,那么应该先考虑价格的贡献,再计算销量的贡献,因为是先定价,才会有销量,而且销量很大程度会受到价格的影响。 二、用户分析:如何分析品牌认知差异?网络社交媒体和电商平台中沉淀着大量的用户反馈信息,通过舆情的挖掘分析,可以为品牌商提供多角度的参考建议,指导品牌商进行产品或服务的优化。 很多品牌商都会定期找调研公司进行调研,从而了解用户对品牌的认知,以指导下一阶段的品牌形象建设或品牌差异化策略。 有很多调研的分析方法同样适用于舆情的分析,接下来就分享其中的一种——对应分析。 对应分析(Correspondence analysis)也称关联分析,是一种多元相依变量统计分析技术,是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。 简单来讲,其实就是先将各类变量放到一起进行相关性分析,把关联度高的进行归类,达到降维的效果,如将为二维(两个分类),接着,再看各变量在这个二维空间中的位置,最终判断变量间的关联性。 对应分析与因子分析的差异,就在于因子分析是针对一个变量中的值进行归类,看的是相同变量的相似性,如老鹰和麻雀都可归为鸟类,而对应分析包括多个变量,还能看不同变量的关联性,如老鹰(鸟类)与食物(鼠)的关联度高,麻雀(鸟类)与谷类(食物)关联度更高。 对应分析的具体原理在此不做赘述,大家感兴趣的话可以上网查阅,接下来,我们看一看实际的例子(数据都是我编的,如有雷同,应该是抄我的)。 1. 基础入门:简单对应分析现在,假如我们将用户的评论、反馈数据,通过切词、归类编码后,得到以下数据表: 简单对应分析适用于两个变量交叉分析,我们先选“品牌”和“认知”这两个变量来进行对应分析。 在很多分析工具中都有对应分析的功能或程序包,我们以SPSS为例,在SPSS菜单中选择【分析】-【降维】-【对应分析】,选择行列分别为“品牌”和“认知”,可以得到以下摘要表: 我们看到显著性sig=0.000 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |