SPSS聚类分析:公众号文章怎么写才能受欢迎?(附案例详解) |
您所在的位置:网站首页 › paper数据分析公众号 › SPSS聚类分析:公众号文章怎么写才能受欢迎?(附案例详解) |
在公众号的日常运营中,我们经常需要对文章进行数据分析,其中最有代表性的就是双高(高打开率、高分享率)、双低分析 这个分析可以非常好地帮助我们了解哪些文章既是选题比较好(包括标题),而同时内容又是比较受用户欢迎的。那具体我们该如何进行双高双低分析呢? 常规的分类统计法及存在的问题 按照最常规的思路,我们可以先将文章进行分类,然后统计不同类别文章的平均打开率、分享率,通过Excel里面的透视图就可以很直观地了解哪类文章属于双高,而哪些又属于双低。 分类的方式有很多种,比如可以按照文章所属栏目、作者甚至是星期几;另外一种思路就是通过不同维度给文章打标签,比如内容标签(属于什么类型的内容)、类型标签(文章属于什么类型,科普文、鸡汤文等)、情感标签(正向、负向;开心、焦虑、恐惧等)。 下图就是一个通过内容标签对文章进行分类,然后在Excel里得到的透视图,通过这个图我们可以很直观地看出双高文章标签是「个人成长」、「话题讨论」,「金融投资」和「商品推广」则是双低。 利用标签分类法进行双高双低分析 这种对事物先进行分类,进而归纳并发现其规律是一种非常简单且实用的方法,但也有自身的局限性,主要表现在两个方面: 1. 凭经验和专业知识不能准确地分类 比如对公众号打标签,标签有很多维度,一篇文章是属于标签A还是B很多时候往往凭主观因素判断。 2. 单元变量很难反映事物的全部特征 即使按照某种规律进行了分类,但是这种分类并不能完全反映背后的规律。还是上图为例,虽然「话题讨论」类文章「阅读数」、「在看数」最高,但是这个标签里仍然有数据比较差的文章,甚至低于「商品推广」类的某些文章。 那除了分类法,还有什么其他的统计方法可以进行双高双低分析吗? 有的,这就是我们今天要介绍的聚类分析法。 什么是聚类分析法 1. 定义 聚类分析也称群分析或点群分析,它是研究多要素事物分类问题的数量方法,是一种新兴的多元统计方法,是当代分类学与多元分析的结合。其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。 通俗的讲,聚类分析就是根据事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。应用到公众号文章上,我们认为双高文章一定具备某些类似属性(可能已知,也可能未知),利用聚类分析就可以很好地把这些好文章给找出来。 常用聚类方法:系统聚类法,K-均值法,二阶聚类法等。 聚类分析法背后的数学原理比较复杂,我们可以直接拿过来用,不用太深究其背后的原理。 2. 聚类分析法和标签分析法的区别通过上面的介绍,我们可以很明显地看出聚类分析和标签分析法的区别: 标签分析法要先找出规律,然后分类,最后统计数据聚类分析法完全不用先假设条件,通过对文章数据(打开率、分享率)分析,找出拥有双高特征的文章,然后我们才对双高文章进行分析并从中找出规律来如何使用SPSS聚类分析 1. 安装SPSS软件,比如IBM SPSS Statistics 可以从官网下载试用版,或者网上搜索下载链接。 2. 数据准备 可以利用壹伴等工具将公众号后台数据导出来,把需要分析的维度保留下来。下表就是一个最简单的数据表格,仅包括「话题讨论」、「打开率」和「分享率」。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |