虚拟主播直播数据的一种综合比较方法

您所在的位置:网站首页 虚拟主播人气 虚拟主播直播数据的一种综合比较方法

虚拟主播直播数据的一种综合比较方法

2024-07-13 21:47| 来源: 网络整理| 查看: 265

目前有一些组织会定期对虚拟主播的直播数据进行统计和比较,制作的专栏有V面观测日报(如CV9019761)等。但进行比较的数据一般都是某一个维度(如人气值或营收),或者某两种数据的比例,而没有同时使用多个维度的数据进行比较。在网站 https://vup.darkflame.ga/ 上有B站虚拟主播直播数据的详细记录,常用的有6个维度:直播时长、营收、付费人数、互动人数、弹幕总数和人气峰值。我希望用一种单一数据对原本多维的直播数据做出综合比较,这可以让普通观众更方便地了解V圈的发展状况。本专栏中使用了主成分分析法来达到这个目的。

使用的原始数据是vup.darkflame.ga上12月份星期五、星期六和星期日的直播数据(排除12月13日),选用了上述6个维度的数据。经过筛选,选择了在统计范围中直播不少于4次、平均互动人数大于2000的共计28位虚拟主播作为统计对象。计算出直播数据的平均值,用于后续处理。下表是平均值数据(按互动人数排序)。

主成分分析法是一种数据降维方法,其基本思想是对多维的变量进行线性组合,产生新的变量,称为主成分。主成分的计算原则是表达的方差达到最大,也就是所含的信息量最多。这样,原本多维数据中的信息可以集中在前几个维度中。

在本次统计中,首先对原始的平均值数据进行标准化,即减去平均值再除以标准差。这是因为原始数据中各维度的单位不同并且大小差异很大,通过标准化可以将6种数据平等地分析。之后利用matlab进行主成分分析运算。下表是各主成分表达的信息量和线性组合系数。线性组合系数可以理解为,某虚拟主播各维度数据(营收、互动人数等)乘上组合系数并相加即得到该虚拟主播的一个主成分值。

第一主成分是包含最多信息(最能反映原始数据差异)的一个变量,它可以综合地反映出某个虚拟主播的6个维度直播数据与其他主播之间的差别。因此,可以使用这一数据对直播数据进行综合比较。虽然它表达原始数据所含信息的比例不是很大(50.11%),但它的计算方法与一般经验是相符的:在直播时长相同时,其余数据越大则直播越好;在其余数据相同时,直播时长越短则直播越好。在此可以把这一主成分称为综合评价因子,原始数据标准化后它的计算公式为:

综合评价因子 = 营收×0.2715 + 付费人数×0.4756 + 互动人数×0.5193 + 弹幕总数×0.3858 + 人气峰值×0.4827 - 直播时长×0.2202

在这一评价因子中,互动人数是影响最大的一个维度。

下图是计算得到不同虚拟主播的综合评价因子后作出的统计图,为了阅读方便,将长图剪成了三段。这一因子的绝对大小没有直接意义,但相对大小可以用来比较不同虚拟主播的直播情况,或对同一主播不同场次的直播做出比较。

从统计图中很容易看出,泠鸢和Hiiro是在统计范围内综合直播数据最高的虚拟主播,并且远高于其他主播。但这种评价因子的效度需要靠各位DD来检验。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3