3种常见的统计学方法

您所在的位置:网站首页 收集氮气除了排水法还有什么方法 3种常见的统计学方法

3种常见的统计学方法

2024-07-02 02:06| 来源: 网络整理| 查看: 265

最近学习了3种常见的统计学方法:主成分分析法(PCA)、熵值法、层次分析法(AHP,又称专家打分法)。都可以用来计算指标(或属性)的权重,只有主成分分析法可以降维。PCA/熵值法都需要有对应的样本数据,比如10个样本,每个样本5个属性,共10*5个数据,才能应用;而层次分析法(AHP)不需要有数据,只需要专家对各个指标之间的相对重要关系进行打分,就能计算各指标权重,各指标权重就是构造的比较矩阵的特征向量(归一化后的),如果是多层,那就逐层计算,最后各层权重相乘得到最终权重。 主成分分析法:本质上就是将较多个的具有一定相关性的指标或属性简化为几个不相关的主成分,这些主成分由各指标或属性线性组合而成,组合的权重就是特征向量。能够实现浓缩凝练数据,对数据进行降维的作用。主成分分析可以同时计算主成分权重(常见用法)和各指标权重。选择特征根大的主成分,以特征根代表方差贡献大小,并计算方差贡献率。 spss和MATLAB中都可以实现主成分分析。 主成分分析的步骤如下: (1)数据标准化处理(S),注意不是归一化,标准化的方法是xi_new=(xi-mean(x))/标准差,注意是每个指标或者属性单独标准化,因为各个指标或属性的数值意义不一样,混在一起标准化显然是不合理的。 (2)求样本的协方差矩阵(cov),协方差矩阵S=(1/n-1)X*XT,就是标准化后的样本矩阵乘以其自身的转置。MATLAB上有命令可以直接求 (3)计算协方差矩阵的特征值和特征向量。可能有多个特征值,每个特征值对应一个特征向量,特征值越大,主成分权重越高,实际上,特征值归一化后就是对应主成分的方差贡献率,特征向量就是主成分的线性系数。一般累计方差贡献率大于85%即可,实现降维目的 (4)解释各主成分的新的含义,依据主成分对应的各原始指标的系数的大小和正负号,进行解释,受哪个影响大,是正相关还是负相关

AHP层次分析法:AHP层次分析法是一种定性和定量的计算权重的研究方法,采用两两比较的方法,建立矩阵,利用了数字大小的相对性,数字越大越重要权重会越高的原理,最终算得到每个因素的重要性。 适用场景:层次分析法适用于有多个层次的综合评价中。 层次分析法说白了就是主观评价法,主要三个步骤一是构造比较矩阵,二是一致性检验,三是特征向量归一化来作为各指标的向上权重值。可以是单层,也可以是多层,多层的话就是每层权重累乘就行了,主要用途就是求各指标的权重,也可以用于决策问题,就是在方案层选择哪种方案比较好,排序问题

熵值法:熵值法属于一种客观赋值法,其利用数据携带的信息量大小计算权重,得到较为客观的指标权重。熵值是不确定性的一种度量,熵越小,数据携带的信息量越大,权重越大;相反熵越大,信息量越小,权重越小。 适用场景:熵值法广泛应用于各个领域,对于普通问卷数据(截面数据)或面板数据均可计算。在实际研究中,通常情况下是与其他权重计算方法配合使用,如先进行因子或主成分分析得到因子或主成分的权重,即得到高维度的权重,然后再使用熵值法进行计算,想得到具体各项的权重。

熵值法说白了目的也是为了确定各指标的权重,但是是客观评价,需要有数据才能评价,提取数据的熵特征,可以简单理解为无序程度复杂程度。跟主成分分析原理不一样,属于两种不同的方法。

值得一提的是:有些时候为了获得更合理靠谱的权重,通常会采用两种方法结合使用的情况,常见的权重组合方式有:AHP-熵值法的综合权重计算公式A*B/(A*B的求和),AHP-PCA综合权重计算公式W=tWahp+(1-t)Wpc, PCA-熵值法。

总之呢,这三种是常见的表格数据的一些预处理方法,不同类型的权重确定方法,其中PCA常用于降维,这三种方法都很好实现,要灵活使用。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3