STATA经济指数构建系列（7）差异系数(变异系数）

您所在的位置：网站首页 › 用stata怎么算指标权重的指令 › STATA经济指数构建系列（7）差异系数(变异系数）

STATA经济指数构建系列（7）差异系数(变异系数）

2024-05-28 15:53| 来源: 网络整理| 查看: 265

指标说明

差异系数，可以体现对象数据与标准数据的相对差异,数值越大，表示不平衡程度越大[1]

设x与y分别为对象数据和标准数据，则差异系数k的表达式为：

k=\sqrt{\sum{(x_i-y_i)^2/\sum{y_i^2}}}

一般情况下，如果没有特别的规定，则标准数据 y_i 等于 x_i 的平均数 \bar{x} ,那么上式可变换为：

k=\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})^2/\sum_{i=1}^{n}{\bar{x}^2}}}=\frac{\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})^2/n}}}{\bar{x}} =\frac{ \sigma}{\mu}

\sigma 为标准差， \mu 为平均值，这时差异系数又叫变异系数（coefficient of variation)。

再进一步，如果加上另一个变量p作为权重，比如 p_i 为i地区总人口， p 为背景区域总人口，则加权变异系数的公式为：

k_p = \frac{1}{\bar{x}}\sqrt{\sum_{i=1}^{n}{\frac{(x_i - \bar{x})^2p_i}{p}}}

上面这个公式看起来是不是有点眼熟？没错，就是本系列第五篇说的指标威尔逊系数

数据说明

本文示例数据为江苏省1990-2017年各城市总人口及GDP数据，包括13个城市，并分为苏中、苏南、苏北三个区域，计划使用变异系数测算区域经济差异的演变趋势

1、数据导入

前面数据中第一行是中文列名第二行是英文，所以需要设置下单元格区域（cellrange）从第二行开始，并选择将区域内的首行设为标题（firstrow)

* 数据导入 import excel "D:\data\江苏区域经济数据.xlsx", sheet("元数据") cellrange(A2:E366) firstrow clear

数据导入

2、区域及整体数据汇总

汇总统计区域总GDP、全省总GDP，因为示例里没有总数据所以这里要做一步汇总，如果大家自己计算时有现成的总数据则此步可以跳过

* 计算总收入（区域） bys Year area: egen Yi = sum(Yij) * 计算总收入（全省） bys Year: egen Y = sum(Yij)

bys是分组统计命令， bys area year 是按区域及年份分组汇总， bys year则仅按年份分组汇总

3、计算各区域变异系数

* 计算各区域变异系数 bys Year area: egen Si = sd(Yij) //标准差 bys Year area: egen Mi = mean(Yij) //平均值 gen CVi = Si/Mi //变异系数

4、计算总体变异系数

由于变异系数只对单指标计算，不考虑加权，因此不需要做分解，上一步计算各区域变异系数只是为了最后与总体变异系数做对比

* 保留区域不重复数据 drop city Yij Pij duplicates drop * 计算全省区域变异系数 bys Year : egen S = sd(Yi) //标准差 bys Year : egen M = mean(Yi) //平均值 gen CV = S/M //变异系数 * 保留参考^吴殿廷. 区域系统分析方法研究[M]. 东南大学出版社, http://book.chaoxing.com/ebook/read_8136612122cd4f2ec3ccd6385cbda88c2ab432a0b.html

【本文地址】

STATA经济指数构建系列（7）差异系数(变异系数）

STATA经济指数构建系列（7）差异系数(变异系数）

今日新闻

推荐新闻