STATA经济指数构建系列(7)差异系数(变异系数)

您所在的位置:网站首页 用stata怎么算指标权重的指令 STATA经济指数构建系列(7)差异系数(变异系数)

STATA经济指数构建系列(7)差异系数(变异系数)

2024-05-28 15:53| 来源: 网络整理| 查看: 265

指标说明

差异系数,可以体现对象数据与标准数据的相对差异,数值越大,表示不平衡程度越大[1]

设x与y分别为对象数据和标准数据,则差异系数k的表达式为:

k=\sqrt{\sum{(x_i-y_i)^2/\sum{y_i^2}}}

一般情况下,如果没有特别的规定,则标准数据 y_i 等于 x_i 的平均数 \bar{x} ,那么上式可变换为:

k=\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})^2/\sum_{i=1}^{n}{\bar{x}^2}}}=\frac{\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})^2/n}}}{\bar{x}} =\frac{ \sigma}{\mu}

\sigma 为标准差, \mu 为平均值,这时差异系数又叫变异系数(coefficient of variation)

再进一步,如果加上另一个变量p作为权重,比如 p_i 为i地区总人口, p 为背景区域总人口,则加权变异系数的公式为:

k_p = \frac{1}{\bar{x}}\sqrt{\sum_{i=1}^{n}{\frac{(x_i - \bar{x})^2p_i}{p}}}

上面这个公式看起来是不是有点眼熟?没错,就是本系列第五篇说的指标 威尔逊系数

数据说明

本文示例数据为江苏省1990-2017年各城市总人口及GDP数据,包括13个城市,并分为苏中、苏南、苏北三个区域,计划使用变异系数测算区域经济差异的演变趋势

1、数据导入

前面数据中第一行是中文列名第二行是英文,所以需要设置下单元格区域(cellrange)从第二行开始,并选择将区域内的首行设为标题(firstrow)

* 数据导入 import excel "D:\data\江苏区域经济数据.xlsx", sheet("元数据") cellrange(A2:E366) firstrow clear数据导入

2、区域及整体数据汇总

汇总统计区域总GDP、全省总GDP,因为示例里没有总数据所以这里要做一步汇总,如果大家自己计算时有现成的总数据则此步可以跳过

* 计算总收入(区域) bys Year area: egen Yi = sum(Yij) * 计算总收入(全省) bys Year: egen Y = sum(Yij)

bys是分组统计命令, bys area year 是按区域及年份分组汇总, bys year则仅按年份分组汇总

3、计算各区域变异系数

* 计算各区域变异系数 bys Year area: egen Si = sd(Yij) //标准差 bys Year area: egen Mi = mean(Yij) //平均值 gen CVi = Si/Mi //变异系数

4、计算总体变异系数

由于变异系数只对单指标计算,不考虑加权,因此不需要做分解,上一步计算各区域变异系数只是为了最后与总体变异系数做对比

* 保留区域不重复数据 drop city Yij Pij duplicates drop * 计算全省区域变异系数 bys Year : egen S = sd(Yi) //标准差 bys Year : egen M = mean(Yi) //平均值 gen CV = S/M //变异系数 * 保留参考^吴殿廷. 区域系统分析方法研究[M]. 东南大学出版社, http://book.chaoxing.com/ebook/read_8136612122cd4f2ec3ccd6385cbda88c2ab432a0b.html


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3