数据包络分析法(DEA)

您所在的位置:网站首页 sfa和dea模型 数据包络分析法(DEA)

数据包络分析法(DEA)

2024-07-16 14:00| 来源: 网络整理| 查看: 265

(完整版)数据包络分析法DEA总结

数据包络分析(DEA)常见问题总结

DEA (数据包络分析)介绍及 python3 实现

文章目录 1 基本概念2 DEA基本模型2.1 CCR模型2.1 BCC模型 3 DEA有效的经济意义4 AHP与DEA的结合

1 基本概念

数据包络分析(data envelopment analysis,简称DEA)是运筹学、管理科学与数理经济学交叉研究的一个新领域。其是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法。

DEA是以相对效率概念为基础,以凸分析和线性规划为工具,将评价决策单元的指标分成“输入类”指标和“输出类”指标,通过计算各单元的输入与输出之比,评价其决策单元相对有效性的多目标分析评价方法。

DEA的基本思路是在保持决策单元间输入或输出不变的情况下,通过输入和输出数据和数据规划模型确定相对有效的生产前沿面,即Pareto最优解构成的面。

随后将决策单元投影到该生产前沿面上,对比分析各决策单元和生产前沿面的距离来判定相对效率,同时通过投影值来确定非有效决策单元的改进程度。

比如 确定相对优势的产业

在这里插入图片描述 建模过程 在这里插入图片描述

2 DEA基本模型 2.1 CCR模型

基本原理:设有 n n n 个决策单元,每个决策单元均有 m m m 个输入指标和 k k k 个输出指标,记第 j j j 个决策单元的第 i i i 个输入指标为 x i x_i xi​ ,第 j j j 个决策单元的第 k k k 个输出指标为 y k y_k yk​, v i v_i vi​ 为第 i i i 个输入指标的权重, u i u_i ui​ 为第 i i i 个输出指标的权重,且 x i > 0 x_i>0 xi​>0, y k > 0 y_k>0 yk​>0, v i , u i ≥ 0 v_i\text{,}u_i\ge 0 vi​,ui​≥0,初始数据见表

x i j x_{ij} xij​ 和 y i k y_{ik} yik​ 是向量

x j = [ x 1 j x 2 ⋮ x m j ] , y j = [ y 1 j y 2 j ⋮ y k j ] x_j=\left[ \begin{array}{c} x_{1j}\\ x_2\\ \vdots\\ x_{mj}\\ \end{array} \right] \text{,}y_j=\left[ \begin{array}{c} y_{1j}\\ y_{2j}\\ \vdots\\ y_{kj}\\ \end{array} \right] xj​=⎣⎢⎢⎢⎡​x1j​x2​⋮xmj​​⎦⎥⎥⎥⎤​,yj​=⎣⎢⎢⎢⎡​y1j​y2j​⋮ykj​​⎦⎥⎥⎥⎤​

中的分量,可以根据历史资料、统计数据和预测计算得到。设输入指标和输出指标的权数向量分别为

V = [ v 1 v 2 ⋮ v m ] , U = [ u 1 u 2 ⋮ u k ] V=\left[ \begin{array}{c} v_1\\ v_2\\ \vdots\\ v_m\\ \end{array} \right] \text{,}U=\left[ \begin{array}{c} u_1\\ u_2\\ \vdots\\ u_k\\ \end{array} \right] V=⎣⎢⎢⎢⎡​v1​v2​⋮vm​​⎦⎥⎥⎥⎤​,U=⎣⎢⎢⎢⎡​u1​u2​⋮uk​​⎦⎥⎥⎥⎤​

如下

在这里插入图片描述

矩阵形式 [ v 1 v 2 ⋮ v m ] [ x 11 x 12 ⋯ x 1 n x 21 x 22 ⋯ x 2 n ⋮ ⋮ ⋮ x m 1 x m 2 ⋯ x m n ] ⇒ [ u 1 u 2 ⋮ u k ] [ y 11 y 12 ⋯ y 1 n y 21 y 22 ⋯ y 2 n ⋮ ⋮ ⋮ y k 1 y k 2 ⋯ y k n ] \left[ \begin{array}{c} v_1\\ v_2\\ \vdots\\ v_m\\ \end{array} \right] \left[ \begin{matrix} x_{11}& x_{12}& \cdots& x_{1n}\\ x_{21}& x_{22}& \cdots& x_{2n}\\ \vdots& \vdots& & \vdots\\ x_{m1}& x_{m2}& \cdots& x_{mn}\\ \end{matrix} \right] \Rightarrow \left[ \begin{array}{c} u_1\\ u_2\\ \vdots\\ u_k\\ \end{array} \right] \left[ \begin{matrix} y_{11}& y_{12}& \cdots& y_{1n}\\ y_{21}& y_{22}& \cdots& y_{2n}\\ \vdots& \vdots& & \vdots\\ y_{k1}& y_{k2}& \cdots& y_{kn}\\ \end{matrix} \right] ⎣⎢⎢⎢⎡​v1​v2​⋮vm​​⎦⎥⎥⎥⎤​⎣⎢⎢⎢⎡​x11​x21​⋮xm1​​x12​x22​⋮xm2​​⋯⋯⋯​x1n​x2n​⋮xmn​​⎦⎥⎥⎥⎤​⇒⎣⎢⎢⎢⎡​u1​u2​⋮uk​​⎦⎥⎥⎥⎤​⎣⎢⎢⎢⎡​y11​y21​⋮yk1​​y12​y22​⋮yk2​​⋯⋯⋯​y1n​y2n​⋮ykn​​⎦⎥⎥⎥⎤​

∑ i = 1 m v i x i j   , ( j = 1 , 2 , ⋯   , n ) \sum_{i=1}^m{v_ix_{ij}}\ \ \text{,}\left( j=1,2,\cdots ,n \right) i=1∑m​vi​xij​  ,(j=1,2,⋯,n)为第 j j j 单元输入的综合评价指标; ∑ i = 1 k u i y i j   , ( j = 1 , 2 , ⋯   , n ) \sum_{i=1}^k{u_iy_{ij}}\ \ \text{,}\left( j=1,2,\cdots ,n \right) i=1∑k​ui​yij​  ,(j=1,2,⋯,n)

为第 j j j 单元输出的综合评价指标;

则每个决策单元 D M U i DMU_i DMUi​ ,都有相应的效率评价指标

h j = ∑ i = 1 k u i y i j ∑ i = 1 m v i x i j h_j=\frac{\sum_{i=1}^k{u_iy_{ij}}}{\sum_{i=1}^m{v_ix_{ij}}} hj​=∑i=1m​vi​xij​∑i=1k​ui​yij​​

由此定义有: (1)总可以适当的选取 u , v u,v u,v,使 h j ≤ 1 h_j\le 1 hj​≤1 ; (2)粗略的说,对于决策单元 D M U j 0 DMU_{j0} DMUj0​ , h j 0 h_{j0} hj0​ 越大表明, D M U j 0 DMU_{j0} DMUj0​ 能够用相对较少的输入得到相对较多的输出。

要评价第 j 0 j_0 j0​ 个评价单元相对有效性,需建立评价系统的CCR模型。

设第 j 0 j_0 j0​ 个评价单元的投入向量和产出向量分别为 x 0 = ( x 1 j 0 , x 2 j 0 , ⋯   , x m j 0 ) T x_0=\left( x_{1j0},x_{2j0},\cdots ,x_{mj0} \right) ^T x0​=(x1j0​,x2j0​,⋯,xmj0​)T和 y 0 = ( y 1 j 0 , y 2 j 0 , ⋯   , y k j 0 ) T y_0=\left( y_{1j0},y_{2j0},\cdots ,y_{kj0} \right) ^T y0​=(y1j0​,y2j0​,⋯,ykj0​)T

效率指标 h o = h j 0 h_o=h_{j0} ho​=hj0​

在效率评价指标 h j ≤ 1   ( j = 1 , 2 , ⋯   , n ) h_j\le 1\ \left( j=1,2,\cdots ,n \right) hj​≤1 (j=1,2,⋯,n) 的约束条件下,选择一组最优权系数 u , v u,v u,v 使 h 0 h_0 h0​ 达到最大值。构造最优化模型:

max ⁡   h 0 = ∑ r = 1 k u r y r j 0 ∑ i = 1 m v i x i j 0 \max\text{\ }h_0=\frac{\sum_{r=1}^k{u_ry_{rj_0}}}{\sum_{i=1}^m{v_ix_{ij_0}}} max h0​=∑i=1m​vi​xij0​​∑r=1k​ur​yrj0​​​ s . t . = { ∑ r = 1 k u r y r j / ∑ i = 1 m v i x i j ≤ 1    ( j = 1 , 2 , ⋯   , n ) v i ≥ 0    ( i = 1 , 2 , ⋯   , m ) u r ≥ 0    ( r = 1 , 2 , ⋯   , k ) s.t.=\left\{ \begin{array}{l} \sum_{r=1}^k{u_ry_{rj}}/\sum_{i=1}^m{v_ix_{ij}}\le 1\,\,\left( j=1,2,\cdots ,n \right)\\ \\ v_i\ge 0\,\,\left( i=1,2,\cdots ,m \right)\\ \\ u_r\ge 0\,\,\left( r=1,2,\cdots ,k \right)\\ \end{array} \right. s.t.=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧​∑r=1k​ur​yrj​/∑i=1m​vi​xij​≤1(j=1,2,⋯,n)vi​≥0(i=1,2,⋯,m)ur​≥0(r=1,2,⋯,k)​

矩阵形式

max ⁡   h 0 \max\text{\ }h_0 max h0​ s . t . = { h j = U T y j V T x j ≤ 1   ( j = 1 , 2 , ⋯   , n ) V ≥ 0 U ≥ 0 s.t.=\left\{ \begin{array}{l} h_j=\frac{U^Ty_j}{V^Tx_j}\le 1\ \left( j=1,2,\cdots ,n \right)\\ V\ge 0\\ U\ge 0\\ \end{array} \right. s.t.=⎩⎪⎨⎪⎧​hj​=VTxj​UTyj​​≤1 (j=1,2,⋯,n)V≥0U≥0​

将上述分式规划转化为等价的线性规划方程组。采用Charnes-Cooper变换,令:

t = 1 V T x 0 > 0 , ω = t v , μ = t u t=\frac{1}{V^Tx_0}>0\text{,}\omega =tv\text{,}\mu =tu t=VTx0​1​>0,ω=tv,μ=tu

{ max ⁡   μ T y 0 = h 0    ω T x j − μ T y j ≥ 0 , j = 1 , 2 , ⋯   , n ;    ω T x 0 = 1 ;    ω ≥ 0 , μ ≥ 0 \left\{ \begin{array}{l} \max\text{\ }\mu ^Ty_0=h_0\\ \\ \ \ \omega ^Tx_j-\mu ^Ty_j\ge 0\text{,}j=1,2,\cdots ,n;\\ \\ \ \ \omega ^Tx_0=1;\\ \\ \ \ \omega \ge 0\text{,}\mu \ge 0\\ \end{array} \right. ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧​max μTy0​=h0​  ωTxj​−μTyj​≥0,j=1,2,⋯,n;  ωTx0​=1;  ω≥0,μ≥0​

DEA有效:最优日标值 h 0 = 1 h_0 = 1 h0​=1DEA有效:若存在最优解 ω 0 , μ 0 \omega ^0,\mu ^0 ω0,μ0 满足 ω 0 > 0 , μ 0 > 0 , h 0 = μ 0 y 0 = 1 \omega ^0>0\text{,}\mu ^0>0\text{,}h_0=\mu ^0y_0=1 ω0>0,μ0>0,h0​=μ0y0​=1 2.1 BCC模型

参考:研发投入产出效率的国际比较研究—基于三阶段DEA模型分析 在这里插入图片描述 在这里插入图片描述

3 DEA有效的经济意义

数据包络分析DEA的本质是利用统计数据确定相对有效的生产前沿面,利用生产前沿面的理论和方法,建立非参数的最优化模型,研究相同类型部门间的效率差异。

根据DEA的原理,DEA有效的DMU在每个投入指标和每个产出指标乘以一个加权系数后,其产出加权和投入加权和之比是最大的,因为所有的其他DMU用样的加权系数算出这一比值都不会超过1。

实际上,可以把这样的投入产出关系认为是生产函数上的一个点,由不同规模上DEA有效的投入产出关系就能得到完整的生产函数。

在这里插入图片描述 在这里插入图片描述 处于包络线(或生产前沿生产面)上的决策单元称为DEA有效(或Pareto有效)

如果是多投入指标和多产出指标,DEA有效的所有决策单元不能落到一条曲线上,而是形成一个超平面,它是生产函数的扩展,

用距离函数测量生产单位与生产前沿面的距离,既可以沿着产出增加方向也可以沿着投入减少方向进行效率改善。有效的决策单元决定了生产可能集的前沿面 在这里插入图片描述 例如 A 点的效率值为: θ A = O Q O A < 1 \theta _A=\frac{OQ}{OA}



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3