logo资料库

论文研究-数据包络分析研究热点综述.pdf

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
Computer Engineering and Applications 计算机工程与应用 2018,54(10) 219 ⦾工程与应用⦾ 数据包络分析研究热点综述 张宏军,徐有为,程 恺,张 睿,尹成祥 ZHANG Hongjun, XU Youwei, CHENG Kai, ZHANG Rui, YIN Chengxiang 陆军工程大学 指挥信息系统学院,南京 210000 Institute of Command and Information System, Army Engineering University of PLA, Nanjing 210000, China ZHANG Hongjun, XU Youwei, CHENG Kai, et al. Review of data envelopment analysis hotspot. Computer Engi- neering and Applications, 2018, 54(10):219-228. Abstract:Data envelopment analysis is a method for evaluating the effectiveness of multi-input and multi-output deci- sion making units. On the basis of introducing the basic idea and model of data envelopment analysis, this paper summa- rizes the research hotspots at home and abroad in recent years, including two-stage DEA, efficiency ranking DEA, stochas- tic DEA and related expansion issues. Based on the above hotspots, the theoretical research and extended model of data envelopment analysis are sorted and classified. Finally, the prospect of data envelopment analysis is put forward. Key words:data envelopment analysis; decision making unit; relative efficiency 摘 要:数据包络分析是面向多输入多输出决策单元的有效性评估方法。在介绍数据包络分析的基本思想和模型 基础之上,总结了近年来国内外的研究热点,包括两阶段 DEA、效率排序 DEA、随机 DEA 和相关扩展问题,旨在围绕 以上研究热点,对 DEA 近年来的理论研究及其扩展模型进行梳理和分类。最后对数据包络分析进一步研究提出展望。 关键词:数据包络分析 ;决策单元 ;相对有效性 文献标志码:A 中图分类号:C934 doi:10.3778/j.issn.1002-8331.1711-0160 1 引言 数据包络分析(Data Envelopment Analysis,DEA) 是以线性规划为基础,对同类型的多输入、多输出决策 单元(Decision Making Unit,DMU)进行相对有效性评 估的非参数系统分析方法,属于运筹学、管理科学和数 理经济学交叉研究[1]的领域。其中,同类型条件要求所 有的 DMU 具有相同的输入和输出指标、相同的任务和 目标,以及相同的外部环境 [2]。DEA 根据各 DMU 的观 测数据,判断各 DMU 的相对有效性,本质是判断 DMU 偏离生产前沿面的程度 [3]。相较于传统的生产函数理 论,应用 DEA 对同类型多输入、多输出 DMU 分析时,不 需要预先估计参数,由于量纲无关性、无假设权重等特 点,DEA 在避免主观因素和简化算法、减少误差 [1]等方 面有着巨大的优越性。 DEA 的研究历史最早可追溯到 1957 年 Farrell 提出 的 包 络 思 想 [4],1978 年 由 A.Charnes 和 W.W.Cooper 等 人 [5]正式提出。中国学者研究 DEA 模型始于 1986 年, 1988 年魏权龄公开出版了关于 DEA 模型的第一本专 著 [6]。在将近 40 年的研究进程中,DEA 得到了迅猛发 展,ISI Web of Science Core Collection(Web of Science 核心合集)、Engineering Village(EV)和中国科学引文数 据库(CSCD)等各大数据库中相关文献检索数量均达到 上千篇,已经有数以万计关于 DEA 的研究论文、工作报 告和博士论文等发表。 DEA 跨学科研究已经深入到应用经济学、管理科 学与工程等多个学科,在多个领域的定量检测均取得了 满意的效果,表 1 列举了部分应用领域和相关文献。事 实说明,DEA 已经引起国内外大批研究人员的关注。 本文在阐述 DEA 基本思想和模型的基础之上,梳理 了近年来 DEA 领域研究的主要成果,重点分析讨论了 基金项目:江苏省自然科学基金(No.BK20150720)。 作者简介:张宏军(1963—),教授,博士生导师,主要研究方向为多准则决策、数据与知识工程等;徐有为(1994—),男,在读硕士 研究生,主要研究方向为复杂系统分析与优化,E-mail:812951570@qq.com。 收稿日期:2017-11-10 修回日期:2017-12-26 文章编号:1002-8331(2018)10-0219-10 计算机工程与应用www.ceaj.org
220 2018,54(10) Computer Engineering and Applications 计算机工程与应用 应用领域 文献 环境能源方面 [7-11] 银行金融领域 [12-16] 资源分配方面 [17-21] 军事效能领域 [22-26] 表 1 DEA 应用文献分类汇总 主要结论 提出了链式结构的生态效能评估[7],分析能源密集型行业[8]、中国 30 个地区制造业的生态 效益[9]、对二氧化碳排放规定给出了建议[11] 研究 1993—2000 年放松管制对中国银行效率的影响[12],1998 年政府注资[14]、外商投资和上 市对中国银行成本效益产生积极影响[16] 提出面向产出的 DEA 资源分配模型[18]、多周期生产计划模型[22]、非线性资源分配模型[21] 研究了美国空军保养单元不同时间点的效率情况[22]、以色列空军的 5 个维护单位效率[23]、 1983—1986 年美国空军战术空军司令车辆维修性能[24] DEA当前的研究热点,并对其未来研究趋势给出了预测。 2 基本思想和模型 假设有 n 个决策单元,m 个输入指标和 s 个输出指 标,分式规划下,面向输出的 CCR 模型如公式(1)所示: max ∑ s ur yrO ∑ m vi xiO r = 1 i = 1 ≤ 1,j = 1,2,⋯,n r = 1 ∑ ì s ur yrj ï ïï ∑ ï m vi xij í ï i = 1 ïï ur ≥ 0,r = 1,2,⋯,s ï vi ≥ 0,i = 1,2,⋯,m î (1) 其中,xij 、yrj 分别表示 DMUj 的第 i 种投入和第 r 种产 出,vi 、ur 分别是对输入、输出的度量。规划的最优值代 表了该 DMU 的相对有效性。如果最优值是 1,说明该决 策单元是 DEA 有效或 DEA 弱有效的,否则是无效单元。 根据 Banker[27]提出的生产可能集(PPS)的定义: 定义 T = {(x,y)|产出 y 可由投入 x 生产产出} 为生 产可能集,CCR 模型对应的生产可能集如公式(2)所示: T ={(x,y)|∑ n λj xij ≤ xi,∑ n λj yrj ≤ yr ,λj ≥ 0} j = 1 j = 1 (2) 称作规模收益不变假定生产可能集,该生产可能集由平 凡公理、凸性公理、锥性公理、无效性公理、最小性公理 组成的公理体系[5]确定。 应用 DEA 模型分析相关效率问题时,通常分为确 定评价目标、选择同类型的决策单元、建立输入输出指 标体系、选择合适的 DEA 模型、评价分析 DEA 结果并给 出相应结论等一共 5 个步骤。另外有经验公式[28],在满 足 n ≥ max{3(m + s),m × s} 条件下,DEA 模型具有稳定和 可接受的结果。 3 DEA 扩展模型 当下 DEA 模型已经成为多投入多产出情况下决策 单元相对有效性和规模收益等方面应用最为广泛的数 理方法之一[2],基于不同生产可能集假定的模型[29-32]、基 于 不 同 偏 好 的 DEA 模 型 [33]、基 于 不 同 测 度 的 DEA 模 型 [34-35]等先后被提出。本文将当前 DEA 研究热点概括 为:两阶段 DEA、效率排序 DEA、随机 DEA 和其他相关 扩展问题。下面针对以上研究热点,分别介绍各方面的 模型,并对模型进行比较分析。 3.1 两阶段 DEA 模型 两阶段 DEA 模型的提出是为了解决类似供应链系 统中内部供应链效率分析问题,它打破了传统 DEA 将 DMU 看做“黑箱”的假设,将中间输出/输入定义为中间 措施[36]。两阶段 DEA 模型主要分为 3 类:独立两阶段模 型、连接两阶段模型和关系两阶段模型。 独立两阶段模型 [36- 38]是两阶段 DEA 的最初模型。 Wang 等[36]分析了 22 家银行的效率,定义第一阶段为 IT 相关的增值活动并产生资产,第二阶段银行使用资产作 为资金来源投资证券和提供贷款。Seiford 和 Zhu[37]应用 同样的方法评估美国顶级商业银行的效率,在盈利阶段 银行消费投入并产生利润,在营销阶段利用利润创造市 场价值。 连接两阶段模型是独立两阶段模型的改进,包括价 值链模型 [38](连接两阶段模型的先驱代表)和网络模 型 [39]。网络模型从空间上打开“黑箱”,可以评价 DMU 单元整体和内部各部分的相对有效性。Avkiran[40]使用 网络模型来研究阿拉伯联合酋长国的国内商业银行,评 估了银行内部多个独立利润中心之间的效率。同样的 方法、类似的结构还用于研究 NBA 球队[41]、中国台湾银 行[42]、电厂绩效[43]和中国台湾旅游宾馆[44]的有效性评估。 关系两阶段模型是在连接两阶段模型基础上的又 一改进。Kao 等[45]认为两种效率之间存在乘法关系并构 建了相应的乘法两阶段模型。Chen 等[46]采用加权求和 的方法构建了加法两阶段模型。Wang 等[47]指出可以采 用调和平均数,并将其应用到一般中国台湾保险公司得 到两阶段的综合相对有效性。Wang K[48]等同样应用加 权求和的方法,评估了中国商业银行的效率。 3.1.1 独立两阶段模型 面向输出,规模收益不变的独立两阶段模型如公 式(3)所示。 i + ∑ s s+ r) (t = 1,2) r = 1 i = 1 i = xio,i = 1,2,⋯,m max φt o + ε(∑ m s- ∑ ì n λj xij + s- ï ïïï ∑ n λj yrj - s+ í ï ïïï j = 1 λj,s- r ≥ 0 î i,s+ j = 1 r = φt o yro,r = 1,2,⋯,s (3) 计算机工程与应用www.ceaj.org
张宏军,徐有为,程 恺,等:数据包络分析研究热点综述 2018,54(10) 221 X (1) i ,i ∈ l(1) X (p) i ,i ∈ l(p) X (q) i ,i ∈ l(q) Z (0) l l ∈ M (0) 1 Z (1) l l ∈ M (1) ⋯ Z (p - 1) l l ∈ M (p - 1) p Z (p) l l ∈ M (p) ⋯ Z (q - 1) l l ∈ M (q - 1) q Z (q) l l ∈ M (q) Y (1) r ,r ∈ O(1) Y (p) r ,r ∈ O(p) 图 1 串行网络模型 Y (q) r ,r ∈ O(q) o 和 φ2* 其中 φ1* o 分别为阶段 1 和阶段 2 模型的最优值。 o = 1 并且所有的输入、输出松弛都为零,则称该 若 φ1* DMU 在阶段 1 是 CCR 有效的。若 φ2* o = 1 并且所有的输 入、输出松弛都为零,则称该DMU在阶段2是CCR有效的。 独立两阶段模型简单易操作,在第一和第二阶段分 别套用经典 DEA 方法,但是没有考虑两个阶段之间的 联系。比如:存在中期措施不同时处理的情况,甚至允 许在第一阶段(当被视为产出时)将其增加,并在第二阶 段(当被视为投入时)将其减少,由此会引发冲突。此 外,由于独立两阶段模型是分别评估总体效率和单阶段 效率的,没有建立总体效率和单阶段效率之间的联系, 因此 DMU 总体高效并不等价于单阶段也高效。 3.1.2 连接两阶段模型 o - ω2φ2 o 为 了 克 服 独 立 两 阶 段 模 型 的 缺 陷 ,连 接 两 阶 段 DEA 方法将阶段间相互作用纳入总体效率计算中,允 许在两个阶段分别使用不同的乘数集,以保证:DMU 总 体有效对应了两个阶段完全有效。由于乘数集不同,因 此不能用单一线性规划一次性处理两阶段的效率 [38]。 假设一共有 D 个中间措施指标。连接两阶段模型如公 式(4)所示。 min ω1φ1 ∑ ì n λj xij ≤ φ1 o xio,i = 1,2,⋯,m ï ï ï ï ∑ ï n λj yrj ≥ z͂ do,d = 1,2,⋯,D ïï ï ï ï ∑ n μj zdj ≤ z͂ do,d = 1,2,⋯,D ï ï í ï ∑ n μj yrj ≥ φ2 ï ï ï ï ïï n λj = 1,∑ ∑ ï ï ï ï j = 1 ï μj ≥ 0,λj ≥ 0,j = 1,2,⋯,n î o yro,r = 1,2,⋯,s n μj = 1 (4) j = 1 j = 1 j = 1 j = 1 j = 1 其中 ω1 和 ω2 是用户指定的权重,用于刻画用户对两个 阶段表现的偏好,符号“~”表示未知的决策变量。模型 中将中间措施视为未知的决策变量,有效定义了两阶段 生产过程的有效前沿[38]。 网络模型按照结构不同分为串行结构、并行结构[39] 和混合结构。串行网络模型最明显的特征是 DMU 之间 存在较强的时间依赖关系,只有当前一个 DMU 产生中 间措施后,后一个 DMU 才能开始工作。含有 q 个 DMU 的串行网络结构如图 1 所示。 根据不同应用场合的需要,串行网络模型可以在内 部程序数量(一般形式有两个以上的阶段)、投入开始进 行的阶段、产生输出的阶段[39]、中间的措施是否完全消 耗等方面改进。模型具体计算由公式(5)给出。网络模 型要求:相同的因子具有相同的乘数,与所在过程无关。 i = 1 r = 1 r = 1 s u ryrk m vi xij ≤ 0,j = 1,2,⋯,n rj + ∑ Ek = max ∑ ∑ ì m vi xik = 1 ï ï ï ï ∑ s ur yrj - ∑ ï ï ïï i = 1 ï ( ∑ ï ur y (p) ï ï í ï ï ( ∑ ï ï ï ï ïï p = 1,2,⋯,q,j = 1,2,⋯,n ï ï ur ,vi,wl ≥ ε,r = 1,2,⋯,s ï ï i = 1,2,⋯,m,l = 1,2,⋯,t î 并行网络模型典型特征是各个级别彼此平行且分 开地进行操作,DMU 之间互相独立且不依赖。含有 q 个 DMU 的并行网络结构如图 2 所示。 wl z(p) ij + ∑ wl z(p - 1) vi x(p) lj ) - l ∈ M (p - 1) ) ≤ 0 l ∈ M (p) r ∈ O(p) i ∈ I (p) lj (5) Xi i ∈ l X (1) i i ∈ l(1) i X (p) i ∈ l(p) X (q) i i ∈ l(q) Process 1 ⋮ Process p ⋮ Process q Y (1) r r ∈ O(1) Y (p) r r ∈ O(p) Y (q) r r ∈ O(q) 图 2 并行网络结构 Yr r ∈ O r = 1 s u ryrk 模型由公式(6)刻画。并行系统的典型示例是有部 门的大学[39]。整个大学的效率通过所有部门的总投入 和总产出计算。 Ek = max ∑ ∑ ì m vi xik = 1 ï ï ï ï ∑ s ur yrj - ∑ ïï ï ï í ∑ ï ï ï ï r ∈ O(p) ïï p = 1,2,⋯,q,j = 1,2,⋯,n ï ï ur ,vi ≥ ε,r = 1,2,⋯,s,i = 1,2,⋯,m î m vi xij ≤ 0,j = 1,2,⋯,n rj - ∑ ur y (p) ij ≤ 0 vi x(p) i ∈ I (p) r = 1 i = 1 i = 1 (6) 计算机工程与应用www.ceaj.org
222 2018,54(10) Computer Engineering and Applications 计算机工程与应用 由于现实生活经验应用通常无法用单纯的串行结 构或并行结构表示,因此提出采用将两者结合的方式构 造混合网络结构[40-44]。通常,混合结构针对不同的经验 应用有不同的构造。 3.1.3 关系两阶段模型 关系两阶段模型在充分考虑阶段之间相互影响的 基础上,假定模型整体效率和单阶段效率存在一定的数 学关系。关系两阶段模型与网络模型一样,要求中间措 施必须在相关联的两个阶段中使用相同的乘数集合。 o 、E 2 乘 法 模 型 的 效 率 分 解 [45]如 公 式(7)所 示 。 其 中 , o 分别表示决策单元的总体效率和第一、二 d 表示最优权重。乘法模型假 o 。 Eo 、E 1 阶段的效率,u* 设:总体效率是两个阶段的效率相乘,即 Eo = E 1 i 、w* o × E 2 r 、v* r ⋅ yro i ⋅ xio ≤ 1 Eo = E 1 o = r = 1 ∑ s u* ∑ m v* ∑ D w* ∑ m v* d = 1 i = 1 i = 1 d ⋅ zdo i ⋅ xio ≤ 1,E 2 o = ∑ s u* ∑ D w* r = 1 d = 1 r ⋅ yro d ⋅ zdo ≤ 1 (7) 乘法模型评估效率分为两个步骤:第一步以总体效 率最优为目标建立规划模型。第二步如公式(8)所示, 要求模型在保持最优总体效率不变的前提下,以其中一 个阶段(例如阶段二)的效率最大化为目标,这是为了解 决第一步求解中,存在最优权重不唯一的情况。 i = 1 i = 1 r = 1 r = 1 r = 1 r = 1 s ur yro - Eo∑ m vi xio = 0 m vi xij ≤ 0,j = 1,2,⋯,n m vi xij ≤ 0,j = 1,2,⋯,n D wd zdj ≤ 0,j = 1,2,⋯,n o = max ∑ s u ryro E 2 ∑ D wd zdo = 1,∑ ì ï ï ï ï ∑ s ur yrj - ∑ ïïï ï ï ï ∑ D wd zdj - ∑ í ï ï ï ∑ s ur yrj - ∑ ï ïïï r = 1 ï ur ,vi,wd ≥ ε,r = 1,2,⋯,s ï ï i = 1,2,⋯,m,d = 1,2,⋯,D î 加法模型与乘法模型相同,同样分为两个步骤求 解,差异主要体现在效率分解式上。加权求和[46]的分解 方法按照公式(9)分解总体效率。其中,ξ1 和 ξ2 分别表 示两个阶段的权重系数,并且满足 ξ1 + ξ2 = 1 。 r = 1 r = 1 i = 1 (8) 根据效率得分是否为 1 将所有决策单元分为有效和非 有效两组,无法为决策者宏观把握所有 DMU 提供更多 信息。效率排序 DEA 通过对效率值为 1 的决策单元再 区分,提供所有的决策单元在排名的相对次序,而不是 简单的分组情况。 交叉效率排序法最早由 Sexton 等人[49]提出,由此开 创了效率排序 DEA 的研究领域。Jahanshahloo G.R[50] 等人根据与理想解决方案 TOPSIS 的相似性改进方法, 使用订单偏好的技术计算最终效率得分。 超效率排序法由 Andersen 和 Petersen[51]提出,该方 法逐渐演变成用于异常值检测上[52]。Mehrabian 等人开 发的 MAJ 模型[53]克服了不可行性问题,同时解决了原模 型对数据变化的敏感性问题。但是,大量模拟实验[54]已 经证明,超高效率方法在评估决策单元的效率分数方面 效果不理想。 Torgersen 等人[55]提出了基准排序法,决策者根据决 策单元重要程度对有效单位排序。另一种基准排序法 的思路是根据有效 DMU 被用作低效 DMU 基准的频率 对有效 DMU 排序 [56]。Jahanshahloo G.R[57]等通过移除 有效 DMU 改变参考数据集,按照有效 DMU 对边界线 和低效单元的影响大小排序。 Friedman 和 Sinuany-Stern[58]借助相关分析(CCA), 将每个 DMU 通过 DEA 实现的权重向量,拟合成由 CCA 确定的一组权重,给出了公共权重法的思想。一种后期 分析方法[59]只使用平衡指数作为排序的依据。Wu 等[60] 改进后期分析法的模型,并使用最大平衡指数替代原来 的平衡指数。 3.2.1 交叉效率排序法 交叉效率排序法使用 n 个线性规划评估(即传统 DEA 模型)的最优权重,为每个 DMU 的效率得分计算 n 次。所有 DEA 交叉效率分数的结果可以总结在交叉效 率矩阵中,令 hkj 是交叉效率矩阵中第 k 行第 j 列元素, 如公式(10)所示,表示以第 k 个决策单元为评估对象 时,第 j 个决策单元的效率值,则矩阵中对角线上的元 素 hkk 就是第 k 个 DMU 的传统 DEA 效率值。 ,k = 1,2,⋯,n,j = 1,2,⋯,n (10) hkj = ∑ s urk ⋅ yrj ∑ m vik ⋅ xij r = 1 i = 1 Eo = ξ1 ∑ D wd ⋅ zdo ∑ m vi ⋅ xio d = 1 ∑ s ur ⋅ yro ∑ D wd ⋅ zdo r = 1 + ξ2 d = 1 3.2 效率排序 DEA 模型 i = 1 效率排序 DEA 的提出是为了解决经典 DEA 模型无 法区分强大而不同的决策单元的问题。经典 DEA 只能 (9) Sexton[49]通过计算平均交叉效率得分为所有决策单 元按照效率值排序。Doyle 和 Green[61]基于该思想,提出 了结合同行评估和自我评估的指标。基于交叉排序矩 阵[62]的方法可以直接获得所有 DMU 的排序顺序。交叉 效率方法避免了自我评估中存在的偏见,被认为是最可 靠的排名方法之一。 3.2.2 超效率排序法 超效率排序法通过去除原始公式中的第 k 个约束, 计算机工程与应用www.ceaj.org
张宏军,徐有为,程 恺,等:数据包络分析研究热点综述 2018,54(10) 223 使有效的 DMUk 能够达到大于1的效率分数,如公式(11) 所示。其中,J 表示除去 DMUk 以外,其余 DMU 的集 合。超效率模型实质是测量有效单位与排除之后的边 界之间的距离,因此最有效的单位可以减少其产出而不 降低其效率[52]。 (11) j ∈ J λkj xij ≤ fk xik,i = 1,2,⋯,m λkj yrj ≥ yrk,r = 1,2,⋯,s min fk ∑ ì ï ∑ ï í ï j ∈ J ï λkj ≥ 0,j = 1,2,⋯,n î 在实际应用中,超效率模型一方面存在造成部分单 位达到非常高分数的缺陷,Sueyoshi[63]通过引入权重的 具体界限解决了该问题。超效率模型的另一个缺点是 其倾向于返回不可行的结果,不能为所有 DMU 提供完 整排名。Thrall[64]以及 Seiford 和 Zhu[65]讨论并证明超效 率 DEA 模型的不可行条件。尽管 MAJ 模型解决了不可 行性问题,但是由于超效率排序法结果的不理想,最新 文献里已经很少提及该方法。 3.2.3 基准排序法 基准排序法评估的是有效单元相对于无效单元的 重要性。该方法首先借助加法模型[66]确定所有松弛值 为零的有效单元的集合 V ,再为每个决策单元计算径 向度量,模型由公式(12)给出,径向度量 E2i 表示:当保 持相同数量的输入时,最大输出的比率[52]。 j ∈ V = max δi λij ykj - δi yki = s y ki λij xpj = s x pi 1 E2i ∑ ì ï ï ï xpi - ∑ ïï ï j ∈ V ∑ í λij = 1 ï ï j ∈ V ï s y pi,λij ≥ 0,i = 1,2,⋯,n ki,s x ïï ï k = 1,2,⋯,s,p = 1,2,⋯,m î (12) 3.2.4 公共权重法 公共权重法旨在寻找传统统计方法与 DEA 的结 合,使用共同权重对 DMU 进行多变量统计分析,进而对 DMU 排序。结合 CCA 方法,Friedman[58]等定义了一个 新的缩放比 T 。其中 Wj 、Zj 分别是输出、输入的线性 组合。结合特征分析获取最大特征值对应的公共权重, 并直接应用于 DEA 结果。 Tj = Wj Zj = ∑ s ur ⋅ yrj ∑ m vi ⋅ xij r = 1 i = 1 (13) Wang 等人 [67]从模型应用的角度出发,指出大多数 现有方法太复杂,难以应用甚至不可行,并提出基于回 归分析的新方法,通过计算每个 DMU 最有利的权重最 小化目标效率和实际 DEA 效率的差,为 DMU 效率排序 寻求一组公共权重。 效率排序 DEA 很大程度上取决于决策者的投入, 不存在适用于所有 DEA 排序问题的方法,决策者应该 谨慎选择。 3.3 随机 DEA 模型 随机 DEA 是指基于统计公理或分布假设的非参数 凸包参考技术的效率分析[68]。经典 DEA 模型默认所有 的投入和产出无噪声,提供的是确定性前沿边界,随机 DEA[68-76]把测量误差、样本噪声和规范误差等作为模型 的组成部分,假定生产前沿随机,促使模型可以在统计 框架内处理适当的假设。 Thore[69]和 Land 等 [70]提出将统计特性应用到 DEA 模型中,Cooper 等 [72]结合统计特性,建立了机会约束 DEA(CCDEA)模型,并给出了随机有效性的定义。模 型由公式(14)给出。其中 Pr 代表概率,xij 、yrj 为已知 分布的随机变量,αj 和 βj 为相应的阈值。 max θ = Pr( ∑ s ur ⋅ y͂ ro ∑ m vi ⋅ x͂ io r = 1 i = 1 ≥ β0) (14) i = 1 r = 1 ≤ βj) ≥ 1 - αj ∑ s ur ⋅ y͂ rj ∑ m vi ⋅ x͂ ij ì ï ï ïïï Pr( ï í ï ï ur ,vi ≥ 0,j = 1,2,⋯,n ïïï r = 1,2,⋯,s ï i = 1,2,⋯,m î Cooper 等 [72]提供了 DMU 随机有效的必要条件和 DMU 非随机有效性的充分条件。多变量,非参数随机 边界模型[75]实现了 DEA 在数据生成方面的随机性;基于 内核的前沿估计器平滑处理边界[76],实现了 DEA 在前沿 边界的随机性。 3.4 其他扩展问题 3.4.1 窗口数据 窗口数据和时序数据均是针对多周期模型提出的, 用于评估不同决策单元在连续的多个时间周期内的效 率问题。研究多周期问题时,不同年份的效率边界可能 转移[77];因此,对不同年份的所有观察数据汇总评估得 到的前沿基准无法适用于所有时间观察点,3 到 4 个时 间段的窗口宽度往往会在效率测量中产生信息性和稳 定性的最佳平衡[77]。 Charnes 等[22]采用窗口数据分析研究了美国空军保 养单元不同时间点的效率情况,Sun[78]使用同样的方法 研究了大型商业银行的管理绩效问题。对于窗口数据 存在初、末期的数据与中期数据使用频率不一致的缺 陷,Sueyoshi[79]提出了 DMU 单元逐步递增的方法。 计算机工程与应用www.ceaj.org
224 2018,54(10) Computer Engineering and Applications 计算机工程与应用 3.4.2 时序数据 窗口数据和时序数据的不同在于:窗口数据分析侧 重于评估不同时间段的效率前沿,而时序数据侧重于计 算相邻两个时间周期的效率变化情况。Malmquist[80]生 产力指数(MPI)是时序数据分析的主要工具。 Caves 等人[81]通过前一个时期 t 的生产水平来计算 后一个时期 t + 1 的相对效率,依此衡量效率的变化。 但这会与用 t + 1 时期生产水平评估 t 时期相对效率的 结果产生二义性,Färe 等人[82]提出使用两种相对效率的 几何平均值作为 MPI 解决差异问题。2004 年,Färe 等 人[83]又将 MPI 定义为 Mj(0,t) = Dt jo ,评估 DMUj 在 0 时期到 t 时期的效率变化。当超过两个时期的比较时, 用 所 有 时 期 的 观 察 数 据 构 建 全 局 前 沿 ,即 使 用 全 局 MPI[84-85],更适合比较所有时期的效率。 3.4.3 存在负向变量的模型 jo/D0 经典 DEA 模型隐含的偏好是:投入越少并且产出 越多。然而在很多应用场景中,例如,电场的污染、银行 的不良贷款等指标,为了与物理过程保持一致,这些指 标只能视作“坏”输出,使得模型中存在了负向变量。 Seiford 和 Zhu[86]提出了“翻译”法,借助翻译向量 vr = max (yri) + 1,r ∈ B 将不良输出转正 ,即 yˉrj = -yrj + i vr > 0,r ∈ B 。在 VRS 假设中,这种转换提供了相同的 有效前沿。Juan Du 等[87]提出分两个步骤求解的思路, 第一步只处理所有正向变量,求得初步最优解后,第二 步只处理负向变量,结合不同的约束条件和最优化目标 获得最终最优解。Liu 等[88]通过重新定义生产可能集, 对存在负向投入产出变量 DEA 模型提出了完备的理论 框 架 。 模 型 如 公 式(15)所 示 。 其 中 (X,Y) =(X D,XU , Y D,YU) 分别对应正向、负向的输入和输出。 | sDI + | | | sUI + | sDO + | | | sUO )) (15) λj -sDO = βY DO o j λj -sUI = βX DO o j j = 1 j = 1 Min (α/β - ε( ∑ ì n Y DO ï ï ï ï ∑ ïï n X UI ï ï ï ï ∑ n Y UO í ï ï ï ï ∑ ïï n X DI ï ï j = 1 ï ï β ≥ 1,0 ≤ α ≤ 1 î j = 1 j λj +sUO = αY UO o j λj +sDI = αX UO o 4 DEA 方法的研究趋势 作为管理科学的一个研究领域,DEA 相关的研究 工作(包括方法与实践)正在持续不断增长,这将会进一 步推动 DEA 模型的拓展和应用范围的扩大。在当下 DEA 研究不断更新、发展的背景下,还存在以下几方面 有待进一步完善。 4.1 两阶段 DEA 的进一步挖掘 在当下,两阶段 DEA 模型仍然是许多学者研究的 热点,一方面是两阶段 DEA 模型的构建,另一方面是两 阶段 DEA 相关理论的延伸。在两阶段 DEA 模型构建 上,已经有学者提出了基于游戏理论[89]的领导-追随者 模型,该模型优先选取其中一个阶段作为领导者,并在 实践中取得了较好的应用。另外有研究在模型中加入 博弈的思想,将两个阶段视作相互博弈的局中人,分别 构建了合作式以及非合作式的模型[90]。另一种思路:假 设总的效率是两个阶段效率的某个函数表达式,而不再 是简单的加性或乘性关系,即 EO = f (E 1 O) 。模型求 解时,先后最大化第一阶段和第二阶段效率。公式(16) 给出了在这种构设下,第二阶段的求解模型。 O ,E 2 (16) O i = 1 l = 1 l = 1 l = 1 r = 1 s ur yrO ∑ D wl zlO r = 1 m vi xij ≤ 1,j = 1,2,⋯,n D wl zlj ≤ 1,j = 1,2,⋯,n m vi xiO = E 1 O = max∑ E 2 ∑ D wl zlj ∑ ì ï ï ï ïï s ur yrj ∑ ∑ ï í ï ∑ D wl zlO ∑ ï ï ïï l = 1 i = 1 ï ur,wl,vi ≥ 0 î 在两阶段 DEA 相关理论的延伸方面,目前应用较 多的领导-追随者模型尚没有解决如何选取领导者的问 题,在缺乏先验知识的情况下,如何选取领导者才能确 保客观公平成为新的研究内容;Li 等[89]指出,在中间措 施的权重以及系统与其成员之间的协调方面,领导-追 随者模型存在一定的外部性,得到的是有偏的求解结 果,这种外部性可以通过增补或者抽取中间措施的操作 解释。因此,领导-追随者模型需要进一步改进来消除 所谓的“外部性”。 4.2 网络模型的深化 由于计算量大,解空间相对复杂,目前已有的关于 网络模型的研究相对抽象,均是从宏观上泛化出相对简 单的结构。如何对复杂网络系统进行建模和分析是需 要进一步完善、解决的内容。结合启发式的搜索算法可 以有效减少计算量,已经有学者开始尝试构建相对复杂 的网络结构,借助启发式算法求解,为决策者提供 DMU 低效来源更精确的信息[91]。下一步可以进一步对网络 结构拓展构设,打开黑箱,针对特定的某类问题来勾勒 拓扑,以期和真实的物理过程保持一致,刻画更加复杂 的网络结构,使得决策评估更精准。 4.3 DEA 内外结合 内 部 结 合 是 DEA 不 同 模 型 之 间 的 结 合 ,例 如 Mohammad 等人将两阶段 DEA 与随机 DEA 结合 [92],解 决了存在不良数据情况下的两阶段效率评估问题。在 前人的工作基础之上,还可以考虑网络 DEA 模型与时 计算机工程与应用www.ceaj.org
张宏军,徐有为,程 恺,等:数据包络分析研究热点综述 2018,54(10) 225 序数据的结合,即当网络结构是动态变化时,应该如何 去描述、建立模型有待进一步研究,包括配置效率和规 模收益情况等;再例如,尽管两阶段 DEA 通过打开黑箱 放大了 DMU 的低效问题,但是同样存在着 DMU 之间 效率不可比的可能性,两阶段 DEA 与指标绩效排序结 合问题还不充分。 其次是 DEA 与其他综合评价方法的外部结合,使 综合评价的结果更能符合客观实际。这方面最经典的 案例就是将 DEA 与计量经济方法结合而成的 DEA-Tobit 模型。另外也有将 DEA 与基准测试结合,解决了相似 背景不同群体的目标设定问题[93]。有学者将 DEA 与 DE 和 MODE 结合[94],增加了 DEA 的“歧视力”,得到了更接 进实际的结果。此外,在构建指标评价体系时,可以研 究将随机 DEA 与 AHP、PCA 等方法结合。 4.4 DEA 应用拓展 DEA 应用扩展包括 DEA 在已有应用领域延展和在 其他领域应用开发。 DEA 在银行金融、能源效率、资源分配等多个交叉 学科主题中均取得了满意的效果,但是还不够充分。除 了评估已有数据外,还可以利用时序 DEA[95]实现金融危 机动态预测。目前关于资源分配的研究中,均假设存在 中 央 决 策 单 元 完 成 集 中 式 分 配 ,通 过 同 时 投 影 所 有 DMU 使总产出最大,尚没有研究将“非合作”决策者主 观偏好纳入模型。假设每个 DMU 分别属于多个不同分 组,分组满足组内合作、组间竞争的关系。在这种情况 下,优化目标就转换成以各分组为单位,每个分组的总 产出最大。当总的资源有限时,需要考虑不同分组应该 怎样协调资源,如何通过 DEA 模型体现决策者的价值 判断,是需要进一步研究的内容。 另外,将 DEA 方法应用到新的场景下,不断进行多 学科、跨学科渗透,以及在不同领域建立绩效指标等。 例如将网络 DEA 用于快递信使行业[96]。 4.5 其他方面 除以上列举的方面之外,DEA 可供研究拓展的内 容还可以包括:构建生产前沿时,只选取满足一定条件 的 DMU 而不是全部 DMU 作为参考集 [97];将并行网络 DEA 模型应用到指标聚合问题中,即假定每个并行单 元都是单输入单输出的特殊情况;在构建指标体系时应 该如何选取指标,即对指标进行评估。随着大数据时代 的到来,DEA 运算效率如何适应大数据背景下的多目 标决策也是需要考虑的问题。 5 结束语 本文在介绍 DEA 基本模型和思想的基础上,围绕 近 年 来 DEA 研 究 的 热 点 —— 两 阶 段 DEA、效 率 排 序 DEA、随机 DEA 和其他相关扩展问题进行了梳理和分 类,并预测了 DEA 未来可能的研究趋势。DEA 模型理 论的不断更新和发展,将会进一步推动 DEA 模型的研 究热潮。 参考文献: [1] 魏权龄 . 数据包络分析(DEA)[J]. 科学通报,2000,45(17): 1793-1808. [2] 杨国梁,刘文斌,郑海军 . 数据包络分析方法(DEA)综述[J]. 系统工程学报,2013,28(6):840-860. [3] 朱乔 . 数据包络分析(DEA)方法综述与展望[J]. 系统管理 学报,1994(4):1-9. [4] Farrell M J.The measurement of productive efficiency[J]. Journal of the Royal Statistical Society,1957,120(3): 253-290. [5] Charnes A,Cooper W W,Rhodes E.Measuring the effi- ciency of decision making units[J].European Journal of Operational Research,1978,2(6):429-444. [6] 魏权龄 . 评价相对有效性的 DEA 方法[M]. 北京:中国人民 大学出版社,1988. [7] Kordrostami S,Amirteimoori A.Un- desirable factors in multi- component performance measurement[J].Applied Mathematics & Computation,2005,171(2):721-729. [8] Azadeh A,Amalnick M S,Ghaderi S F,et al.An integrated DEA PCA numerical taxonomy approach for energy effi- ciency assessment and consumption optimization in energy intensive manufacturing sectors[J].Energy Policy,2007,35 (7):3792-3806. [9] Zhang B,Bi J,Fan Z,et al.Eco- efficiency analysis of industrial system in China:a data envelopment analysis approach[J].Ecological Economics,2008,68(1):306-316. [10] Tao Y,Zhang S.Environmental efficiency of electric power industry in the Yangtze River Delta[J].Mathe- matical & Computer Modelling,2013,58(5/6):927-935. [11] Zhou P,Sun Z R,Zhou D Q.Optimal path for control- ling CO2,emissions in China:a perspective of efficiency analysis[J].Energy Economics,2014,45(C):99-110. [12] Chen X,Skully M,Brown K.Banking efficiency in China: application of DEA to pre- and post-deregulation eras: 1993—2000[J].China Economic Review,2005,16(3): 229-245. [13] Ariff M,Can L.Cost and profit efficiency of Chinese banks:a non- parametric analysis[J].China Economic Review,2008,19(2):260-273. [14] Fung M,Leung M.X-efficiency and convergence of pro- ductivity among the national commercial banks in China[C]//Proceedings of the 19th China Economic Association(UK) Annual Conference,University of Cam- 计算机工程与应用www.ceaj.org
226 2018,54(10) Computer Engineering and Applications 计算机工程与应用 bridge,UK,2008. [15] Yao S,Han Z,Feng G.Ownership reform,foreign com- petition and efficiency of Chinese commercial banks:a non-parametric approach[J].World Economy,2008,31(10): 1310-1326. [16] Laurenceson J,Qin F.Has minority foreign investment in China’s banks improved their cost efficiency?[J]. China & World Economy,2008,16(3):57-74. [17] Golany B,Phillips F Y,Rousseau J J.Models for im- proved effectiveness based on DEA efficiency results[J]. A I I E Transactions,1993,25(6):2-10. [18] Golany B,Tamir E.Evaluating efficiency- effectiveness- equality trade-offs:a data envelopment analysis approach[J]. Management Science,1995,41(7):1172-1184. [19] Zhang Y,Zhang H,Zhang R,et al.DEA-based produc- tion planning considering influencing factors[J].Journal the Operational Research Society,2015,66(11): of 1878-1886. [20] Kumar C K,Sinha B K.Efficiency based production plan- ning and control models[J].European Journal of Opera- tional Research,1999,117(3):450-469. [21] Beasley J E.Allocating fixed costs and resources via data envelopment analysis[J].European Journal of Oper- ational Research,2003,147(1):198-216. [22] Charnes A,Clark C T,Cooper W W,et al.A develop- mental study of data envelopment analysis in measur- ing the efficiency of maintenance units in the U.S.air forces[J].Annals of Operations Research,1984,2(1): 95-112. [23] Roll Y,Golany B,Seroussy D.Measuring the efficiency of maintenance units in the Israeli Air Force[J].European Journal of Operational Research,1989,43(2):136-142. [24] Clarke R L.Evaluating USAF vehicle maintenance pro- time:an application of data envelop- ductivity over ment analysis[J].Decision Sciences,1992,23(2):376-384. [25] Bowlin W F.Financial analysis of civil reserve air fleet participants using data envelopment analysis[J].European Journal of Operational Research,2007,154(3):691-709. [26] Brockett P L,Cooper W W,Kumbhakar S C,et al. the effects regression studies of Alternative statistical of joint and service specific advertising on military recruitment[J].Journal of the Operational Research Soci- ety,2004,55(10):1039-1048. [27] Banker R D.Estimating most productive scale size using data envelopment analysis[J].European Journal of Oper- ational Research,1984,17(1):35-44. [28] Cooper W W,Tone K,Seiford L M.Data envelopment analysis:a comprehensive text with models,applica- tions references,and DEA-solver software with cdrom[M]. [S.l.]:Kluwer Academic Publishers,1999. [29] Charnes A,Cooper W W.Management models and in- linear programming[M].[S.l.]: dustrial applications of Wiley,1961. [30] Banker R D,Charnes A,Cooper W W.Some models for estimating technical and scale inefficiencies in data envelopment analysis[J].Management Science,1984, 30(9):1078-1092. [31] Färe R,Grosskopf S,Lovell C A K.The measurement of efficiency of production[M].Netherlands:Springer,1985. [32] Färe R,Grosskopf S,Lovell C A K.Production fron- tiers[M].[S.l.]:Cambridge University Press,1994. [33] Yaakovrol L,Cook W,Boazgolan Y.Controlling factor weights in data envelopment analysis[J].A I I E Trans- actions,1991,23(1):2-9. [34] Tone K.A slacks- based measure of efficiency in data envelopment analysis[J].European Journal of Operational Research,2001,130(3):498-509. [35] Zhang D,Li X,Meng W,et al.Measuring the perfor- the Olympic Games using DEA mance of nations at models with different preferences[J].Journal of the Opera- tional Research Society,2009,60(7):983-990. [36] Wang C H,Gopal R D,Zionts S.Use of data envelop- ment analysis in assessing information technology impact on firm performance[J].Annals of Operations Research, 1997,73(1):191-213. [37] Seiford L M,Zhu J.Profitability and marketability of the Top 55 U.S.commercial banks[J].Management Sci- ence,1999,45(9):1270-1288. [38] Yao C,Zhu J.Measuring information technology’s indi- rect impact on firm performance[J].Information Technol- ogy & Management,2004,5(1/2):9-22. [39] Kao C,Hwang S N.Efficiency measurement for network systems:IT impact on firm performance[J].Decision Sup- port Systems,2010,48(3):437-446. [40] Avkiran N K.Opening the black box of efficiency anal- ysis:An illustration with UAE banks[J].Omega,2009,37 (4):930-941. [41] Moreno P,Lozano S.A network DEA assessment of team efficiency in the NBA[J].Annals of Operations Research, 2014,214(1):99-124. [42] Lin T Y,Chiu S H.Using independent component anal- ysis and network DEA to improve bank performance evaluation[J].Economic Modelling,2013,32(2):608-616. [43] Tone K.Network DEA:a slacks-based measure approach[J]. European Journal of Operational Research,2009,197(1): 243-252. 计算机工程与应用www.ceaj.org
分享到:
收藏