logo资料库

信用评分系统的建模及其验证研究.pdf

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
理 论 园 地 信用评分系统的建模及其验证研究 程 建 连玉君 内容提要: 《巴塞尔新资本协议》鼓励银行采用内部评级法评估信用风险, 但要求所 采用的评分系统必须提供建模过程说明与验证结果。本文按照这一要求, 在采用 R OC 曲 线、变量序别化转换等不同于以往国内研究的统计方法对信用评分系统进行建模的同时, 还 提供了相应的验证结果。实证研究结果表明, 依据方法所建立的信用评分卡具有较好的预测 力和稳定性, 可实现对借款者信用等级和违约概率的快速有效评估, 具有实际可操作性。 关键词: 信用评分 违约概率 R OC 序别化转换 中图分类号: F831 文献标识码: A 一、引言 信用评分系统在衡量信用风险的内部评级法 中占有核心地位。信用评分不仅能够帮助银行划 分借款户的信用等级, 而且能够直接预测借款户 的违约概率 ( Probability of Default) ,而违约概率 则是银行配置资本的基本参数。 《巴塞尔新资本 协议》( 2005) 指出, 采用内部评级法的银行在 对其各项信贷产品建立信用评分系统的同时, 不 仅要满足监督审查程序 ( Supervisory Review Pro- cess) 以及市场纪律( Market Discipline) 的要求, 而 且须对政府监管部门及社会各界提供信用评分系 统的验证结果。因此, 在《新巴塞尔资本协议》实施 的前夕, 对我国的银行( 金融企业) 而言, 信用评分 系统的构建与验证研究显得极为迫切。 国内对于信用评分系统的研究集中在两 方 面: 一是利用层次分析法设定权数的财务指标 加 权 评 级 体 系 , 如 赵 振 全 ( 2003) 和 邹 小 芃 ( 2005) 等。这类研究设计的评分体系虽然易于 操作, 但却不能直接根据信用等级得出违约概 率, 且在权数设定上主观性较强。另一类研究 则 集 中 于 模 型 的 预 测 力 比 较 上 , 如 方 洪 全 ( 2004) 、李萌 ( 2005) 、 张 维 ( 2000) 、 王 春 峰 ( 1999, 2001) 、石庆焱 ( 2004) 等对判别分析、 logit 模型、神经网络、遗传算法及递归分类 树 等方法进行了应用分析及其对比研究。但这类 研究还只限于信用评分系统中回归模型的局部 分析上, 并没有就如何从模型得到信用评分等 级和对应违约概率做出说明。 本文所构建的信用评分系统不仅能够 得 出 借款人的信用评分, 而且可得到对应的信用等 级及其违约概率, 从而能克服以往研究有评分 无评级、有评级无评分的缺点。另一方面, 本 文还采用 ROC 曲线、分组序别化转换等多种方 法用于系统的建模与验证, 这也是区别于以往 文献研究的不同之处。此外, 本文在构建信用 评分系统的过程中, 按照 《巴塞尔新资本协议》 内部评级法 ( 初级法) 的要求, 不但对建模过 程详细说明, 同时也提供模型的验证结果。 附表 1 和附表 2 就是本文构建的信用 评 分 系统的最终应用形式, 即信用评分卡。运用评 分卡, 我们可就任一借款人快速计算出其信用 评 分 、 信 用 等 级 和 违 约 概 率 。 以 附 表 1 为 例 , 若某申贷企业的内部保留比率为 53%, 可得 73 分; 固 定 资 产 比 率 为 41%, 可 得- 10 分; 流 动 比率为 2, 可得 39 分, 同样, 可得余下 7 个指 标 的 信 用 评 分 。 然 后 将 这 10 个 指 标 的 得 分 相 加, 再加上基准分就得到该申贷企业的信用总 评分。其后, 依照附表 4 的信用评级表, 即可 作者简介: 程建, 西安交通大学金禾经济研究中心博士研究生; 连玉君, 西安交通大学金禾经济研究中心博士 研究生。 5 0 国际金融研究 2007.6
得到该企业的信用等级及对应的违约概率。可 以看出, 本文所构建的信用评分系统具有较好 的可操作性, 能用于实际风险管理中, 这也是 本研究的另一个特点。 本文共分八节, 第二节中评估指标和模 型 违约预测力的统计方法作一简要介绍; 然后对 本文所采用的数据及其样本设定予以说明; 第 四节进行变量的序别化转换; 第五节对财务比 率指标进行筛选, 确定用于信用评分卡的解释 变量组合; 第六节说明制作信用评分卡的步骤 并导出信用评分卡; 第七节对第六节中导出的 两组信用评分卡进行验证。最后, 对本研究进 行总结。 二、变量及模型违约预测力 评估方法 要从众多的财务指标中选出具有最佳违 约 预测力的解释变量, 首先要对各财务指标的违 约 预 测 力 进 行 评 估 。 在 本 文 中 , 我 们 将 采 用 ROC ( Receiver Operation Curve) 曲 线 、 KS 值 和 条 件 熵 比 率 ( Conditional Information Entropy Ratio, CIER) 来 评 估 各 财 务 指 标 或 模 型 的 违 约 预测力!"。 1.ROC 曲线与 AUC 值 假 设 d 代 表 违 约 与 否 的 虚 拟 变 量 , d=1 表 示违约, d=0 表 示 未 违 约 。 构 建 信 用 评 分 系 统 的 目 的 就 是 预 测 d。 信 用 评 分 系 统 的 主 体 是 信 用评分值, 若以变量 z 来代表这 个 评 分 值, 那 么使用信用评分 z 预测 d 的方式 是: 先 决 定 一 阈值 z, 只要 z 的数值小于或等于 z, 则预测违 约的发生#"。对于变量 z 的每一个评分值, 分别 计算模型预测结果的实查率 ( 预测违约且实际 违约) 和误查率 ( 预测违约但实际未违约) , 则 这组值在平面坐标上的对应点就构成了 ROC 曲 线, 如图 1 所示。ROC 曲线上的箭头表示, 随 着实查率的提高, 误查率也必然增大, 而模型 理 论 园 地 图 1 ROC 曲线 的优劣完全在于误查率增加速度的快慢$"。完美 信用风险评估模型的 ROC 曲线将和单位正方形 的左、上边重合, 如图 1 中粗线所示; 而无预 测 力 的 模 型 , ROC 曲 线 将 和 45 度 线 重 合 。 合 理的 ROC 曲线应在 45 度线之上, 其与 45 度线 的垂直距离越大, 对应的评估模型就越好, 如 图 1 中 ROC 线 一 就 优 于 ROC 线 二 对 应 的 信 用 风险评估模型。 AUC ( Area Under Curve) 值 , 即 ROC 曲 线和横坐标之间的面积。AUC 值越大, 信用评 分模型就越好, 其最大值是 1; 当 ROC 曲线和 45 度重合 时, AUC 值 等 于 0.5, 对 应 信 用 评 分 系统无辨识度可言。除 AUC 值外, 还有 KS 统 计量, 等于 ROC 曲线与 45 度 线 之 间 的 最 大 垂 直距离。同样, AUC 值越大, 表示信用评分系 统区分违约者的能力越强。另外一个统计量就 是 ROC 曲 线 的 “对 称 点 ” ( Symmetry Point) , 是实查率和特质度 ( 1- 误查率) 相等时的数值。 对称点的图形意义则 是 ROC 曲 线 和 负 45 度 线 交点的纵坐标值。对称点越大, 表示对应评分 系统的违约预测力越高, 其最大值是 1。同理, 当 ROC 曲线与 45 度线重合时, 对称点等于 0.5 时, 表示对应评分系统的预测力最低。 2.条件熵比率 ( CIER) 给 定 两 随 机 变 量 x 和 y 的 联 合 密 度 函 数 f (x,y) 和 边 际 密 度 函 数 f (x) 和 f (y), 定 义 共 有 I (x,y) ≡E {ln f (x, 信息 ( Mutual Information) : !" 对于这些统计方法较为详细的讨论参见文献 [9]、 [12] 和 [13]。 #" 在本文中, 假设信用评分与违约可能性呈反向变动关系, 即信用评分越高, 违约可能性越小。 若 设 定 为 正 向 变动, 只需修改反向变动的结果, 探讨的架构并不变。 $" 这种情况针对于预测值与违约可能性呈负相关关系的情况。若预测值与违约可能性呈正相关关 系, 则 箭 头 所 示方向与图中相反, 结论不变。 国际金融研究 2007.6 5 1
理 论 园 地 y) - ln [f (x) ·f (y)]}, 即 f (x,y) 和 f (x) ·f (y) 之间的相对熵, 故非负。当 x 与 y 之间独立时, 共有信息为 0。根据共有信息的性质: I (x,y) = H (x) - H ( x|y), 这表示共有信息衡量的是随机 变量 x 的不确定性中能被随机变量 y 所 “解释” 的 部 分 , 由 于 共 有 信 息 不 可 能 为 负 , 故 H (x) ≥H (x|y), 这意味着只要 y 和 x 不独立, y 包含 的信息就能够降低 x 的不确定性, 所 以 y 能 够 降低 x 不确定性的比例可定义为 CIER (x|y) ≡ I (x,y) H (x) =1- H (x|y) H (x) . 该比率即为条件熵比率 ( Conditional Infor- mation Entropy Ratio) , 其 值 介 于 0 和 1 之 间 。 条件熵比率越大, 表示 y 的信息就能有助于降 低 x 的不确定性。 三、资料整理与样本选择 本文由中国金融研究中心 ( http://www.cfrd. com.cn) 获得 1998 年至 2003 年 ( 截至 2003 年 12 月 31 日) 上市公司财务报表数据, 共 9882 笔 !", 我 们 只 选 取 发 行 A 股 的 上 市 公 司 资 料 。 违约变量 d 本文采用 “ST”的定义, 即上市公 司是否被特殊处理#"。基于这组数据我们共定义 了 91 个财务指标$"。 对于违约者财务解释变量的样本值时点 的 选取, 为 避 免 Ohlson ( 1980) 指 出 的 “财 务 报 表时间点”问题, 我们不采用违约发生同年的 财务报表资料, 而采用违约发生前一年的解释 变量样本值, 原因是财务报表常需会计师的签 证而造成公布时间长达半年左右, 所以财务报 表资料最快也只能反映企业半年前的财务状况。 我国 “ST”警示公告多在每年的 4 月至 6 月间, 这实际上是根据上市公司上年的财务报表及经 营状况决定的。因此, 可认为企业发生 “违约” 的时点为上年的年末, 这就是本文所定义的违 约点, 所以用来预测企业 “违约”的财务状况 时 点 , 则 为 前 年 年 末 。 如 在 2000 年 被 警 示 “ST”的上市公司, 在估计样本中采用 1998 年 的 财 务 资 料 。 本 文 的 样 本 资 料 选 取 时 点 如 表 1 所示。本文以 1998~2000 年的资料做为估计 样 本%"制作信用评分卡, 以 2001 年和 2002 年的数 据做为验证样本&"来检验信用评分卡, 样本结构 见表 2。 表 1 样本的选取时点 样本 违约时点 财务资料时点 违约户数 估计样本 验证样本 2000 2001 2002 2003 2004 1998 1999 2000 2001 2002 26 24 44 54 35 表 2 制作信用评分卡的样本结构 样本 样本总数 正常样本数 违约样本数 违约率 估计样本 验证样本 964 1054 890 999 92 89 9.54% 8.44% 四、变量的序别化 从附表 1 和附表 2 可以看出, 信用评分卡中 的评分指标是以分组形式表示的。分组评分可以 简化评分, 提高操作效率, 相较连续变量具有一 定优势, 文献 [9] 对此进行了专门研究。因此, 对变量的序别化转换只作简要的介绍。 以 连 续 变 量 x 为 例 来 说 明 序 别 化 的 步 骤 : 首先, 给定一正整数 m, 找出 m- 1 个由小到大 的组界点 c1,c2,...,cm- 1, 将连续变量 x 的可能数值 分割为 m 组; 其次, 根据 x 变量样本值的分组, 将 样 本 分 组 , 并 计 算 各 分 组 的 违 约 比 率 : p1, !" 由于我国于 1998 年才开始要求上市公司编制现金流量表, 因此, 我们采用的数据最早到 1998 年。 #" 严格来讲, ST 更多表现为财务困境, 并不等同于违约, 参 见 文 献 [7]。 但 本 文 的 目 的 是 提 供 一 种 模 型 验 证 比 较的模式, 并不局限于某一组特定资料。若有可用的贷款数据, 本文的方法与步骤同样适用。 $" 指 标 计 算 公 式 参 见 国 泰 安 信 息 技 术 公 司 《中 国 上 市 公 司 财 务 指 标 分 析 数 据 库 使 用 指 南 ( 2004) 》, http://www. gta.com.cn. %" 在 2002 年或之后违约的企业, 在估计样本中属于正常户, 但在验证样本中则成为违约户。对于验证样本, 那 些在 2002 年之前违约而成为估计样本中违约户的样本将会被排除在验证样本之外。 &" 在 2005 年 违 约 的 样 本 , 其 对 应 的 财 务 资 料 为 2003 年 , 但 我 们 没 有 2005 年 被 ST 企 业 的 数 据 , 因 此 , 剔 除 2003 年的数据。 5 2 国际金融研究 2007.6
理 论 园 地 p2,...,pm。第三, 创造序别变量 x’如 下: 当 x 变 量 的 样 本 值 落 在 (ck- 1,ck) 分 组 中 时 , 则 将 序 别 变量 x’的对应样本值设定为 pk, 所得到 x’变量 将是一个只有 m 个不同样本值的序别变量。在 这一步中, 我们将分组违约比例 pk 转换为分组 证据权重 ( Weight of Evidence, WOE) !" WOE≡ln f 0 f 1 (z (z ) ) k k =ln p (1- p) p (1- p k k ) 转换后序别变量 x’的 m 个可能值仍可相互 比较且其排序可显示与违约可能性的趋势关系。 序别化解释变量除可简化信用评分卡的 使 用 及 充 分 利 用 缺 漏 值 信 息 外 , 还 有 三 个 优 点 : ( 1) 可突出显示因变量 ( 违约) 变化的主要趋 ( 2) 降低离群值的影响: 序别化后的变量 势; x’之可能数值只有 m 个, 绝不会有过大或过小 的 样 本 值 。 过 小 的 离 群 值 会 转 变 成 x’1 值 , 过 大 的 则 会 变 为 x’m 值 。 降 低 离 群 值 的 影 响, 有 助于增大 估 计 模 型 的 韧 性 ( Robustness) 。 ( 3) 序别化解释变量的分组评分除了可跨组比较外, 也容许变量间的直接比较。 五、筛选解释变量 在对解释变量进行序别化之后, 接下来 将 筛选财务指标变量以确定最终的解释变量组合。 本文将依据两种不同的架构来筛选变量, 其间 差异在于是否考虑财务指标的分类结构。财务 分析教材多将财务指标分为短期偿债能力、长 期偿债能力 ( 财务结构) 、经营绩效、获利能力 与现金流量指标五大类型。筛选财务指标模型 时可在每类中各挑一些最能预测违约可能性的 变量, 可得一平衡的财务指标组合, 称之为结 构型组合。此外, 也可忽略财务指标类型来选 取最佳的解释变量组合, 称之为非结构型。 无论是否考虑财务指标类型, 本文都 将 以 logit 回归模型为基础, 以 “正向选择法”作为筛 选变量的基本结构, 即对所有的候选解释变量, 逐一将表现最佳的新变量选入组合, 而每次挑选 新变量时, 不会将已选入组合的变量排除掉。 在这种筛选变量的过程中, 选入解释 变 量 的标准因选入变量的顺序有所变化。对初始变量 ( 即选入组合的第一个变量) 与其后选入的解释 变量设定两套不同的选择标准: 挑选初始变量主 要依据 AUC 值#"。对于从第二个序别化解释变量 开始, 若不考虑财务指标类型, 则对余下的候选 ( 1) 解释变量 变量按以下三项条件逐一考察: 在估计样本和验证样本中的 AUC 值之差的绝对 ( 2) 是否选入一个新变量, 事 值不得超过 0.1; 实上就等于制作并验证一个将该变量纳入组合的 信用评分卡。要求所有序别化解释变量的回归系 数必须为负$"且对应 t 值的绝对值须大于 0.5, 其 贡献度%"必须大于 3%; ( 3) 根据信用评分卡对 估计样本中的企业进行评分, 然后由高至低排序 后分为五组, 各组的违约率必须呈单调递增趋势 ( 至少不递减) 。在所有满足这三项条件的序别化 变量中, 选择一个能使对应信用评分卡在估计样 本中的 AUC 值最大且在验证样本的 AUC 值排名 居前五分之一的变量进入模型。 上述筛选解释变量的手续充分展现信 用 评 分卡的制作和一般回归模型的分析有根本上的差 异。例如, 我们并不依照一般假设检验所采用的 99%或 95%的显著水平来评估 t 值, 但却非常重 !" 采用证据权重的一个好处是可极大化解释变量的违约预测力, 具体分析参见文献 [9] 和 [12]。 #" 选 择 最 有 最 高 AUC 值 的 变 量 作 为 初 始 变 量, 尝 试 后 发 现 并 不 能 得 到 较 好 解 释 变 量 组 合 。 因 此 , 我 们 放 宽 标 准, 分别以 AUC 值大于 0.8 的解释变量做为初始变量来选择解释变量。 $" 由于证据权重 ( WOE) 为原违约率 pk 的单调递减转换, 因此其回归系数应为负值。 %" 给定 m 个序别化解释变量, 假设第 j 个序别化解释变量的第 i 个样本值是 xji, 样本平均数是 xj, 对应的回归系 数估计值为 bj, 则第 j 个序别化解释变量的贡献度为 贡献度 j≡ 1 n n i" b x 1i 1 n i" b = b x - b mi m x m m n i" x 1 1i x - b ji j j x j n 1 n i = 1" b x - b 1 1 +Λ+ n - x j ji j b i = 1" x - x1 +Λ+b m n , i" x - x m mi n 为样本数, 贡献度衡量的是序别化解释变量的信用评分样本绝对离均差占总信用评分样本绝对离均差中的比例。但 须注意, 贡献度只涵盖了计入信用评分卡的序别化解释变量, 并不考虑常数项和控制变量。 国际金融研究 2007.6 5 3
理 论 园 地 视系数估计值符号正确与否; 我们也不采用标准 计量经济分析所常用的卡方检验统计量 ( 或是类 似 R2 的拟合统计量) 来评估整个 logit 模型回归 的拟合度, 而是采用一般计量经济分析所不常用 的 AUC 值来衡量信用评分卡的表现。 按照上述标准, 最后筛选出的两组解释 变 量如表 3 所示。由表可知, “速动比率”、 “应 收账款周转率”和 “总资产报酬增长率”是两组 所共有的变量, 而内部保留比率与股利分派率在 理论上其和应为 1, 因此, 这两个指标从不同侧 面反映了企业的积累水平。可以看到: 虽然这两 组解释变量是按照不同的筛选原则从 91 个财务 指标变量中挑选出的, 但得到的两组变量组合却 有较多的共同变量。由此可知, 在众多财务变量 中有一些变量和违约风险具有较高的相关性。 由于信用评分卡的构建采用的资料通常 具 有一定的时间跨度, 故其与将来应用的资料之间 存在一定的差异, 如经济周期等宏观经济环境的 变化, 这些差异不是起因于企业的个体异质性, 而是源于由时间因素引起的企业生存的总体经济 环境的异质性。我们将在评分卡中引入 “控制变 量”, 以消除这种估计样本与未来应用样本之间 的差异性, 即经济环境变化对违约可能性的影 响, 保证信用评分卡的预测力具有一定的韧性。 文中, 我们设定一简单的控制变量: 1998~2000 年间估计样本中持续出现的年数, 有 1、2 和 3 三种可能数值。但应注意, 这一变量对正常户而 表 3 筛选的解释变量组合 序号 非结构型组合 结构型组合 营运资金对总资产比率 1 应收账款周转率 2 流动资产周转率 2 速动比率 1 速动比率 1 流动比率 1 资产负债率 3 固定资产比率 3 固定资产周转率 2 应收账款周转率 2 1 2 3 4 5 6 7 8 9 10 经营活动现金流入流出比 5 股利分派率 4 11 12 总资产报酬增长率 4 内部保留比率 4 营业毛利率 4 营业利润率 4 每股营业收入 2 利息保障倍数 3 营业外收支率 4 营业利润成长率 4 主营收入现金比率 5 总资产报酬成长率 4 1属于短期偿债能力类型; 2属于经营绩效类型; 3属于资本结构及长期偿债能力类型; 4属于盈利能力或投资报酬类型; 5属于现金流量类型。 5 4 国际金融研究 2007.6 言是企业的生存持续期; 对违约户而言这个变量 意义可视为宏观经济因素的影响。 六、信用评分卡的制作 确认解释变量组合后, 我们将采用 Logit 模 型进行估计以获得这些解释变量在信用评分卡中 的评分。两组解释变量的回归系数及其相关检验 统计量如表 4 所示。在表 4 中, 我们按照贡献度 来对解释变量进行排序, 可以看到, AUC 值的 排序与贡献度排序差异较大, 这是由于贡献度的 排序考虑其他变量的交互影响, 而 AUC 排序则 不考虑其他变量的影响, 这也提醒我们变量间的 相关性将对评分的结果可能会有比较大的影响。 接下来我们将对回归系数及解释变量 进 行 转换以得到最终的信用评分卡。假设序别化解 释变量的数目为 m 个, 第 j 个序别化变量的第 i 个 样 本 值 是 xji, 对 应 的 回 归 系 数 估 计 值 为 bj, 此外, 假设 a0 和 a1 分别代表常数项和控制变量 的 回 归 系 数 估 计 值, 则 根 据 logit 模 型 的 设 定 , 可得 “未违约险算比”( Odds Ratio, OR) 的对 数值的估计式 ( p 表示对第 i 个样本违约可能性 pi 的估计值) 如下: i! "=- 1- p Λ i p +Λ+b m 1·w +b 1 (a 0 x mi x 1i +a ln ) Λ Λ i 这里 wi 是控制变量的第 i 个样本值。若给 定 一 个 控 制 变 量 值 w’, 则 我 们 可 用 此 给 定 值 w’替代样本值 wi 并将上式等号右边部分分解为 #z j=1,2,...,m, 再 o =- b x ji +a =- (a , j 0 加总为#z i =#z 由于#z i ji 1·w’), 和#z o +#z 1i +Λ+#z mi 。 =500+43.430·#z z i i +Λ+43.430·#z =z o mi = (500+43.430·#z o ) +43.430·#z 和违约 1i 可能性 pi 大致呈反比, 所以可视为第 i 个 企 业 的信用评分, #z 越高违约可能性就越低。相对 i +Λ+z mi +z 1i 于总评分#z i 借款户在第 j 个解释变量上所得到的评分。 , 其分项#z ji 代表的是第 i 个 =- b x ji j 总评分#z i 除了以相对数值显 示 信 用 的 好 坏 外, 由上式可知其绝对数值尚有不违约险算比 对数值的解释。根据这个解释, 我们可将总评 分做一个不改变其相对大小的线性转换, 但总
表 4 筛选的解释变量回归系数及其统计量 化解释变量的分组界点、对应分组评分。 变量 回归系数 t值 贡献度 AUC值 理 论 园 地 非结构型组合 内部保留比率 固定资产比率 流动比率 固定资产周转率 总资产报酬增长率 应收账款周转率 经营现金流入流出比率 资产负债率 速动比率 营业毛利率 控制变量 截距项 结构型组合 股利分派率 速动比率 利息保障倍数 营业利润成长率 营业利润率 应收账款周转率 总资产报酬增长率 主营业务收入现金比率 营业外收支率 每股营业收入 流动资产周转率 营运资金比资产总额 控制变量 截距项 - 0.756 - 2.075 - 0.909 - 1.325 - 0.505 - 0.591 - 0.655 - 0.430 - 0.459 - 0.306 - 1.027 0.264 - 0.538 - 0.733 - 0.398 - 0.333 - 0.247 - 0.515 - 0.295 - 0.419 - 0.528 - 0.321 - 0.246 - 0.356 - 1.459 1.302 19.795 14.706 13.045 12.556 10.791 7.281 6.913 6.164 5.533 3.217 19.865 10.721 10.553 9.711 9.058 7.703 7.654 6.907 5.801 5.180 3.511 3.335 0.660 0.561 0.665 0.606 0.807 0.689 0.662 0.723 0.656 0.673 0.791 0.656 0.878 0.741 0.843 0.689 0.807 0.662 0.686 0.671 0.675 0.628 - 6.63 - 3.69 - 2.12 - 3.19 - 2.78 - 2.60 - 2.86 - 1.83 - 1.00 - 1.11 - 5.14 0.55 - 3.42 - 1.68 - 3.13 - 2.17 - 1.88 - 2.11 - 1.46 - 1.75 - 2.39 - 0.90 - 0.63 - 0.74 - 5.54 2.09 评 分 要 等 于 1000; ( 2) 当 违 约 概 率 等 于 0.9999, 对应的总评分要等于 0。由此可导出满 足这两个条件的线性转换公式如下: z i =500 +43.430·!z = (500 +43.430·!z ) + o 43.430·!z 1i i +Λ+43.430·!z mi =z o +z 1i +Λ+z mi 其中, zo 将是所谓的 “基准评分”, 而 zji 则 是第 j 个解释变量的评分。调整后的总评分 zi 等 于基准分加上所有 m 个序别化解释变量之评分 的总和, 而 zi 除了满足前述有关违约概率与评分 之间的两个条件外, 尚具有如下的性质, 当未违 约险算比等于 1 时, 则总评分 zi 正好等于 500, 且每当总评分 zi 增加 30.10 分时, 未违约险算比 就增加 1 倍。附表 1 和附表 2 分别列出了非结构 型评分卡和结构型评分卡中的 基 准 分 、 各 序 别 七、信用评分卡的分析与验证 根据估计样本的评分结果分别制作的 两 种 五级"#评分卡如附表 3 和 4 所示。附表 3 是均分 组评分卡, 附表 4 使用动态搜寻分等界点的评分 卡。附表 3 和 4 中分别列出了信用等级、等级界 点、预测违约率$#、估计样本与验证样本的各组 户数、样本率和实际违约率。两组信用评分卡无 论是在估计样本中, 还是在验证样本中, 实际违 约率均随一级到五级的递增而递增 ( 至少不能递 减) , 显示出评分卡的违约率分布具有较好的稳 定性; 两组评分卡在验证样本中的分等户数分布 较均匀, 表明样本的分布也较为稳定。 在附表 4 中, 非结构型组合在验证样 本 中 的第一、二等级的实际违约率出现递减; 而结 构型组合无论是建置样本还是验证样本的各实 际违约率均呈现单调递增, 这说明结构型组合 的实际违约率分布较非结构型更为稳定。需要 说 明 的 是 , 实 际 使 用 的 信 用 评 分 表 是 附 表 4, 均 分 组 形 式 只 是 为 了 我 们 检 验 上 的 方 便 。 表 5 所列的预测力检验结果就是基于附表 4 得出的。 表 5 信用评分卡的测试与验证结果 统计量 估计样本 验证样本 非结构型 结构型 非结构型 结构型 AUC值 0.927 0.937 0.865 0.888 ROC曲线 KS值 74.452 74.616 56.334 54.960 Sym值 CIER值 0.870 0.403 0.870 0.407 0.764 0.362 0.809 0.363 由于信用评分卡的主要功能在于预测 违 约 概率, 因此, 其预测力的好坏至关重要。在构 建信用评分卡之后, 必须采用验证样本来检验 其预测力的稳定性。从表 5 可以看出, 结构型 评分卡无论是在估计样本中, 还是在验证样本 中均具有最高的 AUC 值。两组评分卡的预测力 均较估计样本有所下降, 但下降幅度不大, 其 差小于 0.1。结构型 评 分 卡 在 验 证 样 本 中 的 KS 值 小 于 非 结 构 型 , 但 由 于 KS 值 反 映 的 是 实 查 "# 信用等级在实际应用通常为十级左右。但在本文中由于样本数目所限, 若定义为十级, 每级的样本数会偏少, 违约概率的稳定性不能得到保障。因此, 根据样本的大小, 本文将信用等级定为五级。 $# 预测违约概率是当控制变量对所有样本值均设定为 3 时的预测概率。 国际金融研究 2007.6 5 5
理 论 园 地 率分布曲线与误查率分布曲线上点与点之间的 最大距离, 因此不如 AUC 值衡量的是两分布曲 线上所有点之间差异来得全面。从条件熵比率 ( CIER) 来 看 , 两 组 评 分 卡 均 具 有 较 好 违 约 预 测力, 即本文所建模型能较好地预测违约的发 生, 优于随机模型。同时, 结构型评分卡稍强 于非结构型。综上可得, 两组信用评分卡都具 有较高的违约预测力, 但结构型评分卡稍优于 非结构型。经过样本外检验, 表明本文所建构 的 信 用 评 分 卡 具 有 较 高 的 违 约 预 测 力 和 韧 性 。 因此, 我们即可使用信用评分卡对新的申贷企 业进行打分评级, 并得出相应等级的违约概率, 即附表 4 中的预测违约率。 八、结论 本文对信用评分系统的构建步骤进行了详细 的说明, 并利用上市公司的财务资料进行了实证 研究。与国内其他信用评分模型研究的不同之处 在于: 首先, 本文导出的信用评分卡不但可以划 参考文献: 分信用等级, 而且可以得出相应的违约概率。其 次, 在变量的处理上, 我们采用了序别化转换并 利用 ROC 曲线来评估筛选变量和评估信用评分系 统预测力的优劣。第三, 在应用多重标准设定筛 选变量的方式之后, 我们得出了两组信用评分卡, 结果发现结构型评分卡的表现优于非结构型评分 卡。此外, 对于缺漏值的利用也是本文研究的一 个特点。更为重要的是, 本文所建的信用评分系 统基于巴塞尔新资本协议内部评级法 ( 初级法) 的标准!", 不但提供详细的建模过程, 而且给出了 评分系统的验证结果。但同时也应看到, 虽然我 们采用统计及其计量方法尽量客观化信用评分过 程, 但是在信用评分系统的建构过程中仍会涉及 到诸多的主观设定, 如序别化变量的分组数设定, 违约时点及控制变量的选取等, 这些都会对信用 评分产生重大的影响。因此, 信用评分系统的还 有很多地方值得进一步研究改进。毋庸置疑, 品 质优良的信用评分系统对于我国银行与金融类企 业加强信用风险管理, 应对 《巴塞尔新资本协议》 实施后的国际同业竞争将具有极为重要的意义。 1.赵振全、周佰成、赵立云: “BED 信用评估方法”, 《中国软科学》, 2003 第 11 期。 2.邹小芃、余君、钱英: “企业信用评估指标体系与评价方法研究”, 《数理统计与管理》, 2005 年第 1 期。 3.方洪全、曾勇、何佳: “多标准等级判别模型在银行信用风险评估中的应用研究”, 《金融研究》, 2004 年第 9 期。 4.李萌: “logit 模型在商业银行信用风险评估中的应用研究”, 《管理科学》, 2005 年第 2 期。 5.张维、李玉霜、王春峰: “递归分类树在信用风险分析中的应用”, 《系统工程理论与实践》, 2000 年第 3 期。 6.王春峰、万海晖、张维: “基于神经网络技术的商业银行信用风险评估”, 《系统工程理论与实践》, 1999 年第 9 期。 7.王春峰、康莉: “基于遗传规划方法的商业银行信用风险评估模型”, 《系统工程理论与实践》, 2001 年第 2 期。 8.石庆焱、靳云汇: “多种个人信用评分模型在中国应用的比较研究”, 《统计研究》, 2004 年第 6 期。 9.程建、连玉君: “变量序别化在信用评分模型中的应用研究”, 《国际金融研究》, 2006 年第 8 期。 10.Ohlson, J. M., Financial Ratios and the Probabilistic Prediction of Bankruptcy [J]. Journal of Accounting Research, 1980, 18(1): 109~131. 11.Basel Committee on Banking Supervison, Studies on the Validation of Internal Rating Systems [R], 2005, Working Papers No. 14. 12.Pepe, M. S., The Statistical Evaluation of Medical Tests for Classification and Prediction [M]. 2003, Oxford: Oxford University Press. 13.Roger M. Stein, Benchmarking Default Prediction Models: Pitfalls and Remedies in Model Validation [R]. 2002, New York: Moody’s KMV. 14.Jorge R. Sobehart, Sean C. Keenan, Roger M. Stein. Benchmarking Quantitative Default Risk Models: A Validation Methodology[R]. 2000, Moody’s Investors Service. 15.Naeem Siddiqi. Credit Risk Scorecard Development and Implementation[R]. 2003, SAS Institute Inc.. Abstr act: Based on the IRB in the new Basel Accord, this paper constructs two credit scorecard by different statistics and methods not used in domestic researches, such as ROC, ordinal transformation etc. It also presents the results of valida- tion. This paper shows that these credit scorecards are accurate and robust, what’s more, we can not only assign the credit grade of an application but also obtain its probability of default, and thus applicable in practice. Keywor ds: Credit Scoring; PD; ROC; Ordinal Transformation. !" 由于受数据制约, 严格来讲, 本文的结果尚不完全符合《巴塞尔新资本协议》的要求, 还有待于信贷数据的可用性。 5 6 国际金融研究 2007.6
理 论 园 地 附表 1: 非结构型评分卡 基准分: 622.44 分组 组界点 组评分 分组 组界点 组评分 1.内部保留比率 6.经营现金流入流出比 1 2 3 2.固定资产比率 1 2 3 4 5 3.流动比率 1 2 3 4 5 - ∞
分享到:
收藏