§ 项目背景
§ 项目目标
§ 模型开发流程
§ 具体开发过程
§ 总结
§ 未来展望
§ 中国人民银行征信中心拥有全国各大金融机构
的所有个人信贷帐户的信息,人数超过6千万,
数据积累也超过了3年,已经具备了研制和开发
信用局风险评分的条件
§ 中国科学院虚拟经济与数据技术研究中心
§ 双方于2006年6月正式启动了合作项目:
“中国人民银行个人信用评分”
§ 运用先进的数据挖掘和统计分析技术,利用消
费者的住房贷款、汽车贷款、信用卡等的历史
信息,挖掘出蕴含在数据中的行为模式,建立
预测性的模型,预测出每个自然人在未来某个
时期内发生“信贷违约”的概率,并以一个分
数来表示。
§ 通用性
§ 准确性
§ 易解释性
§ 全面性
§ 高效性
§ 基于中国人民银行征信中心的数据库,
对拥有信贷帐户的自然人,建立信用评
分模型:
§ 预测其违约概率
§ 给出每个客户的信用评分
§ 每个分数对应的好坏发生比
§ 分数的解释
§ 任一自然人,只要拥有一个坏帐户,就是
信贷违约高风险的人,即“坏”客户
§ 名下全部账户都是好账户的客户即为“好”
客户
§ 其余活动的账户定义为“灰色账户”
§ 次数:通过逾期账户数分布,发现逾期4期及以上
的账户数量趋于稳定,坏帐户定义的逾期期数应该
为4期及以上
§ 表现期长短:统计了表现期长度从1至27个月中的1
期至7期以上的坏账户之间的分布关系,选择表现
期为12个月
§ 期中定义:对于好坏人的定义,采用表现期期中定
义(表现期内只要曾经出现3期以上逾期,就定义
为坏客户)
§ “好”、“坏”账户的定义由商业银行业务部门和中国人民银行
征信中心研究和计算决定
§ 贷款类好账户
§ 在2006/04-2007/03的时间窗口内活动的账户,并且曾经贷
款逾期不超过30天以上。
§ 贷记卡类好账户
§ 在2006/04-2007/03的时间窗口内活动的账户,并且曾经贷
记卡连续不超过1次以上未还最低还款额。
§ 准贷记卡好账户
§ 在2006/04-2007/03的时间窗口内活动的账户,并且曾经准
贷记卡有透支不超过30天以上的行为。