logo资料库

信用评分,机器学习.ppt

第1页 / 共95页
第2页 / 共95页
第3页 / 共95页
第4页 / 共95页
第5页 / 共95页
第6页 / 共95页
第7页 / 共95页
第8页 / 共95页
资料共95页,剩余部分请下载后查看
§ 项目背景 § 项目目标 § 模型开发流程 § 具体开发过程 § 总结 § 未来展望
§ 中国人民银行征信中心拥有全国各大金融机构 的所有个人信贷帐户的信息,人数超过6千万, 数据积累也超过了3年,已经具备了研制和开发 信用局风险评分的条件 § 中国科学院虚拟经济与数据技术研究中心 § 双方于2006年6月正式启动了合作项目: “中国人民银行个人信用评分”
§ 运用先进的数据挖掘和统计分析技术,利用消 费者的住房贷款、汽车贷款、信用卡等的历史 信息,挖掘出蕴含在数据中的行为模式,建立 预测性的模型,预测出每个自然人在未来某个 时期内发生“信贷违约”的概率,并以一个分 数来表示。 § 通用性 § 准确性 § 易解释性 § 全面性 § 高效性
§ 基于中国人民银行征信中心的数据库, 对拥有信贷帐户的自然人,建立信用评 分模型: § 预测其违约概率 § 给出每个客户的信用评分 § 每个分数对应的好坏发生比 § 分数的解释
§ 任一自然人,只要拥有一个坏帐户,就是 信贷违约高风险的人,即“坏”客户 § 名下全部账户都是好账户的客户即为“好” 客户 § 其余活动的账户定义为“灰色账户”
§ 次数:通过逾期账户数分布,发现逾期4期及以上 的账户数量趋于稳定,坏帐户定义的逾期期数应该 为4期及以上 § 表现期长短:统计了表现期长度从1至27个月中的1 期至7期以上的坏账户之间的分布关系,选择表现 期为12个月 § 期中定义:对于好坏人的定义,采用表现期期中定 义(表现期内只要曾经出现3期以上逾期,就定义 为坏客户)
§ “好”、“坏”账户的定义由商业银行业务部门和中国人民银行 征信中心研究和计算决定 § 贷款类好账户 § 在2006/04-2007/03的时间窗口内活动的账户,并且曾经贷 款逾期不超过30天以上。 § 贷记卡类好账户 § 在2006/04-2007/03的时间窗口内活动的账户,并且曾经贷 记卡连续不超过1次以上未还最低还款额。 § 准贷记卡好账户 § 在2006/04-2007/03的时间窗口内活动的账户,并且曾经准 贷记卡有透支不超过30天以上的行为。
分享到:
收藏