logo资料库

信用卡欺诈检测系统.pdf

第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
资料共27页,剩余部分请下载后查看
信用卡欺诈检测系统 董西成 2017年5月
主要内容 1 2 3 4 项目背景与挑战 解决思路 信用卡欺诈检测系统构建与实现 总结
主要内容 1 2 3 4 项目背景与挑战 解决思路 信用卡欺诈检测系统构建与实现 总结
信用卡欺诈:背景 Ø 2016年7月,银行业协会发布了《中国银行卡产业发展蓝皮书》, 2015年,被称为中国个人征信元年,银行业协会数据显示,截 至2015年年底,个人信用基础数据库累计接入机构数2665家, 建档个人8.8亿人,有信贷记录的自然人3.8亿人; Ø 截至2015年年底,信用卡的累计发卡量为5.3亿张,新增信用卡 发卡量为0.8亿张,同比增长17.8%,而前两年的增长量分别为 18.8%和18.4%; Ø 据统计,仅2015年,信用卡诈骗就发生了5万逾起,信用卡诈骗 案件数量已经占到了经济案件的四分之一,使得银行损失数百 亿元,而追回的16.5亿元仅仅是一小部分;
信用卡欺诈:背景 Ø 随着信用卡业务的迅速扩张和竞争的日趋激烈,全国各地 有关信用卡方面的投诉、纠纷、案件频发,特别是在当前 互联网时代,信用卡业务风险处于多发、高发期; Ø 信用卡的反欺诈是一个系统性的工程; Ø 总体来说,欺诈交易可分为虚假申请、未达卡、账户盗用、 商户欺诈、失窃卡、伪卡、持卡人欺诈七种类型。
信用卡欺诈:挑战 Ø 数据的不平衡,即欺诈样本数量占比很少 ü 对于大多数信用卡欺诈交易问题来说,其数据库中好坏标签比例 都是极其不平衡的。一般来说,可能好标签的比例是超过99.5%, 坏标签的比例却仅仅只占0.5%或者甚至更少。 Ø 数据分布的不平稳,即历史数据不能反映部分新出现的欺 诈行为 ü 欺诈的方式会不断更新,从而导致新的欺诈类型不能被静态学** 的模型所刻画出来。
主要内容 1 2 3 4 项目背景与挑战 解决思路 信用卡欺诈检测系统构建与实现 总结
解决思路:总体流程 原始样本集 样本数据 样本数据 样本数据 特 征 提 取 特征样本集 … n 特征1 目标 特征1 … n 目标 特征1 … n 目标 预 处 理 训练集 特征1 … n 目标 特征1 … n 目标 特征1 … n 目标 验证集 特征1 … n 目标 特征1 … n 目标 特征1 … n 目标 训练 预测 机 器 学 习 算 法 输出 验证集 预测目标 预测目标 预测目标 评 价 改 进
分享到:
收藏