信用卡欺诈检测系统
董西成
2017年5月
主要内容
1
2
3
4
项目背景与挑战
解决思路
信用卡欺诈检测系统构建与实现
总结
主要内容
1
2
3
4
项目背景与挑战
解决思路
信用卡欺诈检测系统构建与实现
总结
信用卡欺诈:背景
Ø 2016年7月,银行业协会发布了《中国银行卡产业发展蓝皮书》,
2015年,被称为中国个人征信元年,银行业协会数据显示,截
至2015年年底,个人信用基础数据库累计接入机构数2665家,
建档个人8.8亿人,有信贷记录的自然人3.8亿人;
Ø 截至2015年年底,信用卡的累计发卡量为5.3亿张,新增信用卡
发卡量为0.8亿张,同比增长17.8%,而前两年的增长量分别为
18.8%和18.4%;
Ø 据统计,仅2015年,信用卡诈骗就发生了5万逾起,信用卡诈骗
案件数量已经占到了经济案件的四分之一,使得银行损失数百
亿元,而追回的16.5亿元仅仅是一小部分;
信用卡欺诈:背景
Ø 随着信用卡业务的迅速扩张和竞争的日趋激烈,全国各地
有关信用卡方面的投诉、纠纷、案件频发,特别是在当前
互联网时代,信用卡业务风险处于多发、高发期;
Ø 信用卡的反欺诈是一个系统性的工程;
Ø 总体来说,欺诈交易可分为虚假申请、未达卡、账户盗用、
商户欺诈、失窃卡、伪卡、持卡人欺诈七种类型。
信用卡欺诈:挑战
Ø 数据的不平衡,即欺诈样本数量占比很少
ü 对于大多数信用卡欺诈交易问题来说,其数据库中好坏标签比例
都是极其不平衡的。一般来说,可能好标签的比例是超过99.5%,
坏标签的比例却仅仅只占0.5%或者甚至更少。
Ø 数据分布的不平稳,即历史数据不能反映部分新出现的欺
诈行为
ü 欺诈的方式会不断更新,从而导致新的欺诈类型不能被静态学**
的模型所刻画出来。
主要内容
1
2
3
4
项目背景与挑战
解决思路
信用卡欺诈检测系统构建与实现
总结
解决思路:总体流程
原始样本集
样本数据
样本数据
样本数据
特
征
提
取
特征样本集
… n
特征1
目标
特征1 … n 目标
特征1 … n 目标
预
处
理
训练集
特征1 … n
目标
特征1 … n 目标
特征1 … n 目标
验证集
特征1 … n
目标
特征1 … n 目标
特征1 … n 目标
训练
预测
机
器
学
习
算
法
输出
验证集
预测目标
预测目标
预测目标
评
价
改
进