欢乐狗 发表于 2024-7-13 21:29:02

【数据挖掘】银行信用卡风险大数据分析与挖掘

银行信用卡风险大数据分析与挖掘

1、实行目的

中国某个贸易银行高层发现自家信用卡存在严重的敲诈和拖欠征象,已经影响到自身经营和发展。银行高层盼望大数据分析部门采用数据挖掘技能,对影响用户信用等级的主要因素进行分析,结合信用卡用户的人口特性属性对敲诈举动和拖欠举动的影响因素进行分析,挖掘银行客户信用卡记录数据的潜伏代价,为该银行的信用卡业务决议提供参考。银行大数据部门通过对银行的客户信用记录、申请客户信息、拖欠汗青信息、消费汗青记录等数据进行分析,可对不同水平的客户进行归类,研究信用卡贷款拖欠、信用卡敲诈等问题与客户的个人信息、信用卡利用信息的关系,为银行提前识别、防控信用卡业务风险提供参考,从而淘汰银行在信用卡业务方面的丧失,并采用大数据分析与挖掘模型和算法设计构建信用卡风险识别系统,为银行的聪明运营奠定底子。本次分析的主要目的是通过对客户拖欠汗青信息和消费记录进行信用卡风险客户识别模型的创建。
2、实行情况

实行情况采用的是R4.3.1版本,情况编程工具采用的是RStudio进行编程创建猜测模型并评估模型的结果,对模型进行参数优化,得出相应的模型结果。
3、实行设计

3.1、标题设计

信用卡风险客户识别模型。通过对该应该用户是否有拖欠举动和敲诈举动的用户作为该银行的信用卡风险客户,制定风险客户标签。
3.2、数据获取与存储

采用R语言对原始数据进行读取,读取后的数据采用变量进行生存在R工作情况中,以便建模分析调取利用。由于数据文件为excel情势,因此利用R读取数据时采用readxl包中的read_excel函数进行数据的读取。
3.3、数据处理

在读取数据后需要对数据做处理,而由于需要用到不同的表格数据,需要先将不同表格数据通过关联的客户号进行连接后,创建目的变量是否风险客户,是否风险客户是通过是否有拖欠举动和是否敲诈举动判断,两者只要满足其一则为风险客户。创建好目的变量后需要对无用变量进行剔除,如客户姓名、客户号等对建模无用的底子信息进行剔除。剔除无用变量后发现数据中的变量有分部为类别变量,因此需要对类别变量的数据类型做转换,将是否类型或有无类型的变量采用0和1进行复制替换处理,有序类别变量则采用序列号赋值处理,无序类别变量则将其转换为因子的数据类型,最后得到模型的原始数据,再对原始数据进行训练集和测试集的划分,以便利用训练集和测试集分别进行模型的创建和模型的测试。
3.4、模型与参数确定

创建模型所选用的算法分别为逻辑斯蒂回

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【数据挖掘】银行信用卡风险大数据分析与挖掘