随着“互联网+”概念的普及,我国互联网金融行业迅速发展,个人信贷业务市场份额也快速增长,使得业务数据变得复杂多样。传统的信贷风控大多是模型驱动的策略,已经不能够满足违约风险预测的需求,导致各类违约事件频发,给机构带来较大的损失。因此,需要引入机器学习算法,来完善信贷风控机制,促进信贷业务市场健康、可持续发展。本文采用机器学习算法针对信贷风控场景中的两个问题进行解决。第一,在新的信贷产品投放初期,由于没有业务积累,仅有少量标记数据和大量无标记数据,因此不能建立数据驱动的有监督信贷风控模型;第二,在信贷产品投放一段时间后,积累到了一定量的数据,大多数机构会采用逻辑回归(Logistics Regression,LR)来实现信贷风控建模,LR模型简单且易于实现、训练速度快,但是这种模型属于线性模型,学习能力有限,不能学习到特征间的非线性关系,需要信贷业务经验丰富的风控工程师做人工特征组合,因此需要耗费大量的人工成本。围绕以上问题,本文主要工作如下:(1)针对信贷产品投放初期,不能建立数据驱动的有监督信贷风控模型的问题,本文提出了基于狄利克雷过程混合模型(Dirichlet Process Mixture Model,DPMM)和隔离森林(Isolation Forest,IForest)的冷启动方法。该方法采用DPMM计算出了无标记样本的违约相似度,采用IForest计算出了无标记样本的违约异常度,综合违约相似度和违约异常度筛选出可靠正常样本和潜在违约样本,为后续监督模型训练提供充足样本。(2)针对信贷产品投放后期,单一LR模型对数据特征间非线性关系学习能力不足的问题,本文提出了基于Bagging的XGBoost-LR模型融合方法。该方法采用极限梯度提升树模型(e Xtreme Gradient Boosting,XGBoost)进行特征转换,将其叶子节点的输出,作为LR模型的输入,进而提升LR对非线性数据特征的学习能力,同时引入Bagging机制,对XGBoost的行采样参数和列采样参数进行扰动,建立多个XGBoost-LR融合模型,进一步提升模型预测能力。为了验证上述两种设计方法的有效性,本文利用某互联网金融公司信贷脱敏数据集和多个UCI数据集,对上述方法进行了实验仿真。同时,为了体现设计方法的实用性,本文设计了一个信贷风控系统。
基本信息
题目 | 基于机器学习的信贷风控研究 |
文献类型 | 硕士论文 |
作者 | 刘子扬 |
作者单位 | 南京邮电大学 |
导师 | 刘斌 |
文献来源 | 南京邮电大学 |
发表年份 | 2020 |
学科分类 | 信息科技,经济与管理科学 |
专业分类 | 自动化技术,金融,投资 |
分类号 | TP181;F832.4 |
关键词 | 狄利克雷过程混合模型,隔离森林,逻辑回归,极限梯度提升树,信贷风控 |
总页数: | 68 |
文件大小: | 2819K |
论文目录
摘要 |
abstract |
第一章 绪论 |
1.1 课题背景 |
1.1.1 课题研究背景 |
1.1.2 课题研究意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 本文创新点 |
1.5 本文组织结构 |
第二章 基础知识和相关理论 |
2.1 信贷风控体系介绍 |
2.2 信贷风控冷启动方法 |
2.2.1 无样本可依下的信贷风控冷启动方法 |
2.2.2 无标记样本下的信贷风控冷启动方法 |
2.3 机器学习算法 |
2.3.1 DPMM |
2.3.2 IForest |
2.3.3 LogisticsRegression |
2.3.4 XGBoost |
2.4 本章小结 |
第三章 基于DPMM和 IForest的信贷风控冷启动方法 |
3.1 问题分析 |
3.2 方法设计 |
3.2.1 基于DPMM计算违约相似度 |
3.2.2 基于IForest计算违约异常度 |
3.2.3 样本筛选及权重设置 |
3.2.4 监督模型训练 |
3.3 仿真实验 |
3.3.1 数据集 |
3.3.2 评估指标 |
3.3.3 实验环境 |
3.3.4 实验及结果分析 |
3.4 本章小结 |
第四章 基于Bagging的 XGBoost-LR信贷风控模型融合方法 |
4.1 问题分析 |
4.2 方法设计 |
4.2.1 基于XGBoost的特征构造方法 |
4.2.2 LR分类预测 |
4.2.3 XGBoost-LR模型融合方法 |
4.2.4 基于Bagging的 XGBoost-LR模型融合方法 |
4.3 仿真实验 |
4.3.1 数据集 |
4.3.2 评估指标 |
4.3.3 实验及结果分析 |
4.4 本章小结 |
第五章 信贷风控系统 |
5.1 系统框架 |
5.2 数据分析模块 |
5.2.1 选择目标变量 |
5.2.2 原始数据统计分析 |
5.2.3 坏账用户特征分析 |
5.3 数据清洗模块 |
5.3.1 缺失值填充 |
5.3.2 数据过滤 |
5.4 特征工程模块 |
5.4.1 特征抽象 |
5.4.2 特征缩放 |
5.4.3 特征选择 |
5.5 评分模块 |
5.5.1 模型分析 |
5.5.2 评分转换 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录1 攻读硕士学位期间申请的专利 |
附录2 UCI数据集划分说明 |
致谢 |
参考文献
[1] 我国日常型消费信贷产品的现状及发展趋势[J]. 现代商业 2019(33) |
[2] 推进信贷产品整合[J]. 农业发展与金融 2020(03) |
[3] 我国银行业绿色信贷产品创新问题研究[J]. 时代金融 2020(21) |
[4] 中小银行信贷产品供给结构性问题与对策研究——以福建省中小银行为例[J]. 福建商学院学报 2020(03) |
[5] 消费信贷产品监管的路径与机制研究——基于美国《多德-弗兰克法》1031(d)条款的评析[J]. 金融监管研究 2020(07) |
[6] 新常态背景下我国村镇银行科技信贷产品的创新[J]. 现代营销(下旬刊) 2019(01) |
[7] 公司线上信贷产品风险防范研究[J]. 现代经济信息 2019(09) |
[8] 初创期信贷产品申请评分建模方法综述[J]. 中国信用卡 2019(09) |
[9] 我国商业银行绿色信贷产品创新的典型事实与因应策略[J]. 山东财经大学学报 2019(06) |
[10] 浅谈银行绿色信贷产品面临的创新问题[J]. 纳税 2018(06) |
[11] 适时调整完善信贷产品和制度[J]. 农业发展与金融 2018(09) |
[12] 雾霾治理的绿色信贷产品创新研究[J]. 金融理论与教学 2016(06) |
[13] 银行网络信贷产品体系建设研究与思考[J]. 金融电子化 2016(08) |
[14] 我国商业银行绿色信贷产品创新[J]. 全国流通经济 2017(09) |
[15] 新常态背景下我国村镇银行信贷产品创新:模式建构与实施[J]. 经济管理 2016(03) |
[16] 科技信贷产品创新的拓展空间探究[J]. 财会月刊 2014(22) |
[17] 浅析小微企业信贷产品——以建设银行聊城市分行为例[J]. 金融经济 2017(24) |
[18] 信贷产品及制度体系存在的问题和建议[J]. 农业发展与金融 2018(10) |
[19] 精准扶贫信贷产品创新实施效果及面临的问题[J]. 北方金融 2016(11) |
[20] 信贷产品创新——破解小企业融资难的有效途径[J]. 现代商业 2014(06) |
[21] 农村信用社信贷产品研发的难点与对策[J]. 科技视界 2013(11) |
[22] 基于现代农业的农村信用社信贷产品创新的思考[J]. 企业导报 2013(07) |
[23] 南京中小企业融资信贷产品创新研究[J]. 现代商业 2012(34) |
[24] 农村信贷产品创新与风险定价的实证分析:吉安县个例[J]. 武汉金融 2011(03) |
[25] 陕西农村经济增长视角的农村信贷产品创新研究[J]. 西安石油大学学报(社会科学版) 2011(02) |
[26] 农村消费信贷产品的优化设计[J]. 金融经济 2011(12) |
[27] 农村信贷产品创新中的风险隐患及对策——来自江西省九江市的实证分析[J]. 武汉金融 2010(01) |
[28] 以产品创新推进农发行可持续发展——农发行客户三部信贷产品创新与业务发展论坛侧记[J]. 农业发展与金融 2010(05) |
[29] 信贷产品创新:银行业增长方式转变的新途径——对青海省银行业金融机构的调查[J]. 青海金融 2009(02) |
[30] 农村信贷产品和服务创新难点及建议[J]. 金融与经济 2009(06) |
相似文献
[1]大数据在定兴联社小微信贷产品的应用探究[D]. 杨子琦.河北金融学院2019 |
[2]JT银行金华分行小微企业信贷产品创新研究[D]. 陈佳怡.西安电子科技大学2019 |
[3]小额消费信贷产品风险防控与创新研究[D]. 王雨竹.浙江大学2019 |
[4]商业银行服务小微企业的信贷产品创新研究[D]. 翁子斐.贵州财经大学2019 |
[5]东方微银小微企业信贷产品创新案例研究[D]. 高英.大连理工大学2019 |
[6]吉林省农村信贷产品创新研究[D]. 董淑怡.吉林财经大学2019 |
[7]网络消费信贷产品在大学生群体中的扩散与使用行为研究[D]. 王嘉琪.厦门大学2018 |
[8]商业银行中小微企业信贷产品供求匹配问题研究[D]. 李永鑫.南京农业大学2017 |
[9]商业银行绿色信贷产品创新问题研究[D]. 王瑶瑶.兰州大学2019 |
[10]中国农业银行伊春分行绿色信贷产品创新研究[D]. 杨晶.哈尔滨工业大学2018 |