基于机器学习的信用风险控制研究

基于机器学习的信用风险控制研究

随着“互联网+”概念的普及,我国互联网金融行业迅速发展,个人信贷业务市场份额也快速增长,使得业务数据变得复杂多样。传统的信贷风控大多是模型驱动的策略,已经不能够满足违约风险预测的需求,导致各类违约事件频发,给机构带来较大的损失。因此,需要引入机器学习算法,来完善信贷风控机制,促进信贷业务市场健康、可持续发展。本文采用机器学习算法针对信贷风控场景中的两个问题进行解决。第一,在新的信贷产品投放初期,由于没有业务积累,仅有少量标记数据和大量无标记数据,因此不能建立数据驱动的有监督信贷风控模型;第二,在信贷产品投放一段时间后,积累到了一定量的数据,大多数机构会采用逻辑回归(Logistics Regression,LR)来实现信贷风控建模,LR模型简单且易于实现、训练速度快,但是这种模型属于线性模型,学习能力有限,不能学习到特征间的非线性关系,需要信贷业务经验丰富的风控工程师做人工特征组合,因此需要耗费大量的人工成本。围绕以上问题,本文主要工作如下:(1)针对信贷产品投放初期,不能建立数据驱动的有监督信贷风控模型的问题,本文提出了基于狄利克雷过程混合模型(Dirichlet Process Mixture Model,DPMM)和隔离森林(Isolation Forest,IForest)的冷启动方法。该方法采用DPMM计算出了无标记样本的违约相似度,采用IForest计算出了无标记样本的违约异常度,综合违约相似度和违约异常度筛选出可靠正常样本和潜在违约样本,为后续监督模型训练提供充足样本。(2)针对信贷产品投放后期,单一LR模型对数据特征间非线性关系学习能力不足的问题,本文提出了基于Bagging的XGBoost-LR模型融合方法。该方法采用极限梯度提升树模型(e Xtreme Gradient Boosting,XGBoost)进行特征转换,将其叶子节点的输出,作为LR模型的输入,进而提升LR对非线性数据特征的学习能力,同时引入Bagging机制,对XGBoost的行采样参数和列采样参数进行扰动,建立多个XGBoost-LR融合模型,进一步提升模型预测能力。为了验证上述两种设计方法的有效性,本文利用某互联网金融公司信贷脱敏数据集和多个UCI数据集,对上述方法进行了实验仿真。同时,为了体现设计方法的实用性,本文设计了一个信贷风控系统。

基本信息

题目基于机器学习的信贷风控研究
文献类型硕士论文
作者刘子扬
作者单位南京邮电大学
导师刘斌
文献来源南京邮电大学
发表年份2020
学科分类信息科技,经济与管理科学
专业分类自动化技术,金融,投资
分类号TP181;F832.4
关键词狄利克雷过程混合模型,隔离森林,逻辑回归,极限梯度提升树,信贷风控
总页数:68
文件大小:2819K

论文目录

摘要
abstract
第一章 绪论
  1.1 课题背景
    1.1.1 课题研究背景
    1.1.2 课题研究意义
  1.2 国内外研究现状
  1.3 研究内容
  1.4 本文创新点
  1.5 本文组织结构
第二章 基础知识和相关理论
  2.1 信贷风控体系介绍
  2.2 信贷风控冷启动方法
    2.2.1 无样本可依下的信贷风控冷启动方法
    2.2.2 无标记样本下的信贷风控冷启动方法
  2.3 机器学习算法
    2.3.1 DPMM
    2.3.2 IForest
    2.3.3 LogisticsRegression
    2.3.4 XGBoost
  2.4 本章小结
第三章 基于DPMM和 IForest的信贷风控冷启动方法
  3.1 问题分析
  3.2 方法设计
    3.2.1 基于DPMM计算违约相似度
    3.2.2 基于IForest计算违约异常度
    3.2.3 样本筛选及权重设置
    3.2.4 监督模型训练
  3.3 仿真实验
    3.3.1 数据集
    3.3.2 评估指标
    3.3.3 实验环境
    3.3.4 实验及结果分析
  3.4 本章小结
第四章 基于Bagging的 XGBoost-LR信贷风控模型融合方法
  4.1 问题分析
  4.2 方法设计
    4.2.1 基于XGBoost的特征构造方法
    4.2.2 LR分类预测
    4.2.3 XGBoost-LR模型融合方法
    4.2.4 基于Bagging的 XGBoost-LR模型融合方法
  4.3 仿真实验
    4.3.1 数据集
    4.3.2 评估指标
    4.3.3 实验及结果分析
  4.4 本章小结
第五章 信贷风控系统
  5.1 系统框架
  5.2 数据分析模块
    5.2.1 选择目标变量
    5.2.2 原始数据统计分析
    5.2.3 坏账用户特征分析
  5.3 数据清洗模块
    5.3.1 缺失值填充
    5.3.2 数据过滤
  5.4 特征工程模块
    5.4.1 特征抽象
    5.4.2 特征缩放
    5.4.3 特征选择
  5.5 评分模块
    5.5.1 模型分析
    5.5.2 评分转换
  5.6 本章小结
第六章 总结与展望
  6.1 总结
  6.2 展望
参考文献
附录1 攻读硕士学位期间申请的专利
附录2 UCI数据集划分说明
致谢

参考文献

[1] 我国日常型消费信贷产品的现状及发展趋势[J]. 现代商业 2019(33)
[2] 推进信贷产品整合[J]. 农业发展与金融 2020(03)
[3] 我国银行业绿色信贷产品创新问题研究[J]. 时代金融 2020(21)
[4] 中小银行信贷产品供给结构性问题与对策研究——以福建省中小银行为例[J]. 福建商学院学报 2020(03)
[5] 消费信贷产品监管的路径与机制研究——基于美国《多德-弗兰克法》1031(d)条款的评析[J]. 金融监管研究 2020(07)
[6] 新常态背景下我国村镇银行科技信贷产品的创新[J]. 现代营销(下旬刊) 2019(01)
[7] 公司线上信贷产品风险防范研究[J]. 现代经济信息 2019(09)
[8] 初创期信贷产品申请评分建模方法综述[J]. 中国信用卡 2019(09)
[9] 我国商业银行绿色信贷产品创新的典型事实与因应策略[J]. 山东财经大学学报 2019(06)
[10] 浅谈银行绿色信贷产品面临的创新问题[J]. 纳税 2018(06)
[11] 适时调整完善信贷产品和制度[J]. 农业发展与金融 2018(09)
[12] 雾霾治理的绿色信贷产品创新研究[J]. 金融理论与教学 2016(06)
[13] 银行网络信贷产品体系建设研究与思考[J]. 金融电子化 2016(08)
[14] 我国商业银行绿色信贷产品创新[J]. 全国流通经济 2017(09)
[15] 新常态背景下我国村镇银行信贷产品创新:模式建构与实施[J]. 经济管理 2016(03)
[16] 科技信贷产品创新的拓展空间探究[J]. 财会月刊 2014(22)
[17] 浅析小微企业信贷产品——以建设银行聊城市分行为例[J]. 金融经济 2017(24)
[18] 信贷产品及制度体系存在的问题和建议[J]. 农业发展与金融 2018(10)
[19] 精准扶贫信贷产品创新实施效果及面临的问题[J]. 北方金融 2016(11)
[20] 信贷产品创新——破解小企业融资难的有效途径[J]. 现代商业 2014(06)
[21] 农村信用社信贷产品研发的难点与对策[J]. 科技视界 2013(11)
[22] 基于现代农业的农村信用社信贷产品创新的思考[J]. 企业导报 2013(07)
[23] 南京中小企业融资信贷产品创新研究[J]. 现代商业 2012(34)
[24] 农村信贷产品创新与风险定价的实证分析:吉安县个例[J]. 武汉金融 2011(03)
[25] 陕西农村经济增长视角的农村信贷产品创新研究[J]. 西安石油大学学报(社会科学版) 2011(02)
[26] 农村消费信贷产品的优化设计[J]. 金融经济 2011(12)
[27] 农村信贷产品创新中的风险隐患及对策——来自江西省九江市的实证分析[J]. 武汉金融 2010(01)
[28] 以产品创新推进农发行可持续发展——农发行客户三部信贷产品创新与业务发展论坛侧记[J]. 农业发展与金融 2010(05)
[29] 信贷产品创新:银行业增长方式转变的新途径——对青海省银行业金融机构的调查[J]. 青海金融 2009(02)
[30] 农村信贷产品和服务创新难点及建议[J]. 金融与经济 2009(06)

相似文献

[1]大数据在定兴联社小微信贷产品的应用探究[D]. 杨子琦.河北金融学院2019
[2]JT银行金华分行小微企业信贷产品创新研究[D]. 陈佳怡.西安电子科技大学2019
[3]小额消费信贷产品风险防控与创新研究[D]. 王雨竹.浙江大学2019
[4]商业银行服务小微企业的信贷产品创新研究[D]. 翁子斐.贵州财经大学2019
[5]东方微银小微企业信贷产品创新案例研究[D]. 高英.大连理工大学2019
[6]吉林省农村信贷产品创新研究[D]. 董淑怡.吉林财经大学2019
[7]网络消费信贷产品在大学生群体中的扩散与使用行为研究[D]. 王嘉琪.厦门大学2018
[8]商业银行中小微企业信贷产品供求匹配问题研究[D]. 李永鑫.南京农业大学2017
[9]商业银行绿色信贷产品创新问题研究[D]. 王瑶瑶.兰州大学2019
[10]中国农业银行伊春分行绿色信贷产品创新研究[D]. 杨晶.哈尔滨工业大学2018
基于机器学习的信用风险控制研究
下载Doc文档

猜你喜欢