环亚娱乐ag88
联系电话
新闻中心 News center
联系我们 Contact us
  • 电 话:0429-111744229
  • 手 机:
  • 联 系人:环亚娱乐ag88总经理
  • 地 址:ag88环亚娱乐手机登录
银行业中的数据挖掘-贷款审批案例
来源:http://www.hn-ae.com 责任编辑:环亚娱乐ag88 更新日期:2018-10-22 20:59

  您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器

  银行的基本商业模式是作为金融中介--通过筹集融资和贷款(抵押贷款,房地产,消费者和公司贷款)。后者是两个主要贷款审批和欺诈组成的主要信用风险来源。在这篇文章中,我们将通过使用数据挖掘模型来关注贷款审批。

  基于信用评分向零售和企业客户授予信用是关键风险评估工具,其允许通过信誉评分来最佳的管理、理解和量化潜在的债务人的信用风险,“八项注意”让火灾远离。与评判评分相比,基于信用评分是更稳健和一致的评估技术。

  零售投资组合中的信用评分反映了贷款申请时客户的违约风险,它有助于根据 4 个主要输入数据决定是接受还是拒绝信用申请:

  客户信息:年龄,性别,婚姻状况,工作,收入/工资,住房(租金,自有,免费),地理(城市/农村),住宅状况,现有客户(Y / N),客户年数,总债务,账户余额。

  信用记录:付款记录和拖欠(付款延迟),当前债务金额,拖欠付款的月数,信用记录长度,自上次信用以来的时间,使用中的信用类型。

  银行账户行为:平均每月储蓄金额,最高和最低余额水平,信用额度,支付趋势,余额趋势,凯发k8国际未付款数量,超过信用额度的次数,更改家庭住址的次数

  数据挖掘通过显示哪些特征(因素)对特定结果影响最大来增加理解:关联矩阵有助于消除相关变量,特征选择方法(特别是多元相关)如逐步回归用于过滤不相关的预测变量;它在每一轮中添加最佳特征(或删除最差特征),并在每次迭代中使用交叉验证评估模型误差,以最终保持最佳预测器子集(特征选择主题将在单独的文章中处理)。

  逻辑回归和决策树都是用于构建行为记分卡的流行分类技术(监督学习),它们是分析数据集的统计方法,分析独立变量的预测者(或解释者) 和因变量的响应(或结果变量) 之间的关系。在我们的例子中,我们试图根据上面给出的输入变量的值来估计给予贷款的概率。为简化起见,我们将变量数量限制在 4 个预测变量:年龄,收入,平均每月储蓄金额,信用期限之后。

  在逻辑回归中,目标 y 是二元的 ( 授予 p = 1 /不授予 p = 0) 和 授予信贷的概率 p。目标是找到下面的公式的系数 αi 来预测 P 的 logit 变换。

  为了找到系数 αi,我们用标记的历史数据训练分类模型,其中 已经知道「授予」/「未授予」的决定,通过使用交叉熵作为损失函数来比较预测 ^ y vs 标签 y:

  αi 的值是使用其一阶导数和梯度下降等优化算法最小化 L(α0,...,α4)的值:

  在决策树(如 CRT,QUAID,QUEST,C5.0)中,我们构建分类模型,学习从数据特征推断出的决策规则以进行预测,生成具有与属性(输入变量)对应的决策节点的树结构。

  步骤 1:使用分类准则(Splitting Criterion)(如信息增益,增益比,基尼指数)选择具有最佳分数的属性,该分数将被选择以产生关于目标变量的最纯节点(在我们的例子中,最佳分离的属性授予来自未授予)。

  步骤 2:使用结果子集创建根分裂节点,然后通过重用分裂标准来选择下一个最佳属性以生成关于目标变量的最纯子节点,从而对每个子集重复步骤 1

  不同领域包括计算机视觉,语音语义,区块链,自动驾驶,数据挖掘,智能控制,编程语言等每日更新。

Copyright © 2013 环亚娱乐ag88_ag88环亚娱乐手机登录_www.ag88.com_环亚ag88手机版 All Rights Reserved 网站地图 ICP备案编号: