申请评分卡模型(汽车金融)

您所在的位置:网站首页 bad汽车 申请评分卡模型(汽车金融)

申请评分卡模型(汽车金融)

2024-05-26 06:45| 来源: 网络整理| 查看: 265

1.数据说明

本案例是基于一份汽车贷款违约数据建立的申请评分卡模型,表 1-1 对数据集中的变量进行简要说明,并给出数据清洗策略。其中是否违约 bad_ind 是因变量

表 1-1 数据集变量的简要说明 字段名中文含义数据清洗策略application_id申请者IDaccount_number帐户号bad_ind是否违约(因变量)vehicle_year汽车购买时间0代表缺失,使用适合众数填补vehicle_make汽车制造商空白代表缺失,使用适合众数填补或单独分类bankruptcy_ind曾经破产标识空白代表缺失,使用适合众数填补或单独分类tot_derog五年内信用不良事件数量(比如手机欠费消号)缺失代表无记录,使用适合中位数填补tot_tr全部帐户数量缺失代表系统内无记录,应该使用total open trade lines+两变量差值的均值age_oldest_tr最久账号存续时间(月)缺失代表系统内无记录,使用均值或中位数填补tot_open_tr在使用帐户数量缺失代表系统内无记录,应该使用total open revolving trade lines+两变量差值的均值tot_rev_tr在使用可循环贷款帐户数量(比如信用卡)缺失代表系统内无记录,使用均值或中位数填补tot_rev_debt在使用可循环贷款帐户余额(比如信用卡欠款)tot_rev_line可循环贷款帐户限额(信用卡授权额度)rev_util可循环贷款帐户使用比例(余额/限额)fico_scoreFICO打分缺失代表系统内无记录,使用均值或中位数填补purch_price汽车购买金额(元)msrp建议售价0代表缺失,使用适合按照汽车制造商进行均值填补down_pyt分期付款的首次交款loan_term贷款期限(月)loan_amt贷款金额ltv贷款金额/建议售价*100tot_income月均收入(元)veh_mileage行使历程(Mile)used_ind是否二手车 2. 拒绝推断(RI) import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import os 变量属性变量名含义acceptsrejects缺失数量缺失率缺失数量缺失率数值型application_id申请者ID00%00%account_number帐户号00%--bad_ind是否违约(因变量)00%--vehicle_year汽车购买时间10%10%bankruptcy_ind曾经破产标识2174%1554%tot_derog五年内信用不良事件数量(比如手机欠费消号)2134%1333%tot_tr全部帐户数量2144%1333%age_oldest_tr最久账号存续时间(月)2164%1343%tot_open_tr在使用帐户数量141932%99831%tot_rev_tr在使用可循环贷款帐户数量(比如信用卡)63812%44512%tot_rev_debt在使用可循环贷款帐户余额(比如信用卡欠款)4789%3308%tot_rev_line可循环贷款帐户限额(信用卡授权额度)4789%3308%rev_util可循环贷款帐户使用比例(余额/限额)00%00%fico_scoreFICO打分3146%1824%purch_price汽车购买金额(元)00%00%msrp建议售价10%10%down_pyt分期付款的首次交款00%00%loan_term贷款期限(月)00%00%loan_amt贷款金额00%00%ltv贷款金额/建议售价*10010%00%tot_income月均收入(元)50%20%veh_mileage行使历程(Mile)10%10%used_ind是否二手车00%00%weight样本权重00%--离散型vehicle_make汽车制造商2995%2446%


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3