我国P2P行业逾期行为的影响因素

时间:2022-10-01 01:50:16

我国P2P行业逾期行为的影响因素

【摘要】本文可能影响逾期行为的因素采用随机森林的方法进行粗选,发现借款人所在的地区、借款用途、性别、有无子女、学历等因素的特征得分较高,通过建立逻辑回归,对粗选的结果采用逐步回归的方法,结果表明:婚姻状况、区域因素、贷款年限、学历、工作单位对逾期行为产生有较强的影响。

一、引言

2014年以来,我国P2P行业迅速发展,成为全世界P2P发展最快的国家,但与此同时,跑路的平台也急剧增加,类似e租宝等平台占到30%以上,针对该行业的整体态势,国家监管部门出台《私募股权众筹融资管理办法(试行)(征求意见稿)》,加强了对P2P等行业的监管,本文主要从信用风险得角度,以国内某一大型P 2P公司为研究对象,探究客户逾期行为的影响因素。

国内对于P2P行业逾期行为的研究有很多,谈超等将影响逾期的因素划分为标的特征、信用特征、个人特征和往期借款4个维度,从中选取15个变量,通过建立logit回归方程,探究逾期行为与这些变量的关系:王重润以“红岭创投”的真实业务数据为基础,选取借款者违约行为的9个特征因素建立Logit模型进行分析,探究影响逾期的因素。

二、还款逾期特征变量的选择

1.数据说明

因变量是客户类型,其中l代表新增逾期客户;0代表非逾期客户。

本文选取我国某一较大规模的P2P公司,获取该公司2015年1月为M0,2016年1月为M1,2016年2月为M2,共931条新增逾期客户在2016年1月的数据,以及2015年12月,2016年1月,2016年2月为M0,共931条正常客户在2016年1月的931条数据,共1862条数据进行分析。其中M0:客户逾期0-30天:M1:客户逾期30-60天;M2:客户逾期60-90天;在实际业务中,习惯定义M2为新增逾期。

选取的自变量包括:合同版本、贷款品种、片区、性别、是否续贷、综合费率、判断贷款信息是否提交过、判断个人信息是否添加过、判断工作信息是否添加过、判断联系人信息是否添加、贷款用途、学历、婚姻状态等信息。

2.变量筛选

本文对可能影响客户分类的35个因素采用随机森林的方法对关键变量进行提取,同时,为了避免分布不均匀的问题,采用五重交叉验证,具体过程如下:

(1)将样本分为训练集和测试集,其中测试集占30%。

(2)将训练集样本随机均匀分成5份样本,取其中4份样本记为N1,另一份样本记为n。

(3)将N1采用随机森林的方法,提取特征集S1,并去掉特征分x小于0.01的特征变量。

三、模型的建立及应用

1.Logit回归方程

本文对筛选出的变量采用逐步回归的方法建立Logit方程。具体过程如下:

3.模型检验

3.3.1模型泛化误差

运用建立的模型,对30%的测试集进行测试,结果如下:

四、结论及建议

1.结论

综上所述,影响新增逾期的因素包括:

(1)婚姻状况。一般而言离异,丧偶,再婚的客户逾期率要高一点。

(2)学历。学历越低,逾期率越高;一般而言学历在大专,高中,高中以下的逾期率相对来说要高。

(3)区域因素。华东地区整体信用状况和华北相比较差,导致华东地区逾期率较高,华北片区逾期率较低。

(4)贷款年限。一般而言期限越长的逾期率较高,风险越高。

(5)工作单位。从单位性质来看,机关单位、国企性质的单位逾期率较低。

2.建议

(1)避免期限较长的产品。平台在产品设计时,尽量避免贷款期限超过一年的产品,对于超过一年的产品,加强风控部门对客户的事中管理。

(2)尽快完善P 2 P行业的信息共享机制。目前,由于P 2 P公司对客户的信息不共享,因此,部分客户存在倒账行为,行业整体的系统性风险偏高,因此,尽快实现行业内部的信息共享机制,有利于降低这类风险,降低逾期率。

因此,预测的准确度86.95%,模型的泛化误差较小。

上一篇:重点太多也就是没有重点 下一篇:建筑学中绿色建筑设计的发展趋势