动态异质集成信用评分模型在P2P网络借贷中的应用

来源：长理培训发布时间：2019-01-03 12:58:08

1. 对于单一分类模型而言，LR的表现优于其他统计学方法和SVM、MLP、DT等数据挖掘方法，这与Lessmann等（2015）、晏艳阳和蒋恒波（2010）的研究结果是一致的。LR取得了最低的平均秩且错误率较为平衡。加之LR易于操作，使得其在当今信用评分领域仍占据一席之地；而朴素贝叶斯和K近邻的表现较差，这是因为这两个模型较容易过拟合。
　　2. 在同质集成模型中，比较单一模型及应用Bagging方法构建的集成模型，发现MLP集成模型的精度提升较大，而SVM集成模型的提升较小，这也从侧面证明Bagging、Boosting等集成方法较适宜能够提供更高多样性的不稳定分类模型。随机森林在同质集成模型中表现最佳，Lessmann等（2015）也提出将随机森林作为新的信用评分模型的对照模型。
　　3. 异质集成模型的表现整体上优于单一分类模型和同质集成模型，简单的多数投票异质模型（HE-MV）就取得了相当可观的分类效果，包含行业标杆的LR和随机森林模型，这可能是由于不同类型的基础模型提供了不同的假设空间和搜索空间，从而增强了模型的泛化能力。这一结果为构建信用评分模型提供了新的思路，可继续探索异质集成信用评分模型。本文提出的DSHE模型是在HE-MV模型的基础上更进一步，在P2P网络借贷数据集和传统信用数据集均取得令人满意的效果，特别是AR和AUC-H两个指标，处于全体模型的前两位。而对于信用评分中比较关心的第一类错误，DSHE的表现也比较好，在集成分类模型中均处于前列，这也从侧面说明本文提出的基于AUC-H指标的动态筛选策略的有效性。
　　为更加清晰地分析各模型跨数据集和跨评价准则的表现，使用式（9）对表2中各模型性能使用非参数Friedman检验，得到[χ2F=65.875]，对应p值小于0.001，拒绝零假设，各模型的平均秩存在显著差异，进而实施Nemenyi检验比较DSHE是否与其他模型存在统计学上的显著差异进行具体分析，其结果如图2所示。
　　图2中横轴表示各模型，纵轴则表示模型在3个数据集、共计12个评价准则下的平均秩。平均秩越大，则表明该模型表现越差。其中DSHE模型具有最低的平均秩，说明其综合表现最优；针对其他模型而言，若高于对比线，则表明在该显著水平下其平均表现显著地劣于DSHE模型。在最为严格的p=0.01的水平下，DSHE的平均秩显著低于全体单一模型和除随机森林外的绝大部分同质集成模型，DSHE相较于当前的主流方法能够提供更佳的信用评估性能。而DSHE与大部分其他异质集成模型的表现在统计学上不存在显著差别，表明异质集成模型整体上取得令人满意的评估性能。
　　四、结论
　　建立准确且易操作的信用评分体系，对于P2P网络借贷的参与者而言具有十分重大的意义。本文借鉴了传统信用评分方法，特别地对P2P网络借贷的信用评分进行了研究，相比于相�P集成信用评分模型研究，在结构和集成策略上进行了改进，提出了三阶段的动态异质集成信用评估模型DSHE，并使用UCI数据库中的数据集和P2P网络借贷的真实数据进行了实证分析，结果发现在3个数据集中DSHE的平均表现最佳，特别是在准确率和AUC-H指标上表现较为突出，其综合表现显著优于包括行业普遍使用的LR模型在内的大部分基准模型，从而为异质集成信用评分模型的建模提供了一个新的思路：在今后的信用评分模型的构建中，可充分考虑引入评估性能更具优势的异质集成模型，对P2P借款人信用情况做出更准确的预测。
　　参考文献：
　　[1]吴冲，夏晗.基于支持向量机集成的电子商务环境下客户信用评估模型研究[J].中国管理科学，2008，24（S1）.
　　[2]肖进，刘敦虎，顾新.银行客户信用评估动态分类器集成选择模型[J].管理科学学报，2015，17（3）.
　　[3]傅彦铭，臧敦刚，戚名钰.P2P网络贷款信用的风险评估[J].统计与决策，2014，29（21）. 　　[4]刘大洪，廖检文，陈柳洁.动态模糊聚类信用评价模型及其应用研究[J].企业导报，2013，19（16）.
　　[5]晏艳阳，蒋恒波.信用评分模型应用比较研究――基于个体工商户数据的检验[J].统计与信息论坛，2010， 25（5）.
　　[6]Guo Y，Zhou W，Luo C， et al. 2016. Instance-Based Credit Risk Assessment for Investment Decisions in P2P Lending[J].European Journal of Operational Research，249（2）.
　　[7]West D，Dellana S，Qian J. 2005. Neural network ensemble strategies for financial decision applications[J].Computers & operations research，32（10）.
　　[8]Tsai C-F，Wu J-W. 2008. Using neural network ensembles for bankruptcy prediction and credit scoring[J].Expert systems with applications，34（4）.
　　[9]Wolpert D H，Macready W G. 1997. No free lunch theorems for optimization[J].IEEE transactions on evolutionary computation，1（1）.
　　[10]Emekter R，Tu Y，Jirasakuldech B，et al. 2015. Evaluating credit risk and loan performance in online Peer-to-Peer （P2P） lending[J]. Applied Economics，47（1）.
　　[11]Malekipirbazari M，Aksakalli V. 2015. Risk assessment in social lending via random forests[J].Expert Systems with Applications，42（10）.
　　[12]Visentini I，Snidaro L，Foresti G L. 2016. Diversity-aware classifier ensemble selection via f-score[J].Information Fusion，28.
　　[13]Ala'raj M，Abbod M F. 2016. Classifiers consensus system approach for credit scoring[J].Knowledge-Based Systems，10.
　　[14]Nascimento D S，Coelho A L，Canuto A M. 2014. Integrating complementary techniques for promoting diversity in classifier ensembles： A systematic study[J].Neurocomputing，138（8）.
　　[15]Visentini I，Snidaro L，Foresti G L. 2016. Diversity-aware classifier ensemble selection via f-score[J].Info Infus， 28（3）.
　　[16]Hand D J. 2009. Measuring classifier performance： a coherent alternative to the area under the ROC curve[J]. Machine learning，77（1）.
　　[17]Paleologo G，Elisseeff A，Antonini G. 2010. Subagging for credit scoring models[J].European Journal of Operational Research，201（2）.
　　[18]Dem?ar J. 2006. Statistical comparisons of classifiers over multiple data sets[J].J Mach Learn Res，7（1）.
　　[19]Lessmann S，Baesens B，Seow H-V，et al. 2015. Benchmarking state-of-the-art classification algorithms for credit scoring： An update of research[J].European Journal of Operational Research，247（1）.
　　Abstract：Following the mechanism of traditional credit scoring methods，a novel dynamic selective heterogeneous ensemble（DSEH）model suitable to the application of P2P lending is proposed. The model provides a feature selection algorithm，which is able to filter redundant features and handle high-dimension data. The heterogeneous structure and dynamic selection strategy can adaptively adjust the weights of base models and thus，enhance the evaluation capability. UCI credit dataset and real dataset from two P2P lending platforms are used to validate the proposal. The results show that DSHE outperforms other mainstream credit scoring approaches in several measures. The average rank of proposed DSHE is superior to baseline models including logistic regression.
　　Key Words：credit scoring，dynamic selective heterogeneous ensemble model，P2P lending
　　（�任编辑耿欣；校对 LX，GX）