LLM2D

摘要

arXiv:2401.16458v3 公告类型：替换交叉摘要：点对点（P2P）借贷通过在线平台将借款人和贷款人连接起来，但存在显著的信息不对称问题，因为贷款人往往缺乏足够的数据来评估借款人的信用状况。本文通过利用BERT，一种以其捕捉文本中语境细微差别能力而闻名的大语言模型（LLM），来生成基于借款人贷款描述的风险评分，解决了这一挑战。我们使用来自Lending Club平台的数据集对BERT进行了微调，以区分违约和未违约贷款。生成的BERT风险评分随后作为额外特征集成到用于贷款批准阶段的XGBoost分类器中，决策者在该阶段的信息有限，难以指导其决策。这种集成提高了预测性能，平衡准确率和AUC均有所改善，突显了文本特征在补充传统输入方面的重要性。此外，我们发现加入BERT评分改变了分类模型对传统输入变量的利用方式，这些变化因贷款用途而异。这些发现表明，BERT在贷款描述中识别出了具有意义的模式，涵盖了借款人特定特征、具体用途和语言属性。然而，LLMs的固有不透明性和潜在偏见强调了需要透明框架以确保符合监管要求并培养信任。总体而言，本研究表明LLM衍生见解与传统特征在信用风险建模中的交互方式，开启了增强这些模型可解释性和公平性的新路径。