LLM2D
从预测重要性到因果关系:哪种机器学习模型反映了现实?
From Predictive Importance to Causality: Which Machine Learning Model Reflects Reality?
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2409.02130v2

摘要

本研究使用 CatBoost 和 LightGBM 模型分析艾姆斯房价数据集,以探索房价预测中的特征重要性和因果关系。我们研究了 SHAP 值与 EconML 预测之间的相关性,并在价格预测方面取得了高准确率。我们的分析表明,基于 SHAP 的特征重要性和因果显著特征之间存在 0.48 的中等斯皮尔曼等级相关性,突出了在房地产市场分析中将预测建模与因果理解相一致的复杂性。通过广泛的因果分析,包括异质性探索和策略树解释,我们深入了解了诸如门廊等特定特征如何在各种情况下影响房价。这项工作强调了在房地产估值中结合预测能力和因果洞察力的综合方法的必要性,为行业利益相关者提供了宝贵的指导。