LLM2D

摘要

arXiv:2505.07853v1 交叉类型：公告摘要：全球每年因道路事故伤亡人数超过130万，并导致超过1.8万亿美元的全球经济损失。这种深远的社会和经济影响强调了揭示事故机制和提供实用见解的道路安全研究的迫切需求。传统的统计模型和树型集成方法通常依赖于结构化的事故数据，忽视了上下文的细微差别，并难以捕捉到复杂的联系和内在语义。此外，这些方法往往会大量信息损失，特别是在涉及多车互动、事故进展和罕见事件特征的叙述性元素方面。本研究提出了CrashSage，这是一种以大型语言模型（LLM）为中心的新框架，旨在通过四项创新来推动事故分析和建模。首先，我们引入了一种表格到文本的转换策略，结合了关系数据集成方案，使原始异构事故数据能够转化为富含结构和关系上下文的丰富结构化文本叙述。其次，我们使用基于LLM的基础模型进行上下文感知的数据增强，以提高叙述的一致性，同时保持事实的完整性。第三，我们对LLaMA3-8B模型进行微调，用于事故严重程度推断，展示了在基线方法（包括零样本、带有思考链提示的零样本和少量样本学习）以及多个模型（GPT-4o、GPT-4o-mini、LLaMA3-70B）相对于其表现上的优越性。最后，我们采用基于梯度的可解释性技术来阐明模型在单个事故水平和更广泛的危险因素维度上的决策。这种解释机制增强了透明度，通过提供对最具影响力的因素的深入见解，使针对道路安全干预措施更具针对性。