LLM2D

摘要

arXiv:2502.12210v1 宣传类型: cross 摘要: 近年来，自然语言处理的最新进展显著提高了从非结构化文本中提取结构化语义表示的能力，特别是在框架语义角色标注（FSRL）方面。尽管取得了这些进展，但对于框架检测而言，检索增强生成（RAG）模型的潜力仍然未被充分探索。在本文中，我们提出了第一个基于RAG的框架检测方法，称为RCIF（检索候选并识别框架）。RCIF也是第一个无需显式目标跨度的方法，包括三个主要阶段：（1）从各种表示生成框架嵌入；（2）给定输入文本检索候选框架；以及（3）识别最合适的框架。我们在多种配置下进行了广泛的实验，包括零样本、少量样本和微调设置。我们的结果显示，我们的检索组件通过缩小搜索空间显著减少了任务的复杂性，从而使框架识别器能够细化和完善候选集。我们的方法在FrameNet 1.5和1.7上达到了最先进的性能，证明了它在仅提供原始文本的情况下具有稳健性。此外，我们利用通过此方法获得的结构化表示作为代理，增强了在将自然语言问题翻译成SPARQL查询任务中的泛化能力。