LLM2D

摘要

arXiv:2505.00268v1 交叉领域公告类型：跨领域摘要：语言使用有效性的标志在于一致性——在类似的情境中表达相似的意义，并避免矛盾。虽然人类交流自然地体现了这一原则，但最先进的语言模型在不同场景下保持可靠的一致性方面仍然面临挑战。本文探讨了人工智能语言系统中一致性研究的景观，探讨了一致性的正式方面（包括逻辑规则遵守）和非正式方面（如道德和事实的一致性）。我们分析了当前衡量一致性各方面的方法，指出了标准化定义、多语言评估和提高一致性的方法中的关键研究缺口。我们的研究结果表明，需要建立稳健的基准来衡量一致性，并采用跨学科的方法来确保在特定领域的任务中应用语言模型时的一致性，同时保持其实用性和适应性。