LLM2D

摘要

arXiv:2501.16961v2 宣告类型: 替换摘要：推理的鲁棒性仍然是大型语言模型面临的一个重大挑战，解决这一问题对于AI驱动的推理系统在实际应用中的可行性至关重要。我们引入了语义自我验证（SSV）这一新颖的方法，以解决将语言模型与逻辑求解器的严谨性相结合的关键挑战：准确地将自然语言中的推理问题转化为求解器的形式语言。SSV 使用基于一致性的方法，通过模型生成的具体实例并由求解器验证，生成强大的抽象形式化问题。除了在总体推理准确性上显著超越现有最佳水平之外，这种方法的一个关键创新之处在于，我们在开放推理基准上展示了其在大量情况下具有近乎完美的精确验证能力。我们提出这种“近乎确定的推理”作为减少许多情况下手动验证需求的新方法，使我们更接近于更可靠和自主的AI推理系统。