LLM2D

摘要

arXiv:2505.01081v1 宣布类型: 新闻摘要: 人工智能（AI）在专项任务中取得了显著的成功，但在高效技能获取和泛化方面仍存在问题。最小描述长度（Minimum Description Length，MDL）基准测试（Abstraction and Reasoning Corpus，ARC）评估智能基于最小的训练需求。尽管大型语言模型（LLMs）最近已经提高了ARC的表现，但它们依赖大量的预训练和高昂的计算成本。我们引入了MADIL（基于MDL的AI），这是一种利用MDL原则进行高效归纳学习的新方法。MADIL进行基于模式的分解，使得结构化的泛化成为可能。虽然其性能（在2024年ArcPrize中为7%）仍低于基于LLM的方法，但它提供了更高的效率和可解释性。本文详细介绍了MADIL的方法论，其在ARC的应用，以及实验评估。