摘要
arXiv:2505.01081v1 宣布类型: 新闻
摘要: 人工智能(AI)在专项任务中取得了显著的成功,但在高效技能获取和泛化方面仍存在问题。最小描述长度(Minimum Description Length,MDL)基准测试(Abstraction and Reasoning Corpus,ARC)评估智能基于最小的训练需求。尽管大型语言模型(LLMs)最近已经提高了ARC的表现,但它们依赖大量的预训练和高昂的计算成本。我们引入了MADIL(基于MDL的AI),这是一种利用MDL原则进行高效归纳学习的新方法。MADIL进行基于模式的分解,使得结构化的泛化成为可能。虽然其性能(在2024年ArcPrize中为7%)仍低于基于LLM的方法,但它提供了更高的效率和可解释性。本文详细介绍了MADIL的方法论,其在ARC的应用,以及实验评估。