LLM2D
MADIL:一种基于MDL的ARC基准程序合成高效框架
MADIL: An MDL-based Framework for Efficient Program Synthesis in the ARC Benchmark
作者: S\'ebastien Ferr\'e
发布日期: 5/5/2025
arXiv ID: oai:arXiv.org:2505.01081v1

摘要

arXiv:2505.01081v1 宣布类型: 新闻 摘要: 人工智能(AI)在专项任务中取得了显著的成功,但在高效技能获取和泛化方面仍存在问题。最小描述长度(Minimum Description Length,MDL)基准测试(Abstraction and Reasoning Corpus,ARC)评估智能基于最小的训练需求。尽管大型语言模型(LLMs)最近已经提高了ARC的表现,但它们依赖大量的预训练和高昂的计算成本。我们引入了MADIL(基于MDL的AI),这是一种利用MDL原则进行高效归纳学习的新方法。MADIL进行基于模式的分解,使得结构化的泛化成为可能。虽然其性能(在2024年ArcPrize中为7%)仍低于基于LLM的方法,但它提供了更高的效率和可解释性。本文详细介绍了MADIL的方法论,其在ARC的应用,以及实验评估。