摘要
arXiv:2504.04874v1 交叉公告类型
摘要:将具有已知大小和寿命的一组缓冲区映射到偏移量,以最小化总内存使用量的NP完全组合优化任务称为动态存储分配(DSA)。现有的DSA实现倾向于使用快速但浪费的启发式方法,或者不适用于超过一千个缓冲区的内存高效方法。结合“AI内存墙”以及深度神经网络固定的架构,重新引发了对DSA的兴趣。我们提出了idealloc,一种针对百万缓冲实例设计的低碎片、高性能DSA实现。在针对多个领域中一个新的特别是难以处理的基准集进行评估后,在一种联合有效性和鲁棒性的标准下,idealloc在四种生产实现中排名第一。