LLM2D
未来填充:基于卷积序列模型的快速生成
FutureFill: Fast Generation from Convolutional Sequence Models
作者: Naman Agarwal, Xinyi Chen, Evan Dogariu, Vlad Feinberg, Daniel Suo, Peter Bartlett, Elad Hazan
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2410.03766v1

摘要

我们通过引入 FutureFill 来解决序列预测模型中高效的自回归生成问题:一种适用于基于卷积算子的任何序列预测算法的快速生成方法。我们的方法将生成时间需求从与上下文长度线性相关降低到平方根相关。此外,FutureFill 只需要一个由生成令牌数量决定的预填充缓存,这比标准卷积和注意力模型的缓存需求更小。我们通过实验验证了我们的理论发现,证明了在合成生成任务中的正确性和效率提升。