LLM2D
模拟内存计算注意力机制,用于快速节能的大型语言模型
Analog In-Memory Computing Attention Mechanism for Fast and Energy-Efficient Large Language Models
作者: Nathan Leroux, Paul-Philipp Manea, Chirag Sudarshan, Jan Finkbeiner, Sebastian Siegel, John Paul Strachan, Emre Neftci
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19315v1

摘要

基于增益单元内存的模拟内存计算用于加速大型语言模型中的自注意力机制。