LLM2D

模拟内存计算注意力机制，用于快速节能的大型语言模型

Analog In-Memory Computing Attention Mechanism for Fast and Energy-Efficient Large Language Models

作者: Nathan Leroux, Paul-Philipp Manea, Chirag Sudarshan, Jan Finkbeiner, Sebastian Siegel, John Paul Strachan, Emre Neftci

发布日期: 10/1/2024

arXiv ID: oai:arXiv.org:2409.19315v1

基于增益单元内存的模拟内存计算用于加速大型语言模型中的自注意力机制。