摘要
这篇论文对在小型和中型企业(SME)中部署大型语言模型(LLM)的设备端基础设施需求进行了系统的回顾,重点关注硬件和软件方面。从硬件角度来看,我们讨论了GPU和TPU等处理单元的利用、高效的内存和存储解决方案以及有效的部署策略,并解决了SME环境中计算资源有限的挑战。从软件角度来看,我们探讨了框架兼容性、操作系统优化以及针对资源受限环境的专用库的使用。这篇综述首先确定了SME在设备端部署LLM时面临的独特挑战,然后探讨了硬件创新和软件适配为克服这些障碍提供的机遇。这种结构化的综述提供了实际的见解,通过增强SME在集成LLM方面的技术韧性,为社区做出了重大贡献。