LLM2D

摘要

arXiv:2505.07460v1 宣布类型: 新摘要: 大型语言模型（LLMs）提供了强大的人工智能能力，但由于高资源成本和延迟问题的部署挑战，而小型语言模型（SLMs）则以效率和部署性为代价，牺牲了性能。LLM和SLM之间的合作作为一种关键的范式，能够协同平衡这些权衡，使高级人工智能应用成为可能，特别适用于资源受限的边缘设备。本文综述了LLM-SLM合作，详细介绍了各种交互机制（流水线、路由、辅助、知识蒸馏、融合）、关键使能技术以及由设备需求驱动的多样化应用场景，如低延迟、隐私、个性化和离线操作。尽管强调了创建更高效、可适应和可访问的人工智能的巨大潜力，但我们也讨论了持续存在的挑战，包括系统开销、跨模型一致性、稳健的任务分配、评估复杂性以及安全/隐私问题。未来方向包括更智能的自适应框架、更深的模型融合，并扩展到多模态和具有体现的人工智能，将LLM-SLM合作定位为下一代实用和普及的人工智能的关键驱动力。