LLM2D

摘要

arXiv:2406.06773v2 宣告类型: replace-cross 摘要：本研究评估了在长上下文情况下零-shot 压缩技术对大型语言模型（LLMs）的有效性。我们发现，在使用某些压缩方法时，随着上下文长度的增加，计算错误有增加的趋势。我们提出了一种假设来解释不同 LLM 压缩技术的多样化行为，并探索减轻某些技术在长上下文下性能下降的补救措施。这是普林斯顿大学李恺教授的 COS 598D 机器学习与系统课程的课程报告。由于计算资源有限，我们的实验仅在 LLaMA-2-7B-32K 上进行。