LLM2D

摘要

arXiv:2504.08775v1 交叉类型公告：摘要：独立训练的大型语言模型（LLM）使用的潜在空间彼此之间有何关系？我们研究了24个开源权重LLM不同层次激活引起的最近邻关系，并发现它们1) 在同一模型的不同层之间变化，且2) 大约在不同模型的相应层之间共享。Claim 2 表明这些最近邻关系并非任意的，因为它们在不同模型之间是共享的，但Claim 1 表明它们也不是“显而易见”的，因为并不存在一个普遍共享的最近邻关系集。这两者共同表明，LLM 从一层到另一层生成了一种激活几何体的演变，但这种整个演变在不同模型之间是大体共享的，并且被拉伸和挤压以适应不同的架构。