LLM2D

摘要

arXiv:2502.09637v1 交叉领域类型: cross 摘要: 许多最近的研究表明，大规模语言模型（LLMs）倾向于西方和盎格鲁中心的世界观，这在非西方文化背景下限制了它们的实用性。然而，“文化”是一个复杂、多面的主题，且其在LLMs及其基于LLM的应用中的意识、表现和建模可以通过多种方式进行定义和衡量。在本文中，我们提出一个问题：什么是LLM所拥有的“文化意识”？并通过扩展Bender和Koller（2020年）提出的“深海章鱼测试”这一思想实验，我们 argue 说，一个使得LLM及其基于LLM的人工智能系统在各种不同文化背景下（包括完全未曾见过的文化）具有实用性的要求不仅在于文化意识或知识，而是元文化的胜任力。我们阐述了元文化的胜任力人工智能系统的原则，并讨论了如何衡量和建模这些原则。