摘要
arXiv:2502.09637v1 交叉领域类型: cross
摘要: 许多最近的研究表明,大规模语言模型(LLMs)倾向于西方和盎格鲁中心的世界观,这在非西方文化背景下限制了它们的实用性。然而,“文化”是一个复杂、多面的主题,且其在LLMs及其基于LLM的应用中的意识、表现和建模可以通过多种方式进行定义和衡量。在本文中,我们提出一个问题:什么是LLM所拥有的“文化意识”?并通过扩展Bender和Koller(2020年)提出的“深海章鱼测试”这一思想实验,我们 argue 说,一个使得LLM及其基于LLM的人工智能系统在各种不同文化背景下(包括完全未曾见过的文化)具有实用性的要求不仅在于文化意识或知识,而是元文化的胜任力。我们阐述了元文化的胜任力人工智能系统的原则,并讨论了如何衡量和建模这些原则。