LLM2D
Home
Arxiv
返回列表
一个关于经验人类-AI对齐的统计性反驳
A Statistical Case Against Empirical Human-AI Alignment
作者:
Julian Rodemann, Esteban Garces Arias, Christoph Luther, Christoph Jansen, Thomas Augustin
发布日期:
5/13/2025
arXiv ID:
oai:arXiv.org:2502.14581v2
摘要
arXiv:2502.14581v2 宣告类型: 代替 摘要:经验性的人工智能对齐旨在使人工智能系统的行为与观察到的人类行为一致。虽然其目标高尚,但我们认为经验性对齐可能会无意中引入统计偏差,这值得我们谨慎对待。因此,这篇立场论文反对简单的经验性对齐,建议采用规范性对齐和后验经验性对齐作为替代方案。我们通过以人类为中心的语言模型解码等具体例子来证明我们的原则性论点。
查看原文
下载 PDF