LLM2D

摘要

arXiv:2502.14581v2 宣告类型: 代替摘要：经验性的人工智能对齐旨在使人工智能系统的行为与观察到的人类行为一致。虽然其目标高尚，但我们认为经验性对齐可能会无意中引入统计偏差，这值得我们谨慎对待。因此，这篇立场论文反对简单的经验性对齐，建议采用规范性对齐和后验经验性对齐作为替代方案。我们通过以人类为中心的语言模型解码等具体例子来证明我们的原则性论点。