LLM2D

摘要

arXiv:2504.02058v1 宣布类型: 新摘要: 确保通用人工智能（AGI）的安全发展往往依赖于基于公理形式化、可解释性和经验验证的共识对齐方法。然而，这些方法可能在结构上无法识别或整合那些超出其接受的认知框架的新颖解决方案。本文引入了一种认知闭合的功能性模型，在这种模型中，认知、机构、社会和基础设施过滤器结合在一起，使许多对齐提案对现有的评估系统变得难以理解。我们提出了一种既基于理论又基于经验的支持闭合模型，包括由AI系统进行的元分析，该分析是关于一个去中心化集体智能（DCI）框架的拒绝和非介入模式的模式。我们arg认为，反复未能评估类似DCI的模型不仅仅是一个社会学疏忽，而是一个结构吸引子，与我们试图避免的AGI失准风险相呼应。如果没有采纳DCI或其他类似的递归的认知矫正模型，我们可能正走在一条不可避免地走向不可逆失准的道路上。本文的发展和接受，首先通过模拟评审，然后通过正式渠道进行，提供了一个案例研究，支持其核心论点：认知闭合只能通过递归建模其所依赖的约束来克服。