LLM2D
迈向安全的多语言前沿人工智能
Towards Safe Multilingual Frontier AI
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.13708v1

摘要

arXiv:2409.13708v1 公告类型: 交叉 摘要: 语言包容性的大型语言模型——无论使用何种语言进行提示,都能保持良好性能——对于全球范围内人工智能利益的普及至关重要。依赖语言翻译来规避安全措施的多语言越狱行为,破坏了人工智能系统的安全性和包容性部署。我们提供了政策建议,以增强人工智能的多语言能力,同时减轻多语言越狱的风险。我们定量评估了语言资源丰富度与模型对多语言越狱的脆弱性之间的关系,涉及五个前沿大型语言模型在24种欧盟官方语言中的表现。基于先前研究,我们提出了与欧盟法律环境和机构框架相一致的政策行动,以应对多语言越狱问题,同时促进语言包容性。这些行动包括强制评估多语言能力和脆弱性、公众意见研究以及国家对多语言人工智能发展的支持。这些措施旨在通过欧盟政策倡议提高人工智能的安全性和功能性,指导欧盟人工智能法案的实施,并为欧洲人工智能办公室的监管努力提供信息。