LLM2D

摘要

arXiv:2504.11511v1 宣告类型: cross 摘要：强化学习（RL）在关键现实世界应用中的崛起要求对人工智能系统中的隐私进行根本性的重新思考。传统的隐私框架旨在保护孤立的数据点，但针对那些从时间模式、行为策略和协作动态中产生敏感信息的顺序决策系统来说，它们做得并不够。现代的RL范式，如联邦强化学习（FedRL）和在大型语言模型（LLMs）中的带有人类反馈的RL（RLHF），通过引入复杂的、互动的和情境依赖的学习环境，使这些问题更加严峻，而传统的方法未能解决这些问题。在本文中，我们认为需要建立一个新的隐私范式，基于四个核心原则：多层次保护、行为模式保护、协作隐私保留和情境感知适应。这些原则揭示了隐私、效用和可解释性之间的内在紧张关系，这些必须在强化学习系统越来越多地应用于高风险领域（如医疗保健、自主车辆和由LLMs驱动的决策支持系统）时进行导航。为了应对这些挑战，我们呼吁开发新的理论框架、实际机制和严谨的评估方法，这些方法共同促进对顺序决策系统中的有效隐私保护。