LLM2D

摘要

arXiv:2502.10552v1 宣布类型：交叉摘要：在这项工作中，我们调查了动态信息释放机制，即所谓的“掩码”，以最小化随机系统向外部观察者的信息泄漏。具体来说，对于一个随机系统，观察者旨在推断系统轨迹的最终状态是否属于一组秘密状态。动态掩码寻求调节传感器信息，以最大化观察者对最终状态的不确定性，这一特性称为最终状态不透明性。尽管现有动态掩码的监督控制文献主要侧重于定性不透明性，但我们提出通过条件熵来量化随机系统中的不透明性，因为条件熵是信息安全中的信息泄漏度量。然后，我们制定了一种约束优化问题，以在总遮蔽成本约束下合成最大化最终状态不透明性的动态掩码。为解决这一约束最优动态掩码合成问题，我们开发了一种新颖的原始对偶策略梯度方法。此外，我们提出了一种技术，通过利用隐藏马尔可夫模型中的可观测算子来计算策略参数对条件熵梯度。为了证明我们方法的有效性，我们将我们的方法应用于示例性场景和随机网格世界场景，展示了如何在成本约束下通过算法最优地实施最终状态不透明性。