摘要
arXiv:2505.02347v1 Announce Type: 交叉
摘要:离散时间线性动态系统,包括马尔可夫链,在许多应用中得到了广泛应用。然而,在某些问题中,系统运行的时间范围存在不确定性。这使得当系统停止时,基于状态分布所产生的成本(或奖励)存在不确定性。给定系统的运行时间的历史数据样本,我们提出在Wasserstein不确定性集合中从理论上分析分布鲁棒成本估计任务,而不是从少量样本中学习概率分布。为此,我们展示了在概率单纯形上的离散时间马尔可夫链与全局渐近稳定(GAS)离散时间线性动态系统的等价性,使得我们的研究仅基于GAS系统。然后,我们为我们的理论研究提供了不同情况下的多项式时间算法和 hardness 结果,包括基于Wasserstein距离的多面体的基本结果。