discounted-mpc-robust-control

name: discounted-mpc-robust-control description: "Discounted Model Predictive Control (MPC) and infinite-horizon optimal control under plant-model mismatch. Unified framework for stability and suboptimality analysis with robustness guarantees. Use for: robust MPC, plant-model mismatch handling, discounted optimal control, stability analysis, surrogate model control. Activation: discounted MPC, plant-model mismatch, robust MPC, infinite-horizon control, suboptimality analysis."

Discounted MPC Robust Control

基于论文 "Discounted MPC and infinite-horizon optimal control under plant-model mismatch: Stability and suboptimality" (arXiv:2604.08521v1, 2026) 的鲁棒控制方法论。

核心贡献

该论文提出了一个统一的框架，用于分析在模型-植物不匹配情况下折扣MPC和无限时域最优控制的闭环稳定性和次优性。

主要创新点

统一分析框架: 基于二次成本分析有限和无限时域问题，涵盖折扣和非折扣场景
鲁棒性保证: 在状态和控制的植物-模型不匹配边界比例假设下，保证原点的指数稳定性
次优性界限: 提供闭环成本的次优性界限，恢复替代模型的最优成本
权衡关系: 揭示时域长度、折扣和植物-模型不匹配之间的权衡关系

理论基础

问题设置

考虑离散时间非线性系统:

x_{k+1} = f(x_k, u_k)  # 真实植物

使用替代模型进行预测:

x_{k+1} = f_hat(x_k, u_k)  # 替代模型

植物-模型不匹配假设

假设存在常数 ε_f, ε_V 使得:

||f(x,u) - f_hat(x,u)|| ≤ ε_f * ||(x,u)||

折扣成本函数

J_N(x, u) = Σ_{k=0}^{N-1} γ^k * l(x_k, u_k) + γ^N * V_f(x_N)

其中 γ ∈ (0,1] 是折扣因子

稳定性保证

定理1: 指数稳定性

在以下条件下:

成本可控性 (cost-controllability)
模型连续性
终端成本V_f是控制李雅普诺夫函数

闭环系统在原点是指数稳定的。

鲁棒性特性

鲁棒性保证在时域长度上是均匀的，意味着:

更大的时域不需要连续更小的植物-模型不匹配
稳定性裕度与时域长度无关

次优性分析

性能界限

闭环成本 J_cl 满足:

J_cl ≤ J_opt + Δ

其中:

J_opt 是替代模型的最优成本
Δ 是与植物-模型不匹配相关的附加项

折扣因子的影响

折扣因子 γ 影响:

稳定性区域大小
次优性界限的紧致性
对模型不匹配的敏感度

实际应用

场景1: 基于学习的MPC

当使用神经网络学习系统动力学时:

# 学习得到的替代模型
f_hat = learned_dynamics(x, u)

# 应用折扣MPC
mpc = DiscountedMPC(
    model=f_hat,
    discount=0.95,
    horizon=N,
    mismatch_bound=ε_f
)

场景2: 自适应控制

在系统参数变化时:

# 在线模型更新
f_hat = update_model(estimates)

# 保持稳定性保证
mpc.update_model(f_hat, mismatch_bound=new_bound)

场景3: 多速率控制

当模型在不同时间尺度上运行时:

# 慢速模型更新
f_hat_slow = slow_update(x, u)

# 快速MPC执行
mpc = DiscountedMPC(
    model=f_hat_slow,
    discount=0.9,  # 较低折扣适应模型老化
    horizon=N_fast
)

设计指南

参数选择

折扣因子 γ:
- 接近1: 长期性能优先，对不匹配更敏感
- 较小: 短期性能优先，更鲁棒
- 推荐: 0.9-0.99
时域长度 N:
- 与稳定性保证无关
- 影响计算复杂度
- 根据实时约束选择
植物-模型不匹配界限:
- 通过系统辨识或学习误差估计
- 保守估计保证稳定性

实现注意事项

终端成本设计: 确保V_f是控制李雅普诺夫函数
约束处理: 考虑不匹配对约束满足的影响
实时性: 折扣降低了对长时域的需求

与其他方法比较

方法	鲁棒性	计算复杂度	适用场景
标准MPC	低	中	精确模型
Tube MPC	高	高	有界不确定性
折扣MPC	中	中	模型不匹配
鲁棒MPC	高	高	最坏情况保证

激活关键词

discounted MPC
plant-model mismatch
robust MPC
infinite-horizon control
suboptimality analysis
surrogate model control
折扣MPC
模型不匹配
鲁棒控制

参考文献

Moldenhauer, R.H., Worthmann, K., Postoyan, R., Nešić, D., & Granzotto, M. (2026). Discounted MPC and infinite-horizon optimal control under plant-model mismatch: Stability and suboptimality. arXiv:2604.08521v1.