sensitive-analysis

! https://zhuanlan.zhihu.com/p/599611644

Duality(KKT example)

敏感性分析

实际问题的数学模型(凸优化)

  1. 模型是否准确
  2. 对模型微调的影响(约束改成$f_i(x)\leq \delta_i$)

约束写成

若$u_i\geq 0$,则约束放松,定义这个问题是干扰问题

  1. 对最优值的影响
  2. 对最优解的影响

定义干扰问题的最优解是$p^*(u,w)$,显然

性质:若原问题为凸,则干扰问题最优解$p^*(u,w)$是$(u,w)$的凸函数

定义$g(x,u,w)$,实际上是在一个可行解集合中最小值,这里$g$的定义域包含$(x,u,w)$

下面证明$g(x,u,w)$是关于$(x,u,w)$的凸函数

$dom g$定义在凸集上

$dom f_0$是凸集,$(u,w)$定义在$\R^{m+p}$的全集上,同时对于不等式约束

显然关于$(x,u_i)$是凸函数(左侧是凸函数+仿射函数)

同理$h_i(x) - w_i =0$也是关于$(x,w_i)$的凸集,因此D是凸集,同时$f_0(x)$是凸函数,Q.E.D

因此函数簇的极小

也是凸函数

,v^,v^,v^,v^,v^,v^,v^,v^$为原问题对偶最优解,一定有

设$\hat x$为干扰问题最优解,一定是干扰问题可行解,满足约束

对偶间隙为0,满足

根据可行解的性质

对偶间隙为0,可知

因此

Q.E.D

因此得到干扰问题最优解的下界

下界下界界**

推论

  1. $很大,且加紧第i项不等式约束 $u_i<0\to p^_i<0\to p^*(u,w)$会急剧增大(第i项不等式导致解不鲁棒)影子价格较大的材料
  2. _i>0$很大且$w_i<0$/$v_i^i^*<0$很小且$w_i>0$ 第i项等式约束导致最优值不鲁棒
  3. $\lambda^*_i$很小且$u_i>0$,则提高$u_i$导致下界改变不多
  4. >0$很小且$w_i>0$/$v_i^v_i^*<0$且绝对值很小且$w_i<0$吗,则等式约束对最优值鲁棒

注意不等式仅仅提供下界,下界增大的情况下容易分析,下界降低则不能得到任何结论

如何得到干扰问题最优解的intense bound?

性质(局部敏感性):若原问题为凸问题,对偶间隙为0,并且$p^*(u,w)$在(0,0)处可微,得到

注意这里实际上有两对变量(分别对应对偶变量和约束的扰动)

  1. $\lambda_i$和$u_i$和不等式约束有关
  2. $v_i$和$w_i$和等式约束有关

对$p^*(u,w)$在0,0处做泰勒展开

这样在一个局部可以得到$p^*(u,w)$的近似

Boolen LP问题

原问题(P)

显然非凸问题,给出松弛(Q)

两个问题的最优值显然有

某个$x_i$很接近0或者1,将其松弛为0-1,求解n-1维boolen LP

Boolen LP等价问题

等式约束不是仿射,因此不是凸问题,写出Lagrange函数

  1. $\exist v_i<0,g(\lambda,v) =-\infty$
  2. $\forall v_i >0,g(\lambda,v) =-\lambda^T b -\frac{1}{4}\sum_{i=1}^n\frac {(c_i + a_i^T \lambda - u_i)^2}{v_i}$

对偶问题

这里用到一条性质(为了求解$\max_{\lambda,v}g(\lambda,v)$)

优化目标写成

对v的优化等价为

微分

最大值是

得到

写成

等价问题是

$\max$将会保证$w_i$取到$0,c_i+a_i^T \lambda$中较小的那一个而不是更小

变成线性规划,这是LP bool的对偶问题的等价问题,现在求解对偶问题松弛问题的对偶问题,松弛问题有三个约束

因此需要引入三组对偶变量$u(Ax =b),w(x_i\leq 1),v(-x_i\leq 0)$

改写约束,等价为(消除$v\geq 0$)

对比两个问题

Boolen LP对偶问题 Boolen LP松弛形式的对偶问题
目标函数 $\max_\lambda -\lambda^T b + 1^T w$ $\max_u -b^T u -1^T w$
约束 $\lambda\geq 0,w_i\leq 0,w_i \leq c_i+a_i^T \lambda$ $c+A^T u +w \geq 0,u\geq 0,w\geq 0$

两个问题的对偶问题相同,它的原问题不一定相同。。

这里Boolen LP等价问题非凸,导致一系列这个结果,实际上

Boolen LP等价问题的对偶问题是原问题的松弛,松弛效果等价于离散空间松弛到区间,这个对偶称为拉格朗日松弛

对偶问题只是给定了原问题最优解的下界,原问题可能没有这么优

对偶问题必然是等价问题的松弛,当对偶间隙不为0时,必然不能通过解对偶问题得到等价问题的解。另一个重要的结论是

LP松弛和拉格朗日松弛互为对偶

带等式约束的可微凸优化问题

惩罚惩罚惩罚惩罚惩罚惩罚**,显然$\alpha =\infty$等价为原问题

选择$\alpha$并不断增大,得到一组解

假设求出无约束优化的最优解$\hat x(\alpha)$,讨论它和原始问题最优解的关系,$\hat x(\alpha)$显然是让$f_0(x)+\frac{\alpha}{2}\parallel Ax -b\parallel$一阶偏导为0

这个问题(无约束带惩罚项优化问题)和下列问题等价

因为(37)微分和(36)相同,注意$x\to \hat x(\alpha)$

现在考虑原问题和对偶问题

令$v=\alpha (A\hat x(\alpha)-b)$,此时

等价于问题(37),已知原问题和

对偶

惩罚函数方法得到的最优解$\hat x(\alpha)$等价于$v = \alpha(A\hat x(\alpha ) -b)$时对拉格朗日函数优化

何时满足

这个问题对偶间距为0,最优满足$\alpha \to \infty$并且$A\hat x(\alpha) -b \to 0$,对偶间隙为0只需要满足$Ax =b$有解存在

考虑

因此$g(v = \alpha(A\hat x(\alpha) -b))$实际上是惩罚后的目标函数在$\hat x(\alpha)$处的取值

并且根据对偶间隙为0得到

因此有

使用惩罚函数得到的目标函数必然比最优值小(比最优还要优)。本质上是因为存在对偶问题

$\alpha = 0$则求解的是无约束的

这是原问题的很大松弛,增加惩罚项也是问题的松弛

$仍然有限,并且$p^$仍然有限,并且$p^\geq d^\geq d^$,$d^*$被bound住,必然找到最优解$A\hat x(\alpha ) = b$

有约束的优化问题可以松弛为无约束的优化问题

$Ax = b$约束解在超平面上,惩罚函数希望解尽量不要偏移超平面

本节讨论了对于仅包含等式约束的一类优化问题的求解,基本思路是在目标函数中添加一项使得它变成无约束优化的凸问题,并且从对偶问题角度讨论了惩罚因子和对偶变量的关系

带线性不等式的可微凸优化问题

log-barrier方法,增添log惩罚项

定义在

同时希望$a_i^T x -b _i $尽量大于0,这是优化目标$\min$所保证的(尽量满足约束)

  1. $u_i = 0$,问题和原问题相同,但是影响计算稳定性

从Primal Dual考虑log-barrier和原问题最优解的关系,假设$\hat x$是log-barrier最优解并且$u_i = u$

同时$\hat x$也是如下无约束优化问题的最优解(对$L(x,\lambda_i = \frac{u}{a_i^T\hat x-b_i})$x求微分结果相同)

因为$f_{\hat x}(x)$的微分和log-barrier相同

并且满足$\lambda_i>0$,是有效的对偶变量

原问题的对偶问题

不等式约束需要保证对偶变量大于0,这里因为带惩罚项的无约束原问题必须要满足$a_i^T x -b_i>0$,则必然满足

log约束保证解严格落在约束空间的内点,实际上添加了更严格的约束(内点法)

  1. 有约束的原问题,在此基础上添加惩罚
  2. 惩罚因子不同对应最优解不同
  3. 对偶函数中不同对偶变量和惩罚因子之间一一对应
本站访客数人次