sensitive-analysis
! https://zhuanlan.zhihu.com/p/599611644
Duality(KKT example)
敏感性分析
实际问题的数学模型(凸优化)
- 模型是否准确
- 对模型微调的影响(约束改成$f_i(x)\leq \delta_i$)
约束写成
若$u_i\geq 0$,则约束放松,定义这个问题是干扰问题
- 对最优值的影响
- 对最优解的影响
定义干扰问题的最优解是$p^*(u,w)$,显然
性质:若原问题为凸,则干扰问题最优解$p^*(u,w)$是$(u,w)$的凸函数
定义$g(x,u,w)$,实际上是在一个可行解集合中最小值,这里$g$的定义域包含$(x,u,w)$
下面证明$g(x,u,w)$是关于$(x,u,w)$的凸函数
$dom g$定义在凸集上
$dom f_0$是凸集,$(u,w)$定义在$\R^{m+p}$的全集上,同时对于不等式约束
显然关于$(x,u_i)$是凸函数(左侧是凸函数+仿射函数)
同理$h_i(x) - w_i =0$也是关于$(x,w_i)$的凸集,因此D是凸集,同时$f_0(x)$是凸函数,Q.E.D
因此函数簇的极小
也是凸函数
,v^,v^,v^,v^,v^,v^,v^,v^$为原问题对偶最优解,一定有
设$\hat x$为干扰问题最优解,一定是干扰问题可行解,满足约束
对偶间隙为0,满足
根据可行解的性质
对偶间隙为0,可知
因此
Q.E.D
因此得到干扰问题最优解的下界
下界下界界**
推论
- $很大,且加紧第i项不等式约束 $u_i<0\to p^_i<0\to p^*(u,w)$会急剧增大(第i项不等式导致解不鲁棒)影子价格较大的材料
- _i>0$很大且$w_i<0$/$v_i^i^*<0$很小且$w_i>0$ 第i项等式约束导致最优值不鲁棒
- $\lambda^*_i$很小且$u_i>0$,则提高$u_i$导致下界改变不多
- >0$很小且$w_i>0$/$v_i^v_i^*<0$且绝对值很小且$w_i<0$吗,则等式约束对最优值鲁棒
注意不等式仅仅提供下界,下界增大的情况下容易分析,下界降低则不能得到任何结论
如何得到干扰问题最优解的intense bound?
性质(局部敏感性):若原问题为凸问题,对偶间隙为0,并且$p^*(u,w)$在(0,0)处可微,得到
注意这里实际上有两对变量(分别对应对偶变量和约束的扰动)
- $\lambda_i$和$u_i$和不等式约束有关
- $v_i$和$w_i$和等式约束有关
对$p^*(u,w)$在0,0处做泰勒展开
这样在一个局部可以得到$p^*(u,w)$的近似
Boolen LP问题
原问题(P)
显然非凸问题,给出松弛(Q)
两个问题的最优值显然有
某个$x_i$很接近0或者1,将其松弛为0-1,求解n-1维boolen LP
Boolen LP等价问题
等式约束不是仿射,因此不是凸问题,写出Lagrange函数
- $\exist v_i<0,g(\lambda,v) =-\infty$
- $\forall v_i >0,g(\lambda,v) =-\lambda^T b -\frac{1}{4}\sum_{i=1}^n\frac {(c_i + a_i^T \lambda - u_i)^2}{v_i}$
记
对偶问题
这里用到一条性质(为了求解$\max_{\lambda,v}g(\lambda,v)$)
优化目标写成
对v的优化等价为
微分
最大值是
得到
写成
记
等价问题是
$\max$将会保证$w_i$取到$0,c_i+a_i^T \lambda$中较小的那一个而不是更小
变成线性规划,这是LP bool的对偶问题的等价问题,现在求解对偶问题松弛问题的对偶问题,松弛问题有三个约束
因此需要引入三组对偶变量$u(Ax =b),w(x_i\leq 1),v(-x_i\leq 0)$
改写约束,等价为(消除$v\geq 0$)
对比两个问题
Boolen LP对偶问题 | Boolen LP松弛形式的对偶问题 | |
---|---|---|
目标函数 | $\max_\lambda -\lambda^T b + 1^T w$ | $\max_u -b^T u -1^T w$ |
约束 | $\lambda\geq 0,w_i\leq 0,w_i \leq c_i+a_i^T \lambda$ | $c+A^T u +w \geq 0,u\geq 0,w\geq 0$ |
两个问题的对偶问题相同,它的原问题不一定相同。。
这里Boolen LP等价问题非凸,导致一系列这个结果,实际上
Boolen LP等价问题的对偶问题是原问题的松弛,松弛效果等价于离散空间松弛到区间,这个对偶称为拉格朗日松弛
对偶问题只是给定了原问题最优解的下界,原问题可能没有这么优
对偶问题必然是等价问题的松弛,当对偶间隙不为0时,必然不能通过解对偶问题得到等价问题的解。另一个重要的结论是
LP松弛和拉格朗日松弛互为对偶
带等式约束的可微凸优化问题
惩罚惩罚惩罚惩罚惩罚惩罚**,显然$\alpha =\infty$等价为原问题
选择$\alpha$并不断增大,得到一组解
假设求出无约束优化的最优解$\hat x(\alpha)$,讨论它和原始问题最优解的关系,$\hat x(\alpha)$显然是让$f_0(x)+\frac{\alpha}{2}\parallel Ax -b\parallel$一阶偏导为0
这个问题(无约束带惩罚项优化问题)和下列问题等价
因为(37)微分和(36)相同,注意$x\to \hat x(\alpha)$
现在考虑原问题和对偶问题
令$v=\alpha (A\hat x(\alpha)-b)$,此时
等价于问题(37),已知原问题和
对偶
惩罚函数方法得到的最优解$\hat x(\alpha)$等价于$v = \alpha(A\hat x(\alpha ) -b)$时对拉格朗日函数优化
何时满足
这个问题对偶间距为0,最优满足$\alpha \to \infty$并且$A\hat x(\alpha) -b \to 0$,对偶间隙为0只需要满足$Ax =b$有解存在
考虑
因此$g(v = \alpha(A\hat x(\alpha) -b))$实际上是惩罚后的目标函数在$\hat x(\alpha)$处的取值
并且根据对偶间隙为0得到
因此有
使用惩罚函数得到的目标函数必然比最优值小(比最优还要优)。本质上是因为存在对偶问题
$\alpha = 0$则求解的是无约束的
这是原问题的很大松弛,增加惩罚项也是问题的松弛
$仍然有限,并且$p^$仍然有限,并且$p^\geq d^\geq d^$,$d^*$被bound住,必然找到最优解$A\hat x(\alpha ) = b$
有约束的优化问题可以松弛为无约束的优化问题
$Ax = b$约束解在超平面上,惩罚函数希望解尽量不要偏移超平面
本节讨论了对于仅包含等式约束的一类优化问题的求解,基本思路是在目标函数中添加一项使得它变成无约束优化的凸问题,并且从对偶问题角度讨论了惩罚因子和对偶变量的关系
带线性不等式的可微凸优化问题
log-barrier方法,增添log惩罚项
定义在
同时希望$a_i^T x -b _i $尽量大于0,这是优化目标$\min$所保证的(尽量满足约束)
- $u_i = 0$,问题和原问题相同,但是影响计算稳定性
从Primal Dual考虑log-barrier和原问题最优解的关系,假设$\hat x$是log-barrier最优解并且$u_i = u$
同时$\hat x$也是如下无约束优化问题的最优解(对$L(x,\lambda_i = \frac{u}{a_i^T\hat x-b_i})$x求微分结果相同)
因为$f_{\hat x}(x)$的微分和log-barrier相同
并且满足$\lambda_i>0$,是有效的对偶变量
原问题的对偶问题
令
则
不等式约束需要保证对偶变量大于0,这里因为带惩罚项的无约束原问题必须要满足$a_i^T x -b_i>0$,则必然满足
log约束保证解严格落在约束空间的内点,实际上添加了更严格的约束(内点法)
- 有约束的原问题,在此基础上添加惩罚
- 惩罚因子不同对应最优解不同
- 对偶函数中不同对偶变量和惩罚因子之间一一对应