Duaility
Duality
概念和定义
拉格朗日函数
对于带约束优化问题(可能非凸)
目标函数最优值为$p^*$
定义Lagrange Function,定义为
关于$\lambda,v$是线性函数
拉格朗日对偶函数
已知拉格朗日函数,定义对偶函数
D是问题的域,定义在所有函数的dom交集中
- $\lambda$和不等式相关的拉格朗日乘子
- $\mu$和等式相关的拉格朗日乘子
性质(与原问题无关,一定成立)
对偶函数一定是凹函数
$\forall \lambda_1,v_1,\lambda_2,v_2,\theta\in [0,1]$
被最优值约束
基于无约束的对偶函数求出的函数值一定是最优值的下界(被bound住)
任意在feasible set中的函数取值$L(x,\lambda,v)$一定被$p^*$ bound住
希望最大化$g(\lambda,\mu),\forall \lambda\geq 0$,实际上是凸问题
Lagrange function
Dual function
$g(v)$是凹函数(负定矩阵+线性函数)
Lagrange function
Dual function
仅在超平面上为线性函数,在空间中其他位置取$-\infty$
离散约束$x_i^2-1=0$
Lagrange Function
Dual Function
满足$W+diag(v)\succeq 0$的v向量为凸集,因为两个正定矩阵相加还是正定的
函数的共轭和对偶函数
$f^*$是$f:\R^n\to \R$的共轭,若
考虑约束优化
的拉格朗日函数
约束均为线性的优化问题
对偶函数
极大化$p^*$的下界$g(\lambda,v),\lambda \geq 0$
$,原问题最优解记作$p^,原问题最优解记作$p^*$,一定有
- 何时对偶间距为0
- ,v^,v^$(最优的拉格朗日乘子),使得$g(\lambda6,v^) = d^*$
线性优化$\eqref{linear}$的对偶函数为$\eqref{dual}$,极大化
于是对偶问题最优变成
合并等式约束和不等式约束
等价的目标函数(最优解相同,最优值不同)
考虑
的对偶函数和对偶问题
显然对偶函数满足
对偶问题
考虑$\ref{dual1}$和$\ref{dual2}$,$\ref{dual1}$将$\ref{linear}$中$x\to \lambda$,
$\ref{dual2}$改写成
原问题$\ref{linear}$和对偶问题形式类似,原问题$\ref{linear}$的对偶问题$\ref{dual1}$,改写为
考虑$\ref{linear2}$,令$-A=A^T$(做代换,并非等式),写成
$P1,P2$代表原问题1,2,$D1,D2$代表对偶问题1,2
说明了$P1$对偶问题的对偶问题是它自身,现在从原始约束的角度考虑这个问题,对于原始问题$\ref{linear}$
优化变量是$\R^n$上的变量,拉格朗日函数和对偶函数在约束上添加变量,因此是一个p维约束
n个约束上$\R^p$的优化,p个约束上$\R^n$优化
对偶问题的对偶问题不一定是自身,以为对偶问题一定是凸问题
何时两者等价
关键词:拉格朗日函数,对偶函数,对偶问题
强/弱对偶
$与原问题最优解$p^$与原问题最优解$p^*$满足
则称为强对偶,定义
为对偶间隙
原问题的域
相对内部相对内部对内部**
仿射包和球交集在D内
D是一个开集,则$ReLint D=D$
Slater’s condition(满足对偶间隙为0的充分条件)
若有凸问题
当$\exists x\in relint D$,使得
=d^=d^^*$
相对内点内点满足约束严格小,并且等式约束成立
A weaker Slater’s condition
=d^=d^=d^=d^=d^=d^*$
不等式约束写成
表示一个半空间,原来问题域是
$f_i$的域是全空间
- $f_0$定义在全空间内,则必然满足weaker Slater’s condition(约束在空间中形成多面体)
- 不需要考虑$f_0(x)\leq 0和f_1(x)=-f_0(x)\leq 0$两个不等式同时在$f_i(x)$中的情况,此时转化为等式约束
- 其它情况下,集合内部和多面体交集必然存在交集
目标函数、不等式约束,等式约束都是仿射(线性规划),如果存在可行解,则一定是强对偶
=d^=d^=d^=d^=d^*$
原问题定义在全空间上,全空间和多面体一定有交点,满足所有约束严格小
=d^=d^=d^=d^=d^*$,它的对偶问题是
两个问题最优值等价
QCQP
当$\lambda>0$时,一定是凸问题,写成
对x求微分
$g(\lambda)$是凹函数,并且$P(\lambda)$是正定矩阵(前提是$\lambda>0$),对偶问题
若$\exist x\in \R^n,s.t$
=d^=d^=d^*$
没有线性和常数约束
此时约束退化为
显然不可能,此时仅能让$x=0$才能满足所有约束,原问题最优值为
此时对偶问题退化为
显然$d^*=0$,可见Slater条件只是充分条件
=d^=d^^*$
对于只包含一个不等式约束的优化问题
定义
G是$\R^2$的子集,原问题的最优值$p^*$定义为
对偶函数定义为
对偶函数是目标和优化的线性组合,并且存在$x^*$使得函数值最小
如果在$\R^2$上画出G组成的集合,则$p^*$为在全空间左边部分中G中最矮的点,对于特定$g(\lambda)$
考虑$\lambda u + t = m$,是$\R^2$上的一条斜率为$-\lambda$的直线,m是在t轴上的截距
- 直线和G没有交集
- 直线和G有交集,则意味着m可以取到
平移斜率为$-\lambda$的直线,直到与G有交集并在t轴上截距最小(相切)
$的几何意义,$d^,$d^*$就是在上述直线的基础上调整$\lambda>0$,使得相切直线在t轴的截距最高
鞍点解释
拉格朗日函数的鞍点,如果有
,\lambda^ambda^*)$处取到
RHS对应$d^*$
LHS拉格朗日函数写成
- 如果满足约束,即$f_i(x)\leq 0,\forall i=1,2,\cdots$,则显然取$\lambda_i =0$使得对于任意给定x,$L(x,\lambda)$尽量大
- 描述原问题的最优值
- 存在一个约束不被满足$f_i(x)$,则$\sup_\lambda L(x,\lambda)=\infty$
对偶间距为0的一个等价条件是对于新的优化问题
,\lambda^mbda^*)$为该问题的鞍点
多目标优化解释
考虑多目标优化
给定一组系数$\lambda_i\geq 0$得到一组帕累托面,求解下列优化问题
对于给定的$\lambda$,找到x使得$L$极小,得到$\overline x$,得到$g(\lambda)$的值,在所有$g(\lambda)$中找到最大化$g$对应的$\overline \lambda$
反之,带入$\overline \lambda$到$L(x,\lambda)$中,记作$L(x,\overline \lambda)$,随后对于x求解极小化问题得到$\overline x$,是系数取$\overline \lambda$对应的帕累托面上的顶点
Economy
- x 生产商品量
- $f_0(x)$生产x的损失
- $f_i(x)$原材料的约束
给定原材料上限生产利润$-f_0(x)$最大化
假设原材料i单价为$\lambda_i$,购买原材料多余的部分$f_i(x)>0$表示多出的原材料,则拉格朗日函数
$f_i(x)<0$表示第i类原材料不足,购买第i类原材料还需要花费$-\lambda_i f_i(x)$,总的目标是让生产损失和购买原材料损失之和尽量小
$g(\lambda )=\min_x f_0(x) +\sum_{i=1}^m \lambda_i f_i(x)$表示在不同市场价格下,最低生产成本有所不同$\max g(\lambda)$意味着找到最大损失
\leq p^eq p^*$表示在可交换原材料的情况下,最大损失必然小于原材料不可买卖的最大损失(买卖可以不浪费资源)
$\lambda ^*$称为影子价格,商品价格取到影子价格可以让资源配置最优