2 对偶问题

之前说到现在的优化目标是

\begin{gathered} \min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^2 \\ \text { s.t. } y_i*\left(\boldsymbol{w}^{\top} \boldsymbol{x}_i+b\right) \geq 1 \quad i=1, \cdots, m \end{gathered}

这是一个凸二次规划,本来已经有现成的解决框架,但是下面的对偶问题法更加高效。

对上面每个约束添加拉格朗日乘子 \alpha_i\ge 0,则拉格朗日函数可以写为 $$ \newcommand{\w}{\boldsymbol w} \newcommand{\a}{\boldsymbol \alpha} \newcommand{\x}{\boldsymbol x} L(\w,b,\a)=\frac12||\w||^2+\sum_{i=1}^m\alpha_i[1-y_i*(\w^T\x_i+b)] $$ 令 L\wb 的偏导为 0 可得: $$ \begin{aligned} \w-\sum_{i=1}^m\alpha_iy_i\x_i&=0\newline \sum_{i=0}^m\alpha_iy_i&=0 \end{aligned} $$ 因为凸优化问题拉格朗日函数偏导为 0 的解一定是最优解,所以把上面两式代回 L 中,就可以消去 \w,b,得到关于 \boldsymbol{\alpha} 的条件,进而关于 \boldsymbol{\alpha} 优化就可以求出最优解 \w

具体推导如下:

\begin{aligned} \inf _{\w,b}L&=\frac{1}{2}\w^T\w+\sum_{i=1}^m\alpha_i-\sum_{i=1}^m\alpha_iy_i\w^T\x_i-\sum_{i=1}^m\alpha_iy_ib\newline &=-\frac{1}{2}\w^T\w+\sum_{i=1}^m\alpha_i\newline &=-\frac12\left(\sum_{i=1}^m\alpha_iy_i\x_i\right)^T\left(\sum_{i=1}^m\alpha_iy_i\x_i\right)+\sum_{i=1}^m\alpha_i\newline &=-\frac12\sum_{i=1}^m\alpha_iy_i\x_i^T\sum_{i=1}^m\alpha_iy_i\x_i+\sum_{i=1}^m\alpha_i\newline &=-\frac12\sum_{i=1}^m\sum_{j=1}^m\alpha_iy_i\x_i^T\alpha_jy_j\x_j+\sum_{i=1}^m\alpha_i \end{aligned}

所以

\max_{\a}\inf_{\w,b}L=\max_\a\left(\sum_{i=1}^m\alpha_i-\frac12\sum_{i=1}^m\sum_{j=1}^m\alpha_iy_i\x_i^T\alpha_jy_j\x_j\right)

对偶问题为

\begin{aligned} &\max_\a\left(\sum_{i=1}^m\alpha_i-\frac12\sum_{i=1}^m\sum_{j=1}^m\alpha_iy_i\x_i^T\alpha_jy_j\x_j\right)\newline &\text{s.t. }\sum_{i=1}^m\alpha_iy_i=0,\quad \a≽0 \end{aligned}

注记

原问题:

\begin{gathered} \min _x f(\boldsymbol{x}) \\ \text { s.t. } \\ g_i(\boldsymbol{x}) \leq 0, i=1,2, \ldots, m \\ h_j(\boldsymbol{x})=0, j=1,2, \cdots, n \end{gathered}

对偶问题: $$ \max _{\boldsymbol{u}, \boldsymbol{v}} g(\boldsymbol{u}, \boldsymbol{v}) $$

s.t. $\boldsymbol{u} ≽ 0
其中 g(\boldsymbol{u}, \boldsymbol{v})=\min _{\boldsymbol{x}} L(\boldsymbol{x}, \boldsymbol{u}, \boldsymbol{v})

强对偶性条件:原问题为凸优化问题,且可行域中至少有一个点使得不等式约束严格成立

  • 对于线性可分问题,一定存在 (\boldsymbol{w}, b) 使得 y_i\left(\boldsymbol{w}^{\top} \boldsymbol{x}_i+b\right) \geq 1i=1,2, \ldots, m

  • \epsilon<1 ,则 \displaystyle y_i\left(\boldsymbol{w}^{\top} \boldsymbol{x}_i+b\right)>\epsilon \Rightarrow y_i\left(\frac{\boldsymbol{w}^{\top}}{\epsilon} \boldsymbol{x}_i+\frac{b}{\epsilon}\right)>1\displaystyle\left(\frac{\w}{\epsilon}, \frac{b}{\epsilon}\right) 严格满足不等式。因此,该优化问题满足强对偶性条件。

本文阅读量