首页 > 技术文章 > 无约束问题的最优条件

wish-together 2021-05-29 16:23 原文

无约束问题的最优条件

考虑无约束优化问题:

\[\begin{aligned} \min & f(x) \\ \text { s.t. } & x \in X \subseteq R^{n} \end{aligned} \]

在这里插入图片描述

  • 若f(x)为凸函数 则 \(x^*\)是最优解 \(\Leftrightarrow\) \(\nabla f\left(x^{*}\right)=0_{\circ}\)
  • 若f(x)为一般函数
    • 一阶必要条件(First-Order Necessary Conditions)
      假设\(f(x)\)\(x^*\)处是可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)
    • 二阶必要条件(Second-Order Necessary Conditions)
      假设\(f(x)\)\(x^*\)处是二阶可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)\(\nabla^{2} f\left(\mathbf{x}^{*}\right)\)是半正定矩阵
    • 二阶充分条件(Second-Order Sufficient Conditions)
      假设\(f(x)\)\(x^*\)处是二阶可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)\(\nabla^{2} f\left(\mathbf{x}^{*}\right)\)是正定矩阵
      在这里插入图片描述

回顾泰勒定理(Taylor's Theorem)

为了证明,我们回顾一下泰勒定理
如果f在R上连续可微,则

\[f(x+p)=f(x)+\nabla f(x+t p)^{\top} p$$$$t \in(0,1) \]

如果f在R上二次连续可微,则可以得到

\[f(x+p)=f(x)+\nabla f(x)^{\top} p+\frac{1}{2} p^{\top} \nabla^{2} f(x+t p) p \]

具体推导如下
在这里插入图片描述

一阶必要条件(First-Order Necessary Conditions)

假设\(f(x)\)\(x^*\)处是可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)

\(proof\)如下:
在这里插入图片描述

二阶必要条件(Second-Order Necessary Conditions)

假设\(f(x)\)\(x^*\)处是二阶可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)\(\nabla^{2} f\left(\mathbf{x}^{*}\right)\)是半正定矩阵

\(proof\)如下:
在这里插入图片描述

在这里插入图片描述

二阶充分条件(Second-Order Sufficient Conditions)

假设\(f(x)\)\(x^*\)处是二阶可微的,如果\(x^*\)是局部最小值,那么\(\nabla f\left(x^{*}\right)=0\)\(\nabla^{2} f\left(\mathbf{x}^{*}\right)\)是正定矩阵

\(proof\)如下:
在这里插入图片描述
参考

  • Nocedal, Jorge, & Wright, Stephen J. (0). Numerical optimization. 2nd ed.. Springer.

推荐阅读