首页 > 其他 > 详细

《流形优化方法求解约束问题》

时间:2020-07-07 15:24:53      阅读:136      评论:0      收藏:0      [点我收藏+]

最近几年,流形优化方法(或者叫黎曼优化)算是比较热门的,它提供了一个新的角度去求解和分析一类特殊的约束优化问题,也就是流形约束优化问题。

这篇文章的目的是让大家对这个方向有个大概的理解。详细的入门书籍建议看【1】【2】

另外综述文章看【3】还有一些博士论文:【4】【5】.

一句话概括就是:传统的优化方法是在欧氏空间考虑问题,而流形优化是在黎曼流形中考虑问题,这个黎曼流形哪来的呢?约束给的!也就是把欧氏空间的约束看成是一个流形。

一、流形约束问题

1.问题阐述

流形约束优化问题是指一类特殊的约束优化问题,它的约束具有流形结构。考虑一般的问题:

技术分享图片 其中 技术分享图片 表示流形约束。这个问题你可以简单的把它看成是约束问题,然后用传统的一些针对约束优化问题的优化方法去求,比如罚方法,增广拉格朗日方法等等。为什么有了这些方法还有去弄个流形优化方法出来,因为首先流行约束通常非凸,收敛性很难保证,其次这些方法不能保证迭代点总是满足约束,最后,流形约束是有结构的,这些方法没有去探索这些结构信息。以上说的三点正是流形优化的三个优点:

  • 所有迭代点保持约束可行性,也就是总是在流形 技术分享图片 上。
  • 流形优化将问题(1)理解为流形上的无约束优化问题,便于分析收敛性。
  • 利用了流形约束本身的结构信息。

2.流形约束的例子

接下来介绍一下常见的 技术分享图片 有哪些

  • Stiefel manifold: 技术分享图片
  • Grassmann manifold: 技术分享图片 :all 技术分享图片 -dimensional subspaces of 技术分享图片
  • Symmetric positive definite manifold: 技术分享图片
  • Fixed-rank manifold: 技术分享图片

3.问题的例子

  • 稀疏主成分分析

技术分享图片

  • Finding the sparsest vector in subspace

技术分享图片

  • 典型相关性分析

技术分享图片

  • 鲁棒低秩矩阵恢复

技术分享图片

二、预备知识

在欧氏空间中的优化方法已经很成熟,对于在流形上设计优化方法,一切在欧氏空间中看起来理所应当的东西在黎曼流形上却不成立,因此我们需要重新定义。

1.黎曼流形

引用wen huang的一句话解释:

"Roughly, a Riemannian manifold 技术分享图片 is a smooth set with a smoothly-varying inner product on the tangent spaces."

2.黎曼梯度

因为我们要设计优化方法,梯度是最重要的,我们要定义流形上的梯度,称为黎曼梯度,并且限制在切空间上。

Riemannian Gradient: 技术分享图片 is denoted as the unique tangent vector satisfying

技术分享图片

为什么要在切空间上考虑梯度,因为切空间是线性子空间,性质好。可以将切空间理解为流形在某个点的线性逼近,因此只要邻域足够小,切空间和流形的差可以得到控制。

3.收缩算子

有了负梯度,接下来是怎么往前走一步,假设我们有了 技术分享图片 ,和该点的黎曼梯度: 技术分享图片 ,我们如何得到 技术分享图片 ,如果是像欧氏空间一样:

技术分享图片这不能保证迭代点还在流形上,也就是说不满足约束条件。因此我们定义流形上的”加法“:

Retraction:A retraction on a manifold 技术分享图片 is a smooth mapping 技术分享图片 with the following properties. Let 技术分享图片 denote be the restriction of $R$ to 技术分享图片 :

  1. 技术分享图片 , where 技术分享图片 the zero element of 技术分享图片
  2. 技术分享图片 ,where 技术分享图片 is the identity mapping on 技术分享图片

对于不同的流形有不同的收缩算子,并且对于某个流形可以有多个算子。在欧氏空间中,收缩算子就是传统意义下的加法。

有了这两个定义,我们就可以很轻松的设计出黎曼梯度方法,基本迭代为:

技术分享图片

我们来比较下传统梯度和黎曼梯度的区别:

技术分享图片

4.向量转移算子

在黎曼流形中,不同点的梯度位于该点的切空间上,那么问题来了,不同点的黎曼梯度如何去比较?比如 技术分享图片 和 技术分享图片 ,这两个不在同一个切空间上。这里的解决方案是,我们把其中一个”平移“到另一个的切空间上。于是有了这个算子:

技术分享图片

这个算子在共轭梯度方法中会用到。

技术分享图片vector transport

三、流形优化方法

1.黎曼梯度方法

技术分享图片

和传统梯度方法一样,其中的步长可以有不同的选择,比如线搜索,BB步长等

2.黎曼共轭梯度

技术分享图片

注意到第二步,因为 技术分享图片 和 技术分享图片 不在同一个切空间上,没办法作比较,所以我们对 技术分享图片 用了向量转移算子,使得他们保持在同一个切空间。

二阶方法比较复杂一点,下次再补上。

四、总结

流形优化用于求解一类约束优化问题,将欧氏空间中的约束优化问题转化为黎曼流形上的无约束优化问题。关于欧氏空间下优化理论的很多东西都能扩展过来,比如函数的凸性,光滑性等等。

  • 流形优化方法并不能求解所有的约束优化,只限于那些可以看成是黎曼流形的约束,比如前面提到的正交约束,对称正定约束,低秩约束等等。
  • 欧氏空间的临近类算法不太好扩展到黎曼流形,至少在计算方面,因为在欧氏空间下“临近友好”这个性质扩展到黎曼流形下就没有了。

 

黎曼优化?zhuanlan.zhihu.com技术分享图片

 

参考文献

【1】 Absil, P-A., Robert Mahony, and Rodolphe Sepulchre.Optimization algorithms on matrix manifolds. Princeton University Press, 2009.

【2】Nicolas Boumal. An introduction to optimization on smooth manifolds. 2020.

【3】Hu, Jiang, Xin Liu, Zai-Wen Wen, and Ya-Xiang Yuan. "A brief introduction to manifold optimization."Journal of the Operations Research Society of China(2019): 1-50.

【4】Zhang, Hongyi. "Topics in non-convex optimization and learning." PhD diss., Massachusetts Institute of Technology, 2019.

【5】Huang, Wen. "Optimization algorithms on Riemannian manifolds with applications." (2013).

编辑于 6 小时前
 
 

 

最优化理论和一阶方法

介绍最优化理论及其一阶优化方法,欢迎大家来投稿。

技术分享图片

置顶文章

  • 技术分享图片

    非线性优化方法的总结——approximation

    技术分享图片
    9 个月前

    这篇文章想讲述下我接触到的优化方法,从确定到随机,从一阶到二阶,从原始到对偶。光滑到非光滑我认为迭代算法就是不断逼近,化繁为简,将一个个难问题分为若干个… 阅读全文?

 

最新文章

  • 流形优化方法求解约束问题

    技术分享图片
    1 天前
    技术分享图片

    最近几年,流形优化方法(或者叫黎曼优化)算是比较热门的,它提供了一个新的角度去求解和分析一类特殊的约束优化问题,也就是流形约束优化问题。这篇文章的目的是让大家对这个方向有个大概的理解。详细的入门书籍建议看【1】【2】另外综述… 阅读全文?

  • 从算子角度理解优化方法

    技术分享图片
    12 天前

    在求解一个优化问题时,我们可以采用不同的优化方法,而这些方法又可以从不同角度去理解。这篇文章我想讲下如何从算子角度出发去理解许多已存在的优化方法。有错误的地方欢迎大家指出来。我们考虑一个非线性映射的零点问题,也就是求解一个 … 阅读全文?

  • 凸优化笔记26:不动点迭代

    技术分享图片
    28 天前
    技术分享图片

    前面讲了很多具体的算法,比如梯度、次梯度、近似点梯度、加速近似点梯度、PPA、DR方法、ADMM、ALM等,对这些方法的迭代过程有了一些了解。这一节则主要是针对算法的收敛性进行分析,试图从一个更加抽象的层面,利用不动点迭代的思想,把上… 阅读全文?

  • 凸优化笔记25:原始对偶近似点算法

    技术分享图片
    29 天前
    技术分享图片

    前面的章节要么从原始问题出发,要么从对偶问题出发,通过求解近似点或者一个子优化问题进行迭代,而且推导过程中我们发现根据问题的参数特征,比如矩阵 A 是瘦高型的还是矮胖型的,采用对偶和原始问题的复杂度会不一样,可以选择一个更简单… 阅读全文?

  • 凸优化笔记24:ADMM

    技术分享图片
    1 个月前
    技术分享图片

    上一节讲了对偶问题上的 DR-splitting 就等价于原问题的 ADMM,这一节在详细的讲一下 ADMM 及其变种。1. 标准 ADMM 形式首先还是给出 ADMM 要求解的问题的格式,也就是约束存在耦合:\begin{align} \min_{x,z} \quad& f(x)+g(z) \\ \tex… 阅读全文?

  • 凸优化笔记23:算子分裂法与ADMM

    技术分享图片
    1 个月前
    技术分享图片

    前面章节中,针对 \min f(x)+g(Ax) 形式的优化问题,我们介绍了如 PG、dual PG、ALM、PPA 等方法。但是比如 PG 方法为x_{k+1}=\text{prox}_{th}(x_k-t_k\nabla g(x_k)) \\ALM 的第一步要解一个联合优化问题(x^{k+1},y^{k+1}) = \arg\min_{x,… 阅读全文?

  • 凸优化笔记22:近似点算法 PPA

    技术分享图片
    1 个月前
    技术分享图片

    在进入具体的优化算法后,我们首先讲了基于梯度的,比如梯度下降(GD)、次梯度下降(SD);然后又讲了近似点算子,之后讲了基于近似点算子的方法,比如近似点梯度下降(PG)、对偶问题的近似点梯度下降(DPG)、加速近似点梯度下降(APG)。而这一节… 阅读全文?

  • 凸优化笔记21:加速近似梯度方法

    技术分享图片
    1 个月前
    技术分享图片

    我们证明了梯度方法最快的收敛速度只能是 O(1/k^2)(没有强凸假设的话),但是前面的方法最多只能达到 O(1/k) 的收敛速度,那么有没有方法能达到这一极限呢?有!这一节要讲的 加速近似梯度方法(APG) 就是。这个方法的构造非常的巧妙,证明… 阅读全文?

  • 凸优化笔记20:对偶分解

    技术分享图片
    1 个月前
    技术分享图片

    ps:这段时间一直在忙毕设,好久没更新了。前面讲了梯度下降、次梯度下降、近似点梯度下降方法并分析了收敛性。一开始我们还讲了对偶原理,那么如果原问题比较难求解的时候,我们可不可以转化为对偶问题并应用梯度法求解呢?当然可以,不过… 阅读全文?

  • 凸优化笔记19:近似点梯度下降

    技术分享图片
    1 个月前
    技术分享图片

    前面讲了梯度下降法、次梯度下降法,并分析了他们的收敛性。上一节讲了近似梯度算子,我们说主要是针对非光滑问题的,这一节就要讲近似梯度算子在非光滑优化问题中的应用。先回顾一下上一节最重要的一部分内容:对于指示函数 \delta_C 来说… 阅读全文?

  • 凸优化笔记18:近似点算子

    技术分享图片
    1 个月前
    技术分享图片

    前面讲了梯度下降法,分析了其收敛速度,对于存在不可导的函数介绍了次梯度的计算方法以及次梯度下降法,这一节要介绍的内容叫做近似点算子(Proximal mapping),也是为了处理非光滑问题。1. 闭函数在引入闭函数(closed function)的概念之前… 阅读全文?

  • 论文笔记:分布式优化之EXTRA算法

    技术分享图片
    1 个月前
    技术分享图片

    这两天看了一下分布式优化算法,讲下15年的一篇文章:EXTRA算法,做个笔记。EXTRA: An Exact First-Order Algorithm for Decentralized Consensus Optimization一、问题描述我们要求解的问题是:\min_{x\in \mathbb{R}^p} \{f(x):=\sum_{i=1… 阅读全文?

  • 凸优化笔记17:次梯度下降

    技术分享图片
    1 个月前
    技术分享图片

    对于光滑函数,我们可以用梯度下降法,并且证明了取不同的步长,可以得到次线性收敛,如果加上强凸性质,还可以得到线性收敛速度。那如果现在对于不可导的函数,我们就只能沿着次梯度下降,同样会面临步长的选择、方向的选择、收敛性分析等… 阅读全文?

  • 凸优化笔记16:次梯度

    技术分享图片
    1 个月前
    技术分享图片

    前面讲了梯度下降的方法,关键在于步长的选择:固定步长、线搜索、BB方法等,但是如果优化函数本身存在不可导的点,就没有办法计算梯度了,这个时候就需要引入次梯度(Subgradient),这一节主要关注次梯度的计算。1. 次梯度次梯度(subgradien… 阅读全文?

  • 凸优化笔记15:梯度下降法

    技术分享图片
    2 个月前
    技术分享图片

    前面的章节基本上讲完了凸优化相关的理论部分,在对偶原理以及 KKT 条件那里我们已经体会到了理论之美!接下来我们就要进入求解算法的部分,这也是需要浓墨重彩的一部分,毕竟我们学习凸优化就是为了解决实际当中的优化问题。我们今天首先要… 阅读全文?

  • 光滑化——原始与对偶

    技术分享图片
    2 个月前
    技术分享图片

    一、光滑化定义函数的光滑化是指对一个非光滑函数 f,我们得到一个光滑的函数,假设是 f_{\mu} 。 这个 f_{\mu} 要满足两个条件,首先得是光滑的,其次就是不能和原函数 f 差太多,这个是很好理解的。接下来我们正式的定义一下可光滑化(smo… 阅读全文?

  • 求解稀疏优化问题2——临近点方法+半光滑牛顿法

    技术分享图片
    6 个月前

    这篇文章是我之前一篇文章的兄弟篇,没看过的可以看下面这个。邓康康:求解稀疏优化问题——半光滑牛顿方法我们考虑的问题仍然是如下的一般问题:\min_{x\in\mathbb{R}^n} \{ f(Ax) + g(x)\} \\ \tag{P} 其中 A\in\mathbb{R}^{m\times n} ,… 阅读全文?

  • 原始对偶角度下的几类优化方法

    技术分享图片
    7 个月前

    这篇文章介绍三个方法在原始角度和对偶角度下的形式,分别为:梯度方法(gradient descent method),临近点方法(proximal point method)以及临近梯度方法(proximal gradient method),感受下对偶的魅力。主要参考的是wotao yin的slide… 阅读全文?

  • 不同条件下梯度方法的收敛性分析1——(Non)convex+(Non)smooth

    技术分享图片
    7 个月前
    技术分享图片

    梯度方法是优化方法中最基本的迭代方法,它只用到了梯度信息,属于一阶方法,许多其他的一阶方法都算是梯度方法的改进,都是在梯度方向上加上别的信息,比如共轭梯度,动量方法,Nesterov加速。这篇文章想总结下在不同条件下分析(次)梯度… 阅读全文?

  • 读共轭对偶与优化-笔记

    技术分享图片
    7 个月前
    技术分享图片

    最近在读大神Rockafellar的小册子“Conjugate Duality and Optimization”. 本来是想读“Convex Analysis”,可是实在是太长了,只能望而却步。所以决定找个薄的来读读,Conjugate Duality and Optimization这个册子其实算是Convex Analysis… 阅读全文?

  • 求解稀疏优化问题1——增广拉格朗日方法+半光滑牛顿方法

    技术分享图片
    7 个月前
    技术分享图片

    在这个一阶方法盛行的时代中,二阶方法看起来不那么受欢迎,能想到的优点好像只有“精度高”,但是原始的二阶方法(Newton,trust region,cubic regularizarion Newton)代价实在是太大了。 为了权衡优缺点,出现了很多“似二非二”的算法,… 阅读全文?

  • 工程优化4-补充

    技术分享图片
    8 个月前
    技术分享图片

    D.S.C法1.令k=0,取 x_{0} ,步长 \Deltax>0,若f( x_{0} + \Delta x )<=f( x_{0} ) ,令 x_{1} = x_{0} + \Delta x 转3,否则,令 \Delta x=- \Delta x,转22.令 x_{k+1} = x_{k} + \Delta x ,若f( x_{k+1} )<=f( x_{k} ),转3,否则… 阅读全文?

  • 随机梯度算法的收敛性分析

    技术分享图片
    8 个月前

    这篇文章想讲下我对随机梯度算法中收敛性分析的粗略理解考虑光滑问题\min_x F(x):=\sum_{i=1}^n f_i(x) 假设我们的迭代为x_{t+1} = x_t - \eta v_t 其中 \eta 表示步长, v_t 表示随机方向,不同的随机方法采取的是不同的方向。 我们用 \xi_… 阅读全文?

  • Nesterov加速和Momentum动量方法

    技术分享图片
    8 个月前

    这篇讲下我对这两个方法的理解。Momentum动量首先讲动量方法,它的基本迭代通常可以表述为\[ \begin{array}{l} v_t = \mu_{t-1}v_{t-1} - \epsilon_{t-1}\nabla g(\theta_{t-1}) \\ \theta_t = \theta_{t-1} + v_t \end{array} \] (1)这里… 阅读全文?

  • 黎曼优化的一点理解

    技术分享图片
    9 个月前

    黎曼优化用于解决一类具有结构的约束优化问题,比如正交约束。 我想根据我自己的理解讲下黎曼优化方法的基本思路。具体地,黎曼优化关注下面这类问题:\[ \begin{split} \min_x & f(x) ,~~\mbox{s.t. } x\in\mathcal{M}. \end{split} \]… 阅读全文?

  • 非线性优化方法的总结——approximation

    技术分享图片
    9 个月前
    技术分享图片

    这篇文章想讲述下我接触到的优化方法,从确定到随机,从一阶到二阶,从原始到对偶。光滑到非光滑我认为迭代算法就是不断逼近,化繁为简,将一个个难问题分为若干个易问题的过程。所以我从逼近的角度去讲述这些方法。欢迎大家来讨论交流,由… 阅读全文?

 
 
 
 

《流形优化方法求解约束问题》

原文:https://www.cnblogs.com/cx2016/p/13260591.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!