2012/9/24
凸优化理论与应用
庄 伯 金
Bjzhuang@bupt.edu.cn
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
几类经典的优化问题
线性规划问题
最小二乘问题
凸优化问题
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
凸优化问题理论上有
有效的方法进行求解!
课程要求
熟悉了解凸优化理论的基本原理和基本方法;
掌握实际问题转化为凸优化问题的基本方法;
掌握最优化问题的经典算法。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
1
3
5
优化理论概述
什么是优化问题?
Objective
function
Constraint
functions
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
本课程的主要内容
理论部分
凸集和凸函数
凸优化问题
对偶问题
应用部分
逼近与拟合
统计估计
几何问题
算法部分
非约束优化方法
等式约束优化方法
内点法
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
2
4
参考书目
Stephen Boyd and Lieven Vandenberghe, “Convex
Optimization”, Cambridge University Press.
袁亚湘、孙文瑜,“最优化理论与方法”,科学出版
社,1999。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
6
1
0minimize ()subject to (), 1,...,iinfxfxbimxR()ifx为线性函数202()-, 0.fxAxbm=()ifx为凸函数
凸优化理论与应用
第一章
凸集
仿射集(Affine sets)
直线的表示:
线段的表示:
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
7
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
仿射集(Affine sets)
仿射集
仿射集的定义:过集合C内任意两点的直线均在集合
仿射包:包含集合C的最小的仿射集。
C内,则称集合C为仿射集。
仿射集的例:直线、平面、超平面
仿射维数:仿射包的维数。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
9
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
2012/9/24
8
10
仿射集
内点(interior):
相对内点(relative interior):
凸集(Convex Sets)
凸集的定义:集合C内任意两点间的线段均在集合C
内,则称集合C为凸集。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
11
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
12
2
12(1), .yxxR.12(1), [0,1].yxx.Axbaff {|,1}iiiiCxxCint {|(,),0}CxBxrCrrelint {|(,)aff,0}CxBxrCCr1212,,[0,1],(1)xxCxxC则111,...,,[0,1]1,kkiiikiiixxCxC且 则
凸集
锥(Cones)
凸包的定义:包含集合C的最小的凸集。
锥的定义:
凸锥的定义:集合C既是凸集又是锥。
锥包的定义:集合C内点的所有锥组合。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
13
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
超平面和半空间
欧氏球和椭球
超平面(hyperplane) :
欧氏球(euclidean ball):
半空间(Halfspace):
椭球(ellipsoid):
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
15
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
范数球和范数锥
多面体(Polyhedra)
范数(norm):
多面体:
范数球(norm ball):
范数锥(norm cone):
单纯形(simplex):
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
17
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
2012/9/24
14
16
18
3
11conv {|,0,1}kkiiiiiiiCxxC,0,.xCxC则有12121122,,,0,.xxCxxC则有1{|,0}kiiiiixxC{|}Txaxb{|}Txaxb{|}Txaxb22(,){|} {|()()}ccTccBxrxxxrxxxxxr12{|()()}, TccExxxPxxrP为对称正定矩阵2(,){|1}ccBxrxruu1/22{|1}, cExAuuAP0,00;||,xxxtxtxtxyxy当且仅当;R;(,){|}ccBxrxxxr{(,)|}xtxt{|,}TTjjiiPxaxbcxd10000{|0,1,,...,}kkiiiikiivvvvv线性无关
半正定锥(Positive semidefinite cone)
保持凸性的运算
n阶对称矩阵集:
集合交运算
仿射变换
n阶半正定矩阵集:
透视/投射函数(perspective function)
n阶正定矩阵集:
n阶半正定矩阵集为
凸锥!
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
19
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
保持凸性的运算
真锥(proper cone)
线性分式函数(linear-fractional function)
真锥的定义:锥
满足如下条件
K具有内点
K内不含直线
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
21
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
广义不等式
广义不等式的性质
真锥 下的偏序关系:
广义不等式
例:
逐项不等式
矩阵不等式
严格广义不等式
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
23
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
2012/9/24
20
22
24
4
{|}nnnTSXXXnR{|0}nnSXSX{|0}nnSXSX(,)/,,nPztztztRR(),,mnmfxAxbARbR()()/(),,,,0TmnmnTfxAxbcxdAbcdcxdRRRRnKR1.4.KKKK为凸集;2.为闭集;3.非中空;有端点。KKxyyxKintKxyyxK1.;2.,;3.,;4.,;5.,0;6.,lim,lim.KKKKKKKKKKKiKiiiKxxxyyxxyxyyzxzxyuvxuyvxyxyxyxxyyxy
2012/9/24
严格广义不等式的性质
最值和极值
最小元的定义:设
,对
,都有
成立,则称 为 的最小元。
极小元的定义:设
,对于
,若
,则
成立,则称 为 的极小元。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
25
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
26
分割超平面(separating hyperplane)
支撑超平面(supporting hyperplane)
定理:设 和 为两不相交凸集,则存在超平面将
定义:设集合 , 为 边界上的点。若存在
,
和 分离。即:
满足对任意
面
,都有
成立,则称超平
为集合 在点 处的支撑超平面。
定理:凸集边界上任意一点均存在支撑超平面。
定理:若一个闭的非中空集合,在边界上的任意一点
存在支撑超平面,则该集合为凸集。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
27
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
对偶锥(dual cone)
对偶锥的定义:设 为锥,则集合
对偶广义不等式
广义不等式与对偶等价性质
称为对偶锥。
对偶锥的性质:
真锥的对偶锥仍
然是真锥!
最小元的对偶特性:
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
29
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
28
30
5
1.;2.;3.,;4.,05.,.KKKKKKKKKKxyxyxxxyuvxuyvxyxyxyuxuy足够小xSySKxyxSxSySKyxxSyx,,.TTxCaxbxDaxb且CDCDC0xC0axC0TTaxax0{|}TTxaxaxC0xK*{|0,}TKyxyxK*****1..3.KKKKKKK是闭凸集;2若非中空,则有端点;若的闭包有端点,则非中空;4.是的闭凸包;**,for all 0;,for all 0,0.TTKKTTKKxyxyxyxy*0, ,.TKxSKxzzS为集合中关于偏序的最小元对所有为使最小的值
2012/9/24
对偶广义不等式
极小元的对偶特性
反过来不一定成
立!
作业
P60 2.8
P60 2.10
P60 2.14
P62 2.16
P62 2.18
P64 2.30
P64 2.31
P64 2.33
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
31
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
32
凸优化理论与应用
第二章 凸函数
凸函数的定义
凸函数的定义:函数
,满足
1.定义域
为凸集;
2. ,有
凸函数的扩展定义:若 为凸函数,则可定义其扩
展函数
为
凸函数的
扩展函数
也是凸函
信息与通信工程学院
庄伯金
33
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
数!
34
凸函数的一阶微分条件
凸函数的二阶微分条件
若函数 的定义域
为开集,且函数 一阶可微,
若函数 的定义域
则函数 为凸函数当且仅当
为凸集,且对
微,则函数 为凸函数当且仅当
对
,其Hessian矩阵
为开集,且函数 二阶可
为凸集,且
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
35
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
36
6
*0, ,.TKxzzSx为使最小的值为极小元dom f.((1))()(1)().fxyfxfy,dom ,01xyf.:nfnRR.f.:{}nfnRR.()dom()domfxxffxxf()()()()Tfyfxfxyxfffdomfdomf,domxyff2()0.fxffdomfdomfdomxf
2012/9/24
凸函数的例
凸函数的例
指数函数
幂函数
负对数函数
负熵函数
范数函数
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
37
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
38
下水平集(sublevel set)
函数上半图(epigraph)
定义:集合
称为 的 下水平集。
定理:凸函数的任一下水平集均为凸集。
任一下水平集均为凸集的函数不一定为凸函数。
定义:集合
称为函数 的上半图。
定理:函数 为凸函数当且仅当 的上半图为凸集。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
39
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
Jensen不等式
为凸函数,则有:
Jensen不等式的另外形式:
保持函数凸性的算子
凸函数的非负加权和
凸函数与仿射变换的复合
凸函数的逐点最大值
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
41
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
40
42
7
,,1 or 0.axxaaRlogxlogxxpxaxe1()max(,...,)nfxxx2()/,0fxxyy1()log(...)nxxfxee1/1()(),domnnniifxxfR()log(det),domnfXXfS{dom|()}Cxffxfffepi{(,)|dom,()}fxtxffxtf1111(...)()...()nnnnfxxfxfxf101,...1.in其中(())()().SSfpxxdxpxfxdx1()max((),...,())nfxfxfx()()gxfAxb()sup(,)yfxgxyA11()()...()nnfxfxfx
2012/9/24
保持函数凸性的算子
共轭函数(conjugate function)
复合运算
最小值算子
凸函数的透视算子
定义:设函数
定义为
共轭函数的例
,其共轭函数
,
共轭函数
具有凸性!
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
43
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
44
共轭函数的性质
准凸函数(quasiconvex function)
Fenchel’s inequality
定义:设函数
,若函数的定义域和任意下水
性质:若
为凸函数,且
的上半图是闭集,则有
性质:设
为凸函数,且可微,对于
,若
则
平集
则称函数
为准凸函数。
准凸函数的例
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
45
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
准凸函数的判定定理
保持准凸性的算子
定理:函数
为准凸函数,当且仅当
为凸集,
非负权值函数的最大值函数
且对
,有
定理:若函数
一阶可微,则
当
为凸集,且对
为准凸函数,当且仅
,有
复合函数
定理:若函数
二阶可微,且满足对
最小值函数
,有
则函数
准凸函数。
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
47
信息与通信工程学院 庄伯金
bjzhuang@bupt.edu.cn
46
48
8
:,:()(())nghfxhgxRRRRf()inf(,)yCgxfxy(,)(/)gxttfxt:nfRR*dom()sup(()).Txffyyxfx*:nfRR()Tfxaxb()xfxe()logfxxx*()().Tfxfyyx()fx()fx**.ff()fxnzR()yfz*()()()Tfyzfzfz{|(),dom}Sxfxxf:nfnRR()fx()fx((1))max{(),()}fxyfxfydomf,dom,01xyf()fx()fxdomf,domxyf()()()()0Tfyfxfxyx()fxdom,,0nxfyyR2()0()0TTyfxyfxy()fx