凸函数
一.基本性质和例子
1.定义
- 定义一:函数f:
是凸的,如果
是凸集,且对于任意的
和任意的0
,有
。
- 定义二:函数f是凸函数,当且仅当与其定义域相交的任意函数都是凸函数。或者说,函数f是凸函数,当且仅当对于任意的
和任意向量
,函数
是凸函数(其定义域为
)
-
几何意义:上述不等式意味着
的线段,即从x到y的弦在图像上方。
- 严格凸:当
且
时,有
总成立。
- 函数f是凸函数,当-f是凹函数;f是凹函数,当-f是凸函数。
2.拓展值延伸
-
定义:
image.png
-
扩展值延伸的意义:将在函数
定义域外的值定义为无穷大,将函数延伸至全空间
上,这种延伸可以简化符号表示,且延伸后凸性不变。对于延伸函数
,可以描述为:
对任意的
及
有
。(当
时,总成立)
- 当
时,
,因为
为凸函数,上述不等式成立。
- 如果
任一个在
外,不等式右面为正无穷,左面
在
- 当
-
例子:
- 凸集的示性函数,设
是一个凸集,考虑凸函数
,其定义域为C,对于所有
,有
,换言之,此函数在集合C上一直为零。其扩展延伸可以描述如下
。凸函数
被称为集合C的示性函数。利用示性函数我们更加灵活的定义符号描述:例如求
在C上的极小值,可以描述为求极小化
- 延伸函数一定要扩展到无穷,不然无法保持凸性。
- 凸集的示性函数,设
3.一阶条件
-
一阶条件:假设f可微(即其梯度
在开集
内处处存在),则函数
是凸函数的充分必要条件是
是凸集且对于任意的
,下式成立
。
-
几何意义:
-
快照57.png
-
是仿射函数y即为函数
在点
附近的Taylor近似,在这里Taylor近似其实是原函数的一个全局下估计
-
极值点:如果
,那么对于所有的
,存在
,所以x是全局最小点
-
严格凸:函数f严格凸的充分必要条件是
-
-
证明:一阶条件是指在任意维凸集中均成立
-
我们首先在证明在一维的情况下成立:即可微函数
是凸函数的充分必要条件是
-
必要性:
首先假设f是凸函数,由凸函数的定义我们可以得到
是一个凸集
假设
,则对于任意的
,有
,
由凸函数的定义一可得
上式两端同除以t得
因为f是可微函数,所以令
,可得到
。
(当t=0时显然成立。)
-
充分性
假设
内的任意x,y在定义域中,满足
假设
,
由上述不等式可得:
将第一个不等式同乘
,第二个不等式同乘
,并将二者相加可得:
得证
-
-
下边利用定义二由一维推理一般情况:
对于高维空间的函数f:
,假设
,构造一个一维的函数
,
此函数的导数为
。
-
首先假设f是凸函数,证明
因为f是凸函数,由定义二可得g是凸函数。
由g是一个一维空间的凸函数,由第一步证明可得对于任意的,
可得:
,
取
,带入
,化简
。
得证
-
其次,假设若对于任意的
,有
则f是一个凸函数
因为
是一个凸集,
所以对于任意的
,有
,
所以有
化简得
。
-
-
4.二阶条件
-
定义:若函数
二阶可微,则f为凸函数的充分必要条件是:
-
为凸集
-
,对于任意的
-
-
几何意义,二阶导数大于零,曲率为正,一阶导数为增函数。为了更好理解,可以局限在一维情况下,参照一下数学分析。
-
证明:
书上说让自己证明哦!
显然可得。
-
严格凸:对于任意的
,若
,则函数f是严格凸函数。
若函数f是严格凸函数,那么对于任意的
,
未必成立。
也就是说
大于零是严格凸的充分不必要条件。
- 例如:函数
,
二阶可导,
,然而从图像可知此函数还是一个严格凸函数。
- 例如:函数
-
例题:特殊情况:二次函数严格凸的充分必要条件是
快照58.png
- 注:关于Hessian矩阵:联想一下二次型就可以理解了,特征值,特征向量。
5.例子
-
快照69.png
补充:
- 范数定义:
的范数
满足
- 若
,则
- 零范数:
,不是一个凸函数。它也不满足范数定义。
二.保凸运算
1.非负加权和
-
非负加权和:凸函数集合本身是一个凸锥:凸函数的非负加权和任然是凸函数。若为凸
为凸,则
为凸函数。其中
证明:首先
为所有
定义域的交集,所以定义域为凸集。其次,显然。
-
非负加权和拓展: 若
对任意固定的
均为关于
凸函数,设
,那么
为关于x的凸函数。
2.复合仿射映射
-
定义:假设函数
,以及
,定义
为
,其中
。若函数f是凸函数,那么g是凸函数;如果函数f是凹函数,那么函数g是凹函数。
-
证明:
1.证明
是一个凸集
对于任意的
,
,
已知
是一个凸集且
由凸集的定义可得
所以
2.证明:
是凸函数。
因为
是凸函数,那么可得
得证,所以复合仿射映射是一个凸函数。
-
3.逐点最大和逐点上确界
-
逐点最大和
-
定义:如果函数
和
均为凸函数,则二者的逐点最大函数
,
,定义域是
,仍然是个凸函数。
-
证明:任取0
以及
,有
-
例题:
-
推广:如果函数
是凸函数,那么他们的逐点最大和
也是凸函数。
-
-
最大的r个分量之和:
-
定义:对任意
,用
表示
中第i大的分量,即将
中分量按照非降序排列得到下式:
,对x中前r个大的分量进行求和得到
是一个凸函数。
此函数可以描述为
-
理解:即从
中随机选择r个元素求和可能组合中的最大值,这种取法共有
可能。将每一种可能看做一个函数,那个最大的r个分量之和相当于对这
逐点求和。而随机取值求和函数又是关于
的仿射映射,一定是一个凸函数,所以最大的r个分量之和也是凸函数。
-
推广:
,
也是一个凸函数
-
推广:无限个凸函数的逐点上确界:如果对任意的
,函数
关于
是凸的,则函数
也是凸的,定义域为
-
-
实对称阵的最大特征值:
,
是特征向量,
当
由上述定理可知若对于每一个y,
,那么
是一个凸函数。











网友评论