凸函数的定义
一个函数f:Rn↦R 为凸,等价于
domf为凸集
且对所有的 x,y∈domf,0≤θ≤1 有 f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)
凸函数的扩展
f:Rn↦R 为凸 domf=C⊆Rn
定义
f^={f(x),+∞, x∈domfx∈/domf
f^:Rn↦Rdomf^=Rn
示性函数是凸函数
突击 C⊆Rn
fc(x)={无定义,0, x∈/Cx∈C
Ic(x)={+∞,0, x∈/Cx∈C
fc(x)、Ic(x) 都是凸函数 +∞/2=+∞
Jc(x)={1,0, x∈/Cx∈C
Jc(x) 不是凸函数也不是凹函数
一阶条件
设f:Rn↦R 可微,即梯度 ▽f在domf上均存在,则f为凸等价于:
domf为凸
f(y)≥f(x)+▽fT(x)(y−x)∀x,y∈domf
证明:一阶条件
考虑一维情况f:R↦R 为凸,
等价于domf为凸集,且 f(y)≥f(x)+f′(x)(y−x)
证:⇒
f为凸,∀x,y∈domf 为凸
∀t,0<t≤t,x+t(y−x)∈domf
f(x+t(y−x))≤(1−t)f(x)+tf(y)
tf(y)≥tf(x)+f(x+(y−x))−f(x)
f(y)≥f(x)+tf(x+(y−x))−f(x)
设 limt→0+
f(y)≥f(x)+f′(x)(y−x)
证: ⇐
设 ∀x=y x,y∈domf
0≤θ≤1 构造 z=θx+(1−θ)y∈domf
f(x)≥f(z)+f′(z)(x−z)
f(y)≥f(z)+f′(z)(y−z)
θf(x)+(1−θ)f(y)≥f(z)+(θ(x−z)+(1−θ)(y−z))f′(z)
θf(x)+(1−θ)f(y)≥f(z)+(θx+(1−θ)y−z)f′(z)
θf(x)+(1−θ)f(y)≥f(z)