简略记录了例题以及解法,没事,李老师会预判你的预判,自求多福
Chapter1
利润最大化问题(没考)
步骤如下:
- 将最大化问题与条件转换为矩阵形式,如:
max 40x1+50x2 s.t. x1+2x2≤40
变成
令x=[x1x2],a=[4050],b=[12]
max aTx s.t. bTx≤40
-
使用线性规划法求解问题,画出坐标图
-
最大化y=aTx即最大化该直线的截距,找到直线经过的最高点并计算出此时的最优解。
Chapter2
判断是否为线性函数(没考)
两条性质:
验证或找到反例即可
反例可先判断其不为仿射函数(一个线性函数加上常数):
f(αx+βy)=αf(x)+βf(y), α+β=1,α,β∈R,x,y∈Rn
求一阶泰勒近似(考了)
代公式就好
f^(x)=f(z)+∇f(z)T(x−z)∇f(z)=⎣⎢⎢⎡∂x1∂f(z)⋮∂xn∂f(z)⎦⎥⎥⎤
Chapter3
写出各种范数(考了,送分)
ℓ1-范数(曼哈顿范数)
∣∣x∣∣1=∣x1∣+∣x2∣+⋯+∣xn∣,x,y∈Rn,α∈R
ℓ2-范数(欧几里得范数,一般的∣∣⋅∣∣也是)
∣∣x∣∣2=(x12+x22+⋯+xn2)=xTx=(⟨x,x⟩)21
ℓp-范数
∣∣x∣∣p=(∣x1∣p+∣x2∣p+⋯+∣xn∣p)p1,x∈Rn
ℓ∞-范数
∣∣x∣∣∞=1≤i≤nmax∣xi∣,x∈Rn
ℓ0-范数 (非0元素的个数)
∣∣x∣∣0=nnz(x)
柯西-施瓦茨不等式
可用于证明ℓ2-范数的三角不等性
∣⟨x,y⟩∣2≤⟨x,x⟩⟨y,y⟩=∣∣x∣∣22∣∣y∣∣22
Minkowshi不等式
可用于证明ℓp-范数的三角不等性
(i=1∑n∣xi+yi∣p)p1≤(i=1∑n∣xi∣p)p1+(i=1∑n∣yi∣p)p1,p≥1,x,y∈Rn
Hölder不等式
i=1∑n∣xiyi∣≤(i=1∑n∣xi∣p)p1(i=1∑n∣yi∣p)p1,p1+q1=1,1
判断是否为范数
-
非负性:∣∣x∣∣≥0,x∈Rn且∣∣x∣∣=0⇔x=0
-
齐次性:∣∣αx∣∣=∣α∣∣∣x∣∣,α∈R且x∈Rn
-
三角不等性:∣∣x+y∣∣≤∣∣x∣∣+∣∣y∣∣,x,y∈Rn
特殊范数的三角不等性
- ℓ2-范数需要使用柯西-施瓦茨不等式
∣∣x+y∣∣22=⟨x+y,x+y⟩=⟨x,x⟩+⟨x,y⟩+⟨y,x⟩+⟨y,y⟩=∣∣x∣∣22+2⟨x,y⟩+∣∣y∣∣22≤∣∣x∣∣22+2∣∣x∣∣2∣∣y∣∣2+∣∣y∣∣22=(∣∣x∣∣2+∣∣y∣∣2)2
(i=1∑n∣xi+yi∣p)p1≤(i=1∑n∣xi∣p)p1+(i=1∑n∣yi∣p)p1,p≥1,x,y∈Rn
Chapter4
证明一个函数是凸函数(考了复合函数,做不出来)
证明:
f(αx+(1−α)y)≤αf(x)+(1−α)f(y),∀x,y∈Ω,α∈R,0≤α≤1
证明引理(好像是附加题,反正做不到)
可微函数f是凸函数的充要条件:
f(y)≥f(x)+⟨∇f(x),y−x⟩,∀x,y
n=1(一维情况)
可微函数f是凸函数是式子的充分条件:
根据函数f是凸函数可得:
f(x+t(y−x))=f((1−t)x+ty)≤(1−t)f(x)+tf(y)
上式两端同除t可得:
f(y)≥f(x)+tf(x+t(y−x))−f(x)
令t→0,得证(得到式子)
可微函数f是凸函数是式子的必要条件:
令z=αx+(1−α)x,0≤α≤1,根据式子可得:
f(x)≥f(z)+f′(z)(x−z), f(y)≥f(z)+f′(z)(y−z)
将第一个不等式乘以α,第二个不等式乘以1−α,并将两者相加即可得:
αf(x)+(1−α)f(y)≥f(z)
即可得到函数f是凸的
n>1(一般情况)
令
g(t)=f(ty+(1−t)x),g′(t)=∇f(ty+(1−t)x)T(y−x)
可微函数f是凸函数是式子的充分条件:
由于函数f是凸的,所以函数g是凸的。满足
g(1)≥g(0)+g′(0)(1−0)
即
f(y)≥f(x)+∇f(x)T(y−x)
可微函数f是凸函数是式子的必要条件:
令ty+(1−t)x∈domf,tˉy+(1−tˉ)x∈domf,根据式子可得:
f(ty+(1−t)x)≥f(tˉy+(1−tˉ)x)+∇f(tˉy+(1−tˉ)x)T(y−x)(t−tˉ)
即g(t)≥g(tˉ)+g′(tˉ)(t−tˉ),说明函数g是凸的
Chapter5
标准正交分解
a1,⋯,an是n维向量的一个标准正交基,对于任意n维向量x:
x=(a1Tx)a1+⋯+(anTx)an
则称其为x在标准正交基下的标准正交分解
Gram-Schmidt(正交化)算法(考了)
反复操作直到i=n
qi~=ai−(q1Tai)q1−⋯−(qi−1Tai)qi−1
qi=∣∣qi~∣∣2qi~
Chapter6
主要是矩阵运算,注意定义与维度以及有时需要将矩阵拆成向量进行运算即可
Chapter7
是否存在左逆(考了)
若矩阵A的列向量线性无关(先看维度),则存在左逆:
A+=(ATA)−1AT
使得
A+A=(ATA)−1ATA=(ATA)−1(ATA)=I
是否存在右逆(考了)
若矩阵A的行向量线性无关(先看维度),则存在右逆:
A†=AT(AAT)−1
使得
AA†=AAT(AAT)−1=(AAT)−1(AAT)=I
是否存在逆(考了)
存在左逆(或右逆),若矩阵为方阵,则存在逆矩阵
Chapter8
判断是否为正交矩阵(算考了)
矩阵A需满足:
ATA=IA是方的}⇒AAT=I
Chapter9
QR分解(考了)
如果矩阵A∈Rm×n的列向量线性无关,则可以分解为一组标准正交向量Q与上三角矩阵R
A=[a1a2⋯an]=[q1q2⋯qn]⎣⎢⎢⎢⎢⎡R110⋮0R12R22⋮0⋯⋯⋱⋯R1nR2n⋮Rnn⎦⎥⎥⎥⎥⎤=QR
Gram-Schmidt正交化
qi~=a−(q1Tai)q1−⋯−(qi−1Tai)qi−1
Rji=(qjTai)
一般要求Rii>0使得Q和R是唯一的
使用QR分解求逆(考了)
具有线性无关列向量的矩阵A的伪逆为
A+=(ATA)−1AT
将A的伪逆表示为QR因子:
A+=((QR)T(QR))−1(QR)T=(RTQTQR)−1RTQT=(RTR)−1RTQT=R−1R−TRTQT=R−1QT
对于方阵非奇异矩阵A,其逆为:
A−1=(QR)−1=R−1QT
矩阵R为上三角矩阵,设x=R−1,使用前向回代法求解xR=I或使用后向回代法求解Rx=I
Chapter10
LU分解(可能考了,但我没用)
L为上三角矩阵且对角线元素全为1,U为上三角矩阵
A=LU
- 矩阵U的第一行元素:
u1j=a1j,j=1,⋯,n
- 矩阵L的第一列元素:
li1=u11ai1,i=2,3,⋯,n
从r=2开始直到r=n
- 矩阵U第r行主对角线以右元素urj
urj=arj−k=1∑r−1lrkukj,j=r,⋯,n
- 矩阵L第r列主对角线以下元素lir
lir=(air−k=1∑r−1likukr)/urr,i=r+1,⋯,n
LU分解求解方程组
例:
⎝⎜⎜⎜⎛2−31410−42140−1239−313−4−13⎠⎟⎟⎟⎞⎝⎜⎜⎜⎛x1x2x3x4⎠⎟⎟⎟⎞=⎝⎜⎜⎜⎛105−27⎠⎟⎟⎟⎞
解:
对矩阵A进行LU分解:
A=⎝⎜⎜⎜⎛2−31410−42140−1239−313−4−13⎠⎟⎟⎟⎞
L=⎝⎜⎜⎜⎛1−2321201−113−116001−90001⎠⎟⎟⎟⎞, U=⎝⎜⎜⎜⎛20001011000−12−1130−3217−112−4⎠⎟⎟⎟⎞
前向回代法求解y:
LUx=Ly=b=⎝⎜⎜⎜⎛105−27⎠⎟⎟⎟⎞⇒y=⎝⎜⎜⎜⎛1020−1117−16⎠⎟⎟⎟⎞
后向回代法求解x:
Ux=y⇒x=⎝⎜⎜⎜⎛1234⎠⎟⎟⎟⎞
Chapter11
最小二乘法的性质(考了,跟投影一起考)
要求:
x^=xargmin∣∣Ax−b∣∣22
当矩阵A列线性无关时,有
ATAx^=ATb
不能直接得出x^=A−1b,A很多时候不可右逆(因为可能是高矩阵):
x^=A+b=(ATA)−1ATb
QR分解求解正规方程(考了)
若矩阵A列向量线性无关,则最小二乘法问题的解:
x^=(ATA)−1ATb=(RTQTQR)−1RTQTb=(RTR)−1RTQTb=R−1QTb
可能会用式子x^=R−1QTb进行计算
流程:
-
对矩阵A进行QR分解
-
计算矩阵向量乘积d=QTb
-
通过回代法求解Rx=d
Chapter13
KKT条件(利润最大化)(考了等式约束)
如果是max的话,式子化为g(x)≤0的形式,min的话式子化为g(x)≥0,拉格朗日函数用减号:−
x1,x2max{40x1+50x2}s.t.x1+2x2≤40,4x1+3x2≤120,x1≥0,x2≥0
构造f(x)与g(x)(注意g(x)≤0):
x=[x1x2],xmax{f(x)=40x1+50x2}s.t.g1(x)=x1+2x2−40≤0,g2(x)=4x1+3x2−120≤0,g3(x)=−x1≤0,g4(x)=−x2≤0
引入拉格朗日函数:
L(x,u)=f(x)−u1g1(x)−u2g2(x)−u3g3(x)−u4g4(x)
对拉格朗日函数求偏导:
∇xL(x,u)=∇xf(x)−u1∇xg1(x)−u2∇xg2(x)−u3∇xg3(x)−u4∇xg4(x)=0,uj≥0∇xf(x)=[4050],∇xg1(x)=[12],∇xg2(x)=[43],∇xg3(x)=[−10],∇xg4(x)=[0−1]
对x求偏导,得到KKT方程组:
⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧∂x1∂L=40−u1−4u2+u3=0∂x2∂L=50−2u1−3u2+u4=0x1+2x2−40≤04x1+3x2−120≤0−x1≤0−x2≤0uj=1,2,3,4≥0∑j=1,2,3,4ujgj(x)=0
讨论可能取值(点击展开)
讨论可能的取值:
- 当u1=0,u2=u3=u4=0时,有
{∂x1∂L=40−u1=0∂x2∂L=50−2u1=0
无解,当满足其中一条式子时另外一条不满足
- 当u2=0,u1=u3=u4=0时,有
{∂x1∂L=40−4u2=0∂x2∂L=50−3u2=0
无解,当满足其中一条式子时另外一条不满足
- 当u3=0,u1=u2=u4=0时,有
40+u3=0
无解
- 当u4=0,u1=u2=u3=0时,有
50+u4=0
无解
- 当u1=0,u2=0,u3=u4=0,有
{∂x1∂L=40−u1−4u2=0∂x2∂L=50−2u1−3u2=0
解得
{u1=16u2=6
此时g1(x)=g2(x)=0,解得
{x1=24x2=8
将解代入KKT条件进行验证,该解可以成立
- 当u1=0,u3=0,u2=u4=0,有
{∂x1∂L=40−u1+u3=0∂x2∂L=50−2u1=0
解得
{u1=25u3=−15
舍去
- 当u1=0,u4=0,u2=u3=0,有
{∂x1∂L=40−u1=0∂x2∂L=50−2u1+u4=0
解得
{u1=40u4=30
此时g1(x)=0,g4(x)=0,解得
{x1=40x2=0
将解代入KKT条件验证,不满足所有KKT条件(g2(x)=4x1+3x2−120≰0),舍去
- 当u2=0,u3=0,u1=u4=0
{∂x1∂L=40−4u2+u3=0∂x2∂L=50−3u2=0
解得
{u2=350u3=380
此时g2(x)=g3(x)=0,解得
{x1=0x2=40
将解代入KKT条件验证,不满足所有KKT条件(g1(x)=x1+2x2−40≰0),舍去
- 当u2=0,u4=0,u1=u3=0
{∂x1∂L=40−4u2=0∂x2∂L=50−3u2+u4=0
解得
{u2=10u4=−20
舍去
- 当u3=0,u4=0,u1=u2=0
{∂x1∂L=40+u3=0∂x2∂L=50+u4=0
显然无解
综上所述,只有一种情况满足条件
{x1=24x2=8,f(x)=40x1+50x2=1360
∴最优解为x1=24,x2=8,最大利润为1360
最小范数优化问题(考了)
一般为单个x,否则用y换元,一般系数不为21,以下仅为一般形式
xmin21∣∣x∣∣22s.t.Cx=d
矩阵C行向量线性无关,存在右逆C†,要求x^
引入拉格朗日函数:
L(x,λ)=21∣∣x∣∣22−λT(Cx−d)
对拉格朗日函数求偏导得到KKT条件:
{∇xL(x,λ)=x−CTλ=0∇λL(x,λ)=Cx−d=0
由矩阵C行向量线性无关可得:
Cx=CCTλ=d,λ=(CCT)−1d
则有:
x^=CTλ=CT(CCT)−1d=C†d
如果要求确切值需要进行对矩阵CT进行QR分解:
x^=CT(CCT)−1d=QR(RTQTQR)−1d=QR(RTR)−1d=QR−Td
回代法求解RTz=d,再计算x^=Qz