3.1 Linear Basis Function Models(PRML 系列----3.1.5 Multiple outputs)

落花浮王杯 提交于 2020-01-29 00:13:13
multiple, independent regression problems.

共享相同的基函数
在这里插入图片描述
在这里插入图片描述
ββ\beta求导可计算\beta估计值

多变量解耦:原因在于W(MK)W(M*K)只定义了高斯噪声的输出,只考虑单变量即可

在这里插入图片描述
WWKK个变量之间的协方差解偶证明
在这里插入图片描述p(tx,W,β)=N(tWTϕ(x),β1I)p(\mathbf{t} | \mathbf{x}, \mathbf{W}, \beta)=\mathcal{N}\left(\mathbf{t} | \mathbf{W}^{\mathrm{T}} \boldsymbol{\phi}(\mathbf{x}), \beta^{-1} \mathbf{I}\right) ,tKWTϕ(x)对于单个样本来说,上面式子中\mathbf{t}表示K个变量,其均值\mathbf{W}^{\mathrm{T}} \boldsymbol{\phi}(\mathbf{x})K, 为K维向量,协方差矩阵为对角阵,说明变量之间相互独立
在这里插入图片描述

简单证明如下

dA=tr(AdA),AA=(A)T=A(A1)T,A=Σ=用到的公式:d|A|=tr(A^*dA),\frac{\partial{\mathbf{|A|}}}{\partial\mathbf{A}}=(A^*)^T=|A|(A^{-1})^T,特别当A=\Sigma为对称矩阵时,行列式对矩阵的导数=行列式*矩阵的逆
AA1=IAA ^{-1}=\mathrm{I}dAA1+AdA1=0dAA ^{-1}+AdA^{-1}=\mathrm{0}dA1=A1dAA1dA^{-1}=-A^{-1}dAA ^{-1}
有了以上公式对下式中的Σ\mathbf\Sigma求导
lnL(W,Σ)=N2lnΣ12n=1N(tnWTϕ(xn))TΣ1(tnWTϕ(xn))\ln L(\mathbf{W}, \mathbf{\Sigma})=-\frac{N}{2} \ln |\mathbf{\Sigma}|-\frac{1}{2} \sum_{n=1}^{N}\left(\mathbf{t}_{n}-\mathbf{W}^{\mathrm{T}} \boldsymbol{\phi}\left(\mathbf{x}_{n}\right)\right)^{\mathrm{T}} \mathbf{\Sigma}^{-1}\left(\mathbf{t}_{n}-\mathbf{W}^{\mathrm{T}} \boldsymbol{\phi}\left(\mathbf{x}_{n}\right)\right)

A=(tnWTϕ(xn))令A=(\mathbf{t}_n-\mathbf{W}^{\mathrm{T}}\boldsymbol{\phi(\mathbf{x}_n)})
f=ATΣ1Af=A^{\mathrm{T}}\mathbf{\Sigma}^{-1}Adf=ATdΣ1A=tr(ATdΣ1A)=tr(AATdΣ1)df=A^{\mathrm{T}}d\mathbf{\Sigma}^{-1}A=tr(A^{\mathrm{T}}d\mathbf{\Sigma}^{-1}A)=tr(AA^{\mathrm{T}}d\mathbf{\Sigma}^{-1})=tr(AATΣ1dΣΣ1)=tr(Σ1AATΣ1dΣ)=-tr(AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}d\mathbf{\Sigma}\mathbf{\Sigma}^{-1})=-tr(\mathbf{\Sigma}^{-1}AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}d\mathbf{\Sigma})fΣ=Σ1AATΣ1\frac{\partial f}{\partial \mathbf{\Sigma}}=-\mathbf{\Sigma}^{-1}AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}
因此有:
N2Σ1+12n=1NΣ1AATΣ1=0-\frac{N}{2}\mathbf{\Sigma}^{-1}+\frac{1}{2}\sum_{n=1}^{N}\mathbf{\Sigma}^{-1}AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}=0n=1NΣ1+n=1NΣ1AATΣ1=0\sum_{n=1}^{N}\mathbf{\Sigma}^{-1}+\sum_{n=1}^{N}\mathbf{\Sigma}^{-1}AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}=0n=1NΣ1(IAATΣ1)=0-\sum_{n=1}^{N}\mathbf{\Sigma}^{-1}(\mathrm I-AA^{\mathrm{T}}\mathbf{\Sigma}^{-1})=0n=1N(IAATΣ1)=0\sum_{n=1}^{N}(\mathrm I-AA^{\mathrm{T}}\mathbf{\Sigma}^{-1})=0NI=n=1NAATΣ1N\mathrm I=\sum_{n=1}^{N}AA^{\mathrm{T}}\mathbf{\Sigma}^{-1}Σ=1Nn=1NAAT\mathbf{\Sigma}=\frac{1}{N}\sum_{n=1}^{N}AA^{\mathrm{T}}

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!