最优估计理论方法

最优估计理论方法

1. 最小二乘估计

假设估计量是tt维未知的参数向量XX,观测向量为Ln×1(n>t)\underset{n\times1}{L}(n>t),其观测误差(或称为噪声)向量为Δn×1\underset{n\times1}{\Delta},观测方程为:

L=BX+ΔL=BX + \Delta

其中,Bn×t\underset{n \times t}{B}的秩rk(B)=t,E(Δ)=0,D(Δ)=DΔrk(B)=t,E(\Delta)=0,D(\Delta)=D_{\Delta},设XX的估计值为X^\hat{X},则有:

V=BX^LV=B \hat{X}-L

所谓最小二乘估计,就是要求估计值x^\hat{x}使得下列二次型达到最小值,即:

Ψ(X^)=VTPV=(BX^L)TP(BX^L)=min\Psi(\hat{X})=V^TPV=(B\hat{X}-L)^TP(B\hat{X}-L)=min

其中,Pn×n\underset{n \times n}{P}是一个适当选取的对称正定常数矩阵,X^\hat{X}称为XX的最小二乘估值,记为X^LS\hat{X}_{LS}或者X^LS(L)\hat{X}_{LS}(L)

当参数XX的各个分量XiX_i之间没有确定的函数关系,即他们是函数独立的参数时,可将Ψ(X^)\Psi(\hat{X})X^\hat{X}求自由极值,令其一阶导数为零,得:

ψ(X^)X^=2VTPVX^=2VTPB=0\frac{\partial\psi\left(\hat{X}\right)}{\partial\hat{X}}=2V^{\mathrm{T}}P\frac{\partial V}{\partial\hat{X}}=2V^{\mathrm{T}}PB=0

转置后,得:

BTPV=BTP(BX^L)=0B^TPV=B^TP(B\hat{X}-L)=0

或:

BTPBX^=BTPLB^TPB\hat{X}=B^TPL

解得:

X^=(BTPB)1BTPL\hat{X}=(B^TPB)^{-1}B^TPL

又因为:

2ψ(X^)X^2=2BTPB>0\frac{\partial^{2}\psi\left(\hat{X}\right)}{\partial\hat{X}^{2}}=2B^{\mathrm{T}}PB>0

所以X^\hat{X}使得Ψ(X^)\Psi(\hat{X})达到极小值。

最小二乘估计量X^\hat{X}的估计误差为:

ΔX^=XX^=X(BTPB)1BTP(BX+Δ)=(BTPB)1BTPΔ\Delta_{\hat{X}} = X - \hat{X} = X - ( B^{\mathrm{T}}PB )^{-1}B^{\mathrm{T}}P( BX + \Delta ) = - ( B^{\mathrm{T}}PB )^{-1}B^{\mathrm{T}}P\Delta

由此按照协方差传播定律可得X^\hat{X}的误差方差阵为:

D(ΔX^)=(BTPB)1BTPDΔPB(BTPB)1D\left(\Delta_{\hat{X}}\right)=\left(B^{\mathrm{T}}PB\right)^{-1}B^{\mathrm{T}}PD_{\Delta}PB\left(B^{\mathrm{T}}PB\right)^{-1}

将对称正定阵DΔD_{\Delta}表示为DΔ=RTRD_{\Delta}=R^T RRR为可逆矩阵),并令:

a=BTR1b=RPB(BTPB)1\begin{aligned}&a=B^{T}R^{-1}\\&b=RPB\left(B^{T}PB\right)^{-1}\end{aligned}

则有:

ab=BTR1RPB(BTPB)1=Eab=B^{T}R^{-1}RPB\left(B^{T}PB\right)^{-1}=E

且由矩阵形许瓦茨不等式可得:

D(Δx^)=bTb(ab)T(aaT)1(ab)=(aaT)1D\left(\Delta_{\widehat{x}}\right)=b^{\mathrm{T}}b\geqslant\left(ab\right)^{\mathrm{T}}\left(aa^{\mathrm{T}}\right)^{-1}\left(ab\right)=\left(aa^{\mathrm{T}}\right)^{-1}

即:

D(Δx^)=(BTPB)1BTPDΔPB(BTPB)1(BTDΔ1B)1D\left(\Delta_{\hat{x}}\right)=\left(B^{\mathrm{T}}PB\right)^{-1}B^{\mathrm{T}}PD_{\Delta}PB\left(B^{\mathrm{T}}PB\right)^{-1}\geqslant\left(B^{\mathrm{T}}D_{\Delta}^{-1}B\right)^{-1}

只有当P=PΔ=DΔ1P=P_{\Delta}=D_{\Delta}^{-1}或者P=PΔ=DΔ1σ02P=P_{\Delta}=D_{\Delta}^{-1}\sigma_{0}^{2}σ02\sigma_{0}^{2}为常数时),上列才去等号,而使X^\hat{X}的误差方差阵达到最小,此时有:

D(ΔX^)=Var(ΔX^)=(BTDΔ1B)1=(BTPB)1σ02D\left(\Delta_{\hat{X}}\right)=\mathrm{Var}\left(\Delta_{\hat{X}}\right)=\left(B^{\mathrm{T}}D_{\Delta}^{-1}B\right)^{-1}=\left(B^{\mathrm{T}}PB\right)^{-1}\sigma_{0}^{2}

有时将PP取为DΔ1D_{\Delta}^{-1}DΔ1σ02D_{\Delta}^{-1}\sigma_{0}^{2}时的估计称为马尔科夫估计,此时可以将:

Ψ(X^)=VTPV=(BX^L)TP(BX^L)=min\Psi(\hat{X})=V^TPV=(B\hat{X}-L)^TP(B\hat{X}-L)=min

表达为:

VTPΔV=minV^TP_{\Delta}V=min

可以看到,最小二乘估计具有如下性质:

  1. 最小二乘估计是一种线性估计,即XX的估计量是X^LS\hat{X}_{LS}观测值的线性函数。

  2. 当观测误差的数学期望为E(Δ)=0E(\Delta)=0时,因E(L)=BXE(L)=BX,所以有:

    E(X^LS)=(BTPB)1BTPE(L)=(BTPB)1BTPBX=XE\left(\hat{X}_{LS}\right)=\left(B^{T}PB\right)^{-1}B^{T}PE\left(L\right)=\left(B^{T}PB\right)^{-1}B^{T}PBX=X

X^LS\hat{X}_{LS}具有无偏性。

  1. 当观测误差的方差阵为DΔD_{\Delta},而取P=DΔ1P=D_{\Delta}^{-1}或者P=DΔ1σ02P=D_{\Delta}^{-1}\sigma_{0}^{2}时,X^LS\hat{X}_{LS}的误差方差阵达到最小值。

  2. 最小二乘估计不需要XX的任何先验统计信息,当XX是非随机量,或XX虽然是随机量,但完全不考虑其先验统计信息时,按照误差传播定律可知:

    DL=DΔDX^LS=D(ΔX^LS)\begin{aligned}D_{L}&=D_{\Delta}\\D_{\hat{X}_{LS}}&=D(\Delta\hat{X}_{LS})\end{aligned}


最优估计理论方法
https://hjiande.github.io/2024/10/29/科研-0002-最优估计理论方法/
作者
jdhuang
发布于
2024年10月29日
许可协议