最优估计理论方法
1. 最小二乘估计
假设估计量是t维未知的参数向量X,观测向量为n×1L(n>t),其观测误差(或称为噪声)向量为n×1Δ,观测方程为:
L=BX+Δ
其中,n×tB的秩rk(B)=t,E(Δ)=0,D(Δ)=DΔ,设X的估计值为X^,则有:
V=BX^−L
所谓最小二乘估计,就是要求估计值x^使得下列二次型达到最小值,即:
Ψ(X^)=VTPV=(BX^−L)TP(BX^−L)=min
其中,n×nP是一个适当选取的对称正定常数矩阵,X^称为X的最小二乘估值,记为X^LS或者X^LS(L)。
当参数X的各个分量Xi之间没有确定的函数关系,即他们是函数独立的参数时,可将Ψ(X^)对X^求自由极值,令其一阶导数为零,得:
∂X^∂ψ(X^)=2VTP∂X^∂V=2VTPB=0
转置后,得:
BTPV=BTP(BX^−L)=0
或:
BTPBX^=BTPL
解得:
X^=(BTPB)−1BTPL
又因为:
∂X^2∂2ψ(X^)=2BTPB>0
所以X^使得Ψ(X^)达到极小值。
最小二乘估计量X^的估计误差为:
ΔX^=X−X^=X−(BTPB)−1BTP(BX+Δ)=−(BTPB)−1BTPΔ
由此按照协方差传播定律可得X^的误差方差阵为:
D(ΔX^)=(BTPB)−1BTPDΔPB(BTPB)−1
将对称正定阵DΔ表示为DΔ=RTR(R为可逆矩阵),并令:
a=BTR−1b=RPB(BTPB)−1
则有:
ab=BTR−1RPB(BTPB)−1=E
且由矩阵形许瓦茨不等式可得:
D(Δx)=bTb⩾(ab)T(aaT)−1(ab)=(aaT)−1
即:
D(Δx^)=(BTPB)−1BTPDΔPB(BTPB)−1⩾(BTDΔ−1B)−1
只有当P=PΔ=DΔ−1或者P=PΔ=DΔ−1σ02(σ02为常数时),上列才去等号,而使X^的误差方差阵达到最小,此时有:
D(ΔX^)=Var(ΔX^)=(BTDΔ−1B)−1=(BTPB)−1σ02
有时将P取为DΔ−1或DΔ−1σ02时的估计称为马尔科夫估计,此时可以将:
Ψ(X^)=VTPV=(BX^−L)TP(BX^−L)=min
表达为:
VTPΔV=min
可以看到,最小二乘估计具有如下性质:
-
最小二乘估计是一种线性估计,即X的估计量是X^LS观测值的线性函数。
-
当观测误差的数学期望为E(Δ)=0时,因E(L)=BX,所以有:
E(X^LS)=(BTPB)−1BTPE(L)=(BTPB)−1BTPBX=X
即X^LS具有无偏性。
-
当观测误差的方差阵为DΔ,而取P=DΔ−1或者P=DΔ−1σ02时,X^LS的误差方差阵达到最小值。
-
最小二乘估计不需要X的任何先验统计信息,当X是非随机量,或X虽然是随机量,但完全不考虑其先验统计信息时,按照误差传播定律可知:
DLDX^LS=DΔ=D(ΔX^LS)