习题与习题解答6.1
1.从一批电子元件中抽取8个进行寿命测试,得到如下数据(单位:h):
1 050, 1 100, 1 130, 1 040, 1 250, 1 300, 1 200, 1 080
试对这批元件的平均寿命以及分布的标准差给出矩估计。
解:样本均值 x1050110113010801143.75
818样本标准差 s(xix)2 7i11(10501143.75)2(10801143.75)296.0562 7因此,元件的平均寿命和寿命分布的标准差的矩估计分别为1143。75和96.0562
2. 设总体X~U(0,),现从该总体中抽取容量为10的样本,样本值为
0。5,1.3,0。6,1.7,2.2,1.2,0。8,1。5,2.0,1.6
试对参数给出矩估计.
解:由于E(X)=2,即=2E(X),而样本均值x0.51.31.6=1.34,故的矩
10ˆ2x2.68 估计为3. 设总体分布列如下,x1,xn是样本,试求未知参数的矩估计
1,k0,1,2,,N1,N(正整数)是未知参数; N(2)P(Xk)(k1)2(1)k2,k2,3,,01.(1)P(Xk)解:(1) 总体均值E(X)=
01N1N1,解之可得N=2E(X)+1
N2ˆ2x1,其中x为样本均值,若2x不是整数,可取大于2x的最小整故N的矩估计量N数代替2x.
(2) 总体均值E(X)=
k(k1)k22(1)k22k(k1)(1)k2k2,由于
k(k1)(1)k2k223,
故有E(X)2232,即2ˆ2. ,从而参数的 矩估计为E(X)x4.设总体密度函数如下,x1,,xn是样本,试求未知参数的矩估计
(1)p(x;)(x),0x,0;2(2)p(x;)(1)x,0x1,0;(3)p(x;)x(4)p(x;,)112,0x1,0;,x,0.
xe解:(1) 总体均值E(X)=
20x(x)dx22201即即3E(X),(xx2)dx,3ˆ3x. 故参数的矩估计为(2)总体均值E(X)=
10x(1)xdx=
12E(X)1,所以,从而参数的矩估计
E(X)12ˆ12x. x1E(X)1dx=(3)由E(X)=xx可得1E(X),由此,参数的矩估计0112xˆ.
1x(4)先计算总体均值与方差
E(X)=
xtt2xe1dx=tedt+0110edt=
E(X)==
2xt2211exdx=(t)021tedt
220edt+2tedt+0t1t10edt=2222.
t2Var(X)=E(X)(E(X))=
2由此可以推出Var(X),E(X)Var(X),从而参数,的矩估计为
ˆxs. ˆs,5.设总体为N(,1),先对该总体观测n次,发现有k次观测为正,使用频率替换方法
求的矩估计。
解:由题意知,观测为正的频率f=
k,下面计算观测值为正的概率。当总体为N(,1)n时,P(X〉0)=1-P(X〈0)=1—P(X—<—)=()其中为标准正态分布的分布函数。
ˆ)利用频率替换概率的方法有(譬如,若设得
kkˆ1uk ,这给出参数的矩估计为nnnkˆ是标准正态分布的分布的0。281分位数,查表=0。281,则由上式知nˆu0.281=—0。58 6.甲、乙两个校对员彼此对同一本书的样稿进行校对,校完后,甲发现a个错字,乙发现b个错字,其同发现的错字有c个,试用矩法给出如下两个未知参数的估计: (1) 该书样稿的总错字个数; (2) 未被发现的错字数。
解 (1)设该书样稿中总错字的个数为,甲校对员识别出错字的概率为p1,乙校对员识别出错字的概率为p2,由于甲,乙是彼此地进行校对,则同一错字能被识别的概率为
ˆ1p1p2,根据频率替换思想有 paˆ2,pb,由性可得矩法方程
abc,解之得
ˆab。 c(2) 未被发现的错字估计等于总错字数的估计减去甲,乙发现的错字数,即
ababc. cˆ譬如,若设a=120,b=124,c=80,则该书样稿中错字总数的矩法估计而未被发现的错字个数的矩法估计为186—120—124+80=22个。
7.设总体概率函数如下,x1,,xn是样本,试求未知参数得最大似然估计。 (1)p(x;)120124186,
80x1,0x1,0;
,xc,c0已知,>1
n(2)p(x;)cx(1)解 (1)似然函数为L()()(x1,,xn)1,其对数似然函数为
lnL()nln(1)(lnx12lnxn)
将lnL()关于求导并令其为0即得到似然方程
lnL()n(lnx12ˆ(1lnx)2 解之得 ini1由于
nlnxn)120
2lnL()nlnxi(lnx)4n222432i3ˆˆ40
ˆ是 的最大似然估计. 所以nn(2)似然函数为L()c(x1xn)(1),其对数似然函数为
lnL()nlnnlnc(1)(lnx1解之可得
lnxn)
1ˆ(LnxiInc)1
ni1n2InL()n20,这说明ˆ是的最大似然估计。 由于
8.设总体概率函数如下,x1,,xn是样本,试求未知参数的最大似然估计. (1)p(x;)cx(2p(x;,)c(c1),x,0,c0已知;
1ex,x,0;
1(3)p(x;)(k)(k),x(k1),0 解:(1)样本x1,,xn的似然函数为
L()cnnc(x1xn)(c1)Ixnc(1)}
nc要使L()达到最大,首先示性函数应为1,其次是尽可能大.由于c>0,故是的
单调增函数,所以 的取值应尽可能大,但示性函数的存在决定了 的取值不能大于x(1),由此给出的最大似然估计为x(1)
1n(2)此处的似然函数为 L()()exp(xi),x(1)
i11n其对数似然函数为 lnL(,)nln由于
(x)ii1n
lnL(,)n0
所以,lnL(,)是的单调增函数,要使其最大,的取值应该尽可能的大,由于
ˆx(1)。 x(1),这给出的最大似然估计为将lnL(,) 关于 求导并令其为0得到关于 的似然方程
(xi)lnL(,)ni120 ,
ˆ解之得 ˆ)(xii1nnnˆx(1). x(3)似然函数为
L()(k)nIx(1)x(n)(k1).
由于L(k)n是关于的单调递减函数,要使L达到最大,应尽可能小,但由x(1)x(n)(k1)可以得到
x(n)k1x(1),这说明不能小于
x(n)k1,因而的最大似然
x(n)ˆ估计为。
k19.设总体概率函数如下,x1,(1)px;,xn是样本,试求未知参数的最大似然估计。
12ex/,0;
(2)px;1,1/2x1/2; (3)px;1,21,x2.
211n1解:(1)不难写出似然函数为 L2ei1xin。
对数似然函数为 lnLnln2|x|ii1n.
n|xi|lnLni120, 将之关于求导并令其为0得到似然方程
ˆ|x|ii1n解之可得 而:
n.
2lnL()n2|xi|n222(|x|)2ˆˆi20,
ˆ是的最大似然估计 故(2) 此处的似然函数为 LI11x(1)x(n)22。
它只有两个取值:0和1,为使得似然函数取1,的取值范围应是x(n)11x(1),因而22的最大似然估计ˆ可取(x(n),x(1))中的任意值。
(3) 由条件,似然函数为
1212L1I.
(21)n1x(1)x(2)2要使L尽量大,首先示性函数应为1,这说明1x(1)x(2)2;其次21要尽量小,综上可知,1的最大似然估计应为x(1),2的最大似然估计应为x(n).
10.一地质学家为研究密歇根湖的湖滩地区的岩石成分,随机地自该地区取100个样品,每个样品有10块石子,记录了每个样品中属石灰石的石子数。假设这100次观察相互,求这地区石子中石灰石的比例的最大似然估计.该地质学家所得的数据如下
样本中的石子数 样品个数 0 0 1 1 2 6 3 7 4 23 5 26 6 21 7 12 8 3 9 1 10 0 解:本题中,总体X为样品中石灰石的个数,且X服从参数(10,p)为的二项分布,即
10x10xp(Xx)xp(1p).
又设x1,x2,,x100为样本,则其似然函数为(忽略常数)
L(p)p对数似然函数为
i1100xi10100(1p)xii1100,
lnL(p)xilnp(10100xi)ln(1p)
i1i1100100将对数似然函数关于p求导并令其为0得到似然方程
lnL(p)p解之得
i1xip10010100i1xi1p1000,
p由于
xi1100i1000
xi1000xiln2L(p)i1i10 222pp(1p)由二阶导数的性质知,p的最大似然估计为
100i11001000pxi10004990.499 100011. 在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为
mxmnp(1p)np(Xx;p),x1,2,,m. m1(1p)若已知,m2,x1,x2,,xn是样本,试求p的最大似然估计。
解:当m=2时,该截尾二项分布只能取1与2,不妨设x1,x2,,xn的样本中有n1个xi为1,有n—n1个2则其似然函数为(忽略常数)
pn1(1p)n1p2(nn1)p2nn1(1p)n1pnn1(1p)n1L(p), 2n2nn(1(1p))(1(1p))(2p)对数似然函数为
lnL()(nn1)lnpn1ln(1p)nln(2p).
将对数似然函数关于p求导并令其为0得到似然方程
nn1nn10. p1p2p解之得
2(nn1)2(x1)p.
2nn1x后一个等式是由于
xi1nin12(nn1)nx,所以n12nnx,代入上式即得.
12.已知在文学家箫伯纳的An Intelligent Woman's Guide To Socialism 一书中,一个句子的单词数X近似地服从对数正态分布,即ZlnX~N(,)。今从该书中随机地取20个句子,这些句子中的单词数分别为
52 24 15 67 15 22 63 26 16 32 7 33 28 14 7 29 10 6 59 30
2求该书中一个句子单词数均值E(X)2e22的最大似然估计。
解:正态分布N(,)的参数的最大似然估计分别为样本均值和方差。即
1201n2ˆˆ(lnxi3.00)20.5081. lnxi3.00, 20i1ni1由于最大似然估计具有不变性,因而E(X)e22的最大似然估计为
E(X)e3.000.5081228.3053.
13.设x1,xn是来自对数级数分布
1pkP(Xk),0p1;k1,2,ln(1p)k的一个样本,求参数p的矩估计。
解:由于
1pEXkP(Xk)pk. ln(1p)k1(1p)ln(1p)k11pEXkp(Xk)kpk, 2ln(1p)k1(1p)ln(1p)k122xiEXˆ因此有1p,从而得到p的矩估计p1。 2xEX2i14.一个罐子里装有黑球个百球,有放回地抽取一个容量为n的样本,其中 有k个百球,求罐子里黑球和白球数之比R的最大似然估计.
解法1:记p为罐子中白球的比例,令xi表示第i次有放回抽样所得的白球数,则
ˆx。 xi~b(1,p),i1,2,,n,故p的最大似然估计为p因为黑球数与白球数比值Rn(1p)1p.根据最大似然估计的不变性,有 npp1p1xR,
pxnk对具体的样本值即n个抽到k个白球来讲,R的最大似然估计为R。
k解法2:设罐子里有白球l个,则有黑球Rl个,从而罐子有(1+R)l个球,从中有放回的抽一个球为白球的概率为
l1
(1R)l1R从罐子中有放回的抽 n个球,可视为从二点分布
X p 0(黑球) 1(白球) R 1Rknk1 1R中抽取一个样本容量为n的样本.当样本中有k个白球时,似然函数为
1RL(R)=1R1R其对数似然函数为
Rnk, n(1R)lnL(R)=(n-k)lnR—nln(1+R),
将对数似然函数对R求导,并令其为0,得似然方程
nkn0 R1R解之可得R=
n1.由于其对数似然函数的二阶导数为 k2lnR(nk)n0, 222RR(1R)所以R=
n1是R的最大似然估计. k1014,即罐中黑球数与白球数之比2譬如,在n=10,k=2场合,R的最大似然估计R=
的最大似然估计为4,若白球1个,黑球为4个;或者白球2个,黑球8个等。
15.设x1,,xm和y1,,yn分别来自总体N(1,2)和N(2,2)的两个样本。
2试求(1,2,)的最大似然估计。
解:合样本的似然函数为
11n1m22L=exp(x)(y), i1i222mn2i1(2)2i1对数似然函数为
mn1n1m22ln22(xi1)2(yi2)2。 lnL=-22i12i1将对数似然函数对1,2,分别求导并令其为0,得,
2l1ˆ1lˆ1)0, (xi2i1mˆ2)0 (yiˆ2i1nl2ˆ1,ˆ2,ˆ2nmn1m22ˆˆ[(x)(y)i1i1]0, 24ˆˆi122i1由此得到1,2,2的最大似然估计为
ˆ1x ˆ2yˆ2(xx)(yy)2iii1i1mn2mn.
16.某批产品含有N件,其中M件为不合格品,现从中随机抽取n件中有x 件不合格品,则x服从超几何分布,即
MNMxnx,
P(Xx)Nnx1,2,,min(M,n)
假如N与n已知,寻求该批产品中不合格品数M的最大似然估计。
解:记未知参数M的似然函数L(M,x)=P(X=x)。考察似然比
ML(M1,x)L(M,x)L(M1,x)L(M,x)1NxMxnNnMxMx1M1NMnM1xNMx
由要使似然比
1得 ,必然导致 (M+1)(N—M-n+x)(M+1—x)(N-M)
化简此式可得Mx(Nn1)1defM0,这表明:当M0为整数和MM0时似然函数L
(M,x)是M的增函数,即
L(0,x)L(1,x)L(M0,x)L(M01,x) ()
类似地,要使似然比
L(M1,x)x1,必导致M(N1)1M0。这表明,当
L(M,x)nM0 为整数且MM0时,似然函数L(M,x)是M的减函数,即
L(M0,x)L(M0,1,x)L(M,x) ()
ˆM或M0+1,而比较(*)和(* *)可知,当M0是整数时,M的最大似然估计为M0ˆ[M1][(N1)],其中[a]为不超过a的最当M0不为整数时,M的最大似然估计为M0大整数,综合上述,M的最大似然估计为
xnxxn(N1)1或(N1),当(N1)为整数时,xnnˆ年M
xx[(N1)]当(N1)不为整数时,nn譬如,在N=19,n=15,x=2场合.M0=
x(N1)12/5*(191)17,由于M0为n整数,故M的最大似然估计为7或8.下面以实际计算加以佐证,几个L(M,2)=Pm(x=2)如下表所示:
M 6 7 8 9 10 L(M,2) 0。36 0.3973 0。3973 0.3715 0。3251 可见M取7或8可使似然函数达到最大.
又如,在N=16,n=5,x=2场合,M0=
x2(N+1)-1=(16+1)-1=5。8(不为整数),这时Mn5ˆ=[M0+1]=[5.8+1]=6。实际计算表明 的最大似然估计M
M 5 6 7 8 L(M,2) 0.3777 0。4121 0.4038 0.359 可见M取6可使似然函数达到最大.
§ 6。2 点估计的评价标准
内容概要
ˆ=ˆ(x1,…,xn)是的一个估计量,n是样本容量,1.相合性 设为未知参数,nn若对任何一个〉0,有
ˆ|)0,, limP(|nnˆ为参数的相合估计。 则称n• • •
相合性本质上就是按概率收敛,它是估计量的一个基本要求,即当样本量不断增大
时,相合估计按概率收敛于未知参数;
矩法估计一般都是相合估计;
在很一般的条件下,最大似然估计也是相合估计.
ˆ(x1,…,xn)是的一个估计,的参数空间为,若对,有 2.无偏性 设=nE(ˆ)
ˆ是的无偏估计,否则称为有偏估计。 则称ˆ),则称ˆ是的渐近无偏估计。 假如对任意的,有limE(n3.有效性 设ˆ1是ˆ2的两个无偏估计,如果对任意的有
Var(ˆ1)Var(ˆ2),
且至少有一个使得上述不等号严格成立,则称ˆ1比ˆ2有效。
ˆ是的一个估计(无偏的或有偏的)4.均方误差 设,则称
ˆ)MSE(ˆ)2E(ˆ)Var(ˆ))2 (E(ˆ不仅方差较小,而且偏差(Eˆ)也小,所以均方为的均方误差.均方误差较小意味着:误差是评价估计的最一般标准。
•使均方误差一致最小的估计量一般是不存在的,但两个估计好坏可用均方误差评价: •在无偏估计类中使均方误差最小就是使方差最小。
习题与解答6。2
ˆ为1.总体X~U(,2),其中0是未知参数,又x1,,xn为取自该总体的样本,x样本均值.
ˆ(1)证明2x是参数的无偏估计和相合估计; 3(2)求的最大似然估计,它是无偏估计吗?是相合估计吗?
23解:(1)总体X~U(,2),则E(X),Var(X),从而
12232E(x),Var(X).
212nˆ)于是,E(22E(x),这说明x是参数的无偏估计。进一步 33224ˆ)Var(0, 912n27nˆ也是的相合估计. 这就证明了(2)似然函数为L()(1)I(x(1)x(n)2),显然L()是的减函数,且的
n取值范围为
x(n)2x(1),因而的最大似然函数估计为
ˆmlex(n)2
ˆ的均值与方差,由于xn的密度函数为 下求mle
f(x)故E(x(n))2n(x)nn111nn0(x)n1, x2 (txn(x)n2dx2)t(n1)dtn12n1, n1E(x(n))2xnn(x)dx4n28n22(n2)(n1)
Var(x(2n))从而:
(nn22)(n1)2
ˆE1E(x(n))22n12(n1)(n)
ˆ不是的无偏估计,但它是的渐近无偏估计和相合估计。 所以mle2。设x1,x2, x3,是取自某总体的容量为3的样本,试征下列统计量都是该总体均值的无偏估计,在方差存在时指出哪一个估计的有效性最差?
11ˆ11(1)2x13x26x3
11ˆ21(2)3x13x23x3
12ˆ11(3)6x16x23x3
解:先求三个统计量的数学期望
11111ˆ1)1E(2Ex13Ex26Ex3213263 11111ˆ2)1E(3Ex13Ex23Ex3313233 12112ˆ3)1E(6Ex16Ex23Ex3616233
这说明他们都是总体均值的无偏估计,下面求他们的方差,不妨设总体的方差为2。
2222711111ˆ1)1Var(Var(x)Var(x)Var(x) 123493936182222111111ˆ2)1Var(9Var(x1)9Var(x2)9Var(x3)9993ˆ3)Var(13614Var(x1)36Var(x2)9Var(x3)13621423629212
ˆ2)Var(ˆ1)Var(ˆ3),从而ˆ3的有效性最差。 不难看出,Var(
ˆ)0,试征ˆ是参数的无偏估计,且有Var(ˆ2不是参数2的无偏估计。 3。 设ˆ)E(ˆ2)(E(ˆ))20.由于ˆ是参数的无偏估计,证明:由方差的定义可知,Var(ˆ),因而 E(ˆ2)Var(ˆ)(E(ˆ))2Var(ˆ)2>2,ˆ2不是参数2的无即E(所以偏估计.
4。 设总体X~ N(,2), x1,x2,…,xn是来自该总体的一个样本.试确定常数C,使
C(xi1xi)2
i1n1为2的无偏估计。
解:由于总体X~ N(,2),所以
E(xi2)22, E(xixi1)E(xi)E(xi1)2,i1,2,n
于是
n1n1n1n1n12222EC(xi1xi)CE(xi1xi)CE(xi1)E(xi)2E(xi1xi)
i1i1i1i1i1n1n1n12222C()E()22C2(n1)(22)2(n1)2
i1i1i12C(n1)2
2可见,要使C(xi1xi)为2的无偏估计,只有Ci1n11。
2(n1)5。 设从均值为方差为2>0的总体中分别抽取容量为n1和n2的两个样本,其样本均值分别为x1,x2.试证,对任意常数啊a,b(a+b=1),Yax1bx2都是的无偏估计,并确定常数a,b使Var(Z)达到最小。
证:由于x1,x2为容量为n1和n2的两个样本的样本均值,故
E(x1)E(x2),Var(x1)2/n1,Var(x2)2/n2,
因而:EYaE(x1)bE(x2)ab。这说明Yax1bx2是的无偏估计。 又由a+b=1知,Yax1bx2ax1(1a)x2,从而
11a21a21VarYaVarx11aVarx22a2a
n1n2n2n2n1n2222求导知,当a
1/n2n1n2时,Var(Y)达到最小,此时b
1/n11/n2n1n2n1n2n1x1n2x2是线性无偏估计类U{ax1(1a)x2}中方差最小的。
n1n2这个结果表明,来自同一总体的两个容量为n1和n2的两个样本合样本(样本容量为
n1+n2)的均值x6。 设分别来自总体N(1,2),和N(2,2)中抽取容量为n1和n2的两个样本,其样本方差分别为s12, s22。试证,对任意常数啊a,b(a+b=1),Z=a s12,+b s22都是2的无偏估计,并确定常数a,b使Var(Z)达到最小.
解:由已知条件有
n11s122222~n11,
222n21s122~2n21,
且s1,s2.于是Es1Es2,故
2EZEas12bs222aEsbEsa21222b2ab22,
2这证明了Zas1bs2是的无偏估计。
又 Vars2124242,Vars2,从而 n11n212VarZa2Vars121aVars2
2nn2221421a2a,
n21n21n11n22n11n21,该无偏估计为 因而当a时,VarZ达到最小,此时bn1n22n1n222xi1n1ixyiy2i1n22n1n22.
22样本,上述是的线性无偏估计类Uas11as2中方差最小
22这个结果表明,对来自方差相等(不论均值是否相等)的两个正态总体的容量为n1和n2的
7.设有k台仪器,已知用第i台仪器测量时,测量值总体的标准差为ii1,2,,k.用
这些仪器的对某一物理量各观察一次,成为的无偏估计,且方差达到最小。
k解:若要使aixi为的无偏估计,即
i1kkEEaixia1anai,
i1i1k则必须有
ai1,此时
i1kVarVara22ixia11a22kk.
i1kk因此,问题转化为在
ai1的条件下,求i1a2i2i的极小值。
i1k令fa22k1,akaiiai1,由
i1i1fa0,i1,2,,k和f0, i得到
2a2ii0, (1)kai1, (2)i1从(1)中可以得到ak1i22,代入(2)中,解出1ii122i,从而 1a2iik1,i1,2,,k.
j12j8.设x1,,xn是来自均匀总体U,1的一个样本.
(1) 验证1n1x1,2x1n1,3xnn1都是的无偏估计; (2) 比较上述三个估计的有效性.
解: 令yixi,则yi~U0,1,即y1,y2,,yn是来自U0,1的样本,且
xy,x1y1,xnyn.
于是,我们可将诸估计写成y1,y2,,yn与的函数:
1y1, 122y1n1, 3ynnn1.
由此,
E111Ey2,VarX1Vary12n.
又y1~Be1,n,yn~Ben,1,这说明
Ey1由此可以得到
1nn,Eyn,Varyn, 2n1n1n1n2E2,E3,Var1Var2n综上,1,2,3均是的无偏估计,而且2与3的方差相等,但在比较1与2的方差是要取
n12n2.
决于n的大小,当1n7时,1比2,3有效;当n8时,2,3比1有效。
N2,4,且两个样本.
(1)求12的矩估计;
(2)如果nn1n2固定,试问如何分配n1和n2才能使得的方差达到最小。
y1yn2xxn,2的矩估计为y解;(1)由题意可知1的矩估计为x1,n1n2因而12的矩估计xy.
下
9。设样本x1,,xn1来自一个正态总体N1,1,样本y1,,yn2来自另一个正态总体
(2)由于x~N(1,1/n1),y~N(2,4/n2),且两个样本,故在n1n2n的条件
ˆ)Var(x)Var(y)Var(使用和本节第5题相同的方法,由
1414deff(n1). n1n2n1nn1df(n1)dn11n241def 0,可解出
nn(另一12(nn1)3d2f(n1)2812ˆ的方差达解n1n不适合),而故nn,nn时0,1223333dn1n1(nn1)到最小.
10.设总体X~Exp(1/),x1,…xn是样本,试证x和nx(1)都是的无偏估计量,并比较其有效性.
E(X),Var(X),因而E(x),Var(x)解:由指数分布知,
22n,这说明x是
的无偏估计量.又最小次序统计量x(1)的密度函数为f1(x)因而有E(x(1))nen,即x(1)~Exp(n/),,Var(x(1))()2,从而E(nx(1)),即nx(1)是的无偏估计量,且
nnVar(nx(1))2.
注意到当n〉1时,Var(x)2n2Var(nx(1)),这说明作为的无偏估计,x比nx(1)更有效.
11.设总体为X~P(),x1,…,xn为其样本,试求2的无偏估计。 解:此处样本均值x为参数的充分统计量,且E(x),Var(x)n,于是
E(x2)Var(x)E(x)2因而E(x2n2,
xx)2,从而可得2的一个无偏估计为x2. nn12.设总体为X~U(1/2,1/2),x1,…xn为样本,证明样本均值x和样本中程
1(x(1)x(n))都是的无偏估计,并比较它们的有效性。 2解:由总体X~U(1/2,1/2),得E(X),Var(X)1,因而E(x),这12ˆx是的无偏估计,且Var(ˆ)首先说明样本均值111. 12nˆ为求样本中程211(x(1)x(2))的均值与方差,注意到YX()~U(0,1),令 22yixi(1/2),i1,2,…,n,
ˆ则 2111(x(1)x(n))(y(1)y(n)). 2221n,E(y(n)),从而 n1n1由于y(i)~Be(i,ni1),故E(y(1))ˆ)1E(yy)1. E(2(1)(n)22这就证明了样本中程是的无偏估计。又注意到(参见第五章5。3节习题29)
y(n)y(1)~Be(n1,2),
所以
n,2(n1)(n2)
2(n1)Var(y(n)y(1)),(n1)2(n2)Var(y(1))Var(y(n)) 从而
1Cov(y(1),y(n))[Var(y(n))Var(y(n))Var(y(n)y(1))]2
1.(n1)2(n2)于是
11Var((x(1)x(n)))[Var(y(1))Var(y(n))2Cov(y(1),y(n))]24
12n21[].224(n1)(n2)(n1)(n2)2(n1)(n2)在n2时,
11.这说明作为的无偏估计,在n>2时,样本中程12n2(n1)(n2)1(x(1)x(n))比样本均值x有效。 22213。设x1,...,xn是来自正态总体N(,)的一个样本,对考虑如下三个估计
1n1n1n22222ˆˆˆ(xx),(xx),(xx) iii23n1i1ni1n1i121(1) 哪一个是的无偏估计? (2) 哪一个均方误差最小?
2n解:(1)由于2(xix)~(n1),故有E(xix)2(n1)2,
i1i11n22从而
2ˆ12)2,E(ˆ2E()2n12n122ˆ3,E().
nn122ˆ3是的有偏估计. ˆ1是的无偏估计,而ˆ2与这说明仅有(2) 我们知道,估计的均方误差是估计的方差加上偏差的平方,即
22ˆi22)2Var(ˆi2)(E(ˆi2)2)2. E(而Var((xi1nix)2)2(n1)4,这给出
21242(n1)42(n1)422ˆ)ˆ2)ˆ3),Var(,Var(Var(. 22n1n(n1)于是
24ˆ)Var(ˆ), MSE(n12121ˆ2)MSE(22(n1)4n122n1422(),
nn2n2ˆ3)MSE(显然
22(n1)4n1222()4, 2n1(n1)(n1)222n12ˆ32的均方差最小. ,2,(n1),所以n1n1nn12ˆ3是的有偏估计,上述结论表明,在均方误差意义下,有时有偏估计要比注意,这里无偏估计更优。
14. 设x1,,xn是来自密度函数为p(x;)e(1)
(x)2,x的样本,
求的最大似然估计ˆ1,它是否是相合估计?是否是无偏估计?
(2) 求的矩估计ˆ2,它是否是相合估计?是否是无偏估?
ˆxc的估计,求使得ˆ的均方误差达到最小的c,并将之与(3) 考虑的形如c(1)cˆ1,ˆ2的均方误差进行比较。
解: (1)似然函数为
nL()ei1(xi)IxinexpxinIx(1).
i1ˆx.又显然L()在示性函数为1的条件下是的严增函数,因此的最大似然估计为1(1)x(1)的密度函数为f(x)nen(x),x,故
ˆ)xnen(x)dx(t)nentdt1, E(100nˆ)(n)且 故ˆ1不是的无偏估计,但是的渐近无偏估计.由于E(1ˆ2)E(10xne2n(x)dx(t22t2)nentdx0222, 2nnˆ)Var(1这说明ˆ1是的相合估计。
221122()0, nnn2n2(x)dx1,这给出EX1,所以的矩估计为(2) 由于E(X)xe02ˆ2x1.又E(X)x2nen(x)dx222,所以Var(X)1,从而有
011E(ˆ2)E(x)1,Var(ˆ2)Var(X)0(n),
nn这说明ˆ2既是的无偏估计,也是相合估计.
ˆxc的估计类,其均方误差为 (3) 对形如c(1)ˆ) Varxc)(Exc)2MSE((1)(1)c因而当c011(c)2, 2nn1ˆ)1达到最小,利用上述结果可以算出 时,MSE(c0nn2ˆ)MSE(12ˆ)1, ,MSE(2nn21的均方误差最nˆ)MSE(ˆ1)MSE(ˆ2),所以在这三个估计中,ˆx故有MSE(c0(x)c0小。
15.设总体X~Exp(1/),x1,,xn是样本,的矩估计和最大似然估计都是 x,它也是的相合估计和无偏估计,试证明在均方误差准则下存在优于x的估计(提示:考虑
ˆax,找均方误差最小者). a证:由于总体X~Exp(1/),所以E(x),Var(x)计类,其均方误差为
22aˆ)Var(ax)(E(ax))(a1)22. MSE(an22nˆax的估.现考虑形如a将上式对a求导并令其为0,可以得到当a0nˆ)最小,且 时,MSE(an1ˆ)MSE(a012MSE(x). n1n2这就证明了在均方误差准则下存在一个优于x的估计.这也说明,有偏估计有时不比无偏估计差。
n216。设x1,,xn同分布,Ex1=,Var(x1)〈+,证明ixi是的
n(n1)i1相和估计。
证:由于
n22n(n1)E()i
n(n1)i1n(n1)2n4Varx14Varx1n(n1)(2n1)2Var()2i0(n), =2226n(n1)i1n(n1)n2ixi是的相合估计. 这就证明了n(n1)i117.设x1,xn是取自均匀分布总体U(1,2)的一个样本,若分别取1minx1,xn和2maxx1xn作为1,2的估计量,问1,2是否为1,2的无偏量估计量?如果不是,如何修正才能获得1,2的无偏估计.
解:令Y=
X1,则Y~U(0,1)记y(1),y(n)为样本相应的次序统计量,于是有
211nEy(1),Ey(n),
n1n1从而
n112, n1n1n1nE21(21)2,
n1n1E11(12)可见1,2不是1,2的无偏估计量,由
n12(n1)Ex(1), n(n1)Ex,2(2)1nEx(1)Ex(n),1n1解之得
nEx(n)Ex(1)2,n1因而1 是1,2的无偏估计量.
n1n118。设x1,x2 同分布,其共同的密度函数为
nx(1)x(n),2nx(n)x(1)p(x;)(1)证明:T13x23,0x,0.
27(x1x2)和T2maxx1,x2都是的无偏估计; 36(2)计算T1和T2的均方误差并进行比较;
(3)证明:在均方误差意义下,在形如TCcmaxx1,x2的估计中T8 最优.
732dx,故E(T)2E(X),这说103432x3x3d明T1是的无偏估计.又总体分布函数为F(x;)(),0x,记3解:(1)先计算总体均值为E(X)x3x20Y=maxx1,x2,则密度函数为
f(y;)2F(y;)p(y;)6y56,0y.
76y676dy 于是有 E(T2)60667这表明T2也是的无便估计.
(2)无偏估计的方差就是均方误差,由于
32dx,
053332Var(x1)E(x1)E(x1)22(3)22,
5480E(x1)x223x2故有
MSE(T1)Var(T1)又
48312Var(x1)22. 998030232dy, 6043632Var(Y)E(Y2)(EY)22()2, 47196E(Y)y26y5从而
493212. 36198由于MSE(T1)MSE(T2),因此在均方差意义下,T2优于T1.
63222(3)对形如Tccmax{x1,x2}的估计有E(Tc)c,E(Tc)c,故
74312MSE(Tc)E(TC)2E(Tc2)2E(Tc)2(c2c1)2,
47MSE(T2)Var(T2)因此当c127328时,上述均方误差最小,所以在均方误差意义下,在形如77Tccmax{x1,x2}的估计中,T8最优。
19.设x1,......,xn是来自均匀分布U(0,)_的一个样本,对参数有如下三个估计
n112x,2x(n),3(n1)x(1)
n(1) 验证这些估计的无偏性; (2) 比较这些估计的有效性; (3) 研究这些估计的相合性。
解:(1)由于xi~U(0,1),所以E(1)2E(x)22,又yx(n)的密度函数为
p(y)所以
nyn1n,0y,
E(2)n1n1nE(x(n))nnnn0yndy1n1. n类似地,zx(1)的密度函数为 p(z)z(1)n1,0z,所以
yy(2)(n)E(3)(n1)E(x(1))n(n1)(1)n1dyn(n1).
0(n2)由此看出,三个估计1,2,3都是的无偏估计.
(2)分别计算三个估计的方差
Var(1)4Var(x)4n12nVar(2)E()[E(2)]()nn222212n223n,
0yn1(n1)22122,
n(n2)n(n2)0yVar(3)E()[E(3)](n1)ny2(1)n1dy22322(3)(n)2(n1)2nn(n1)22222.(n3)n2n2
11n,所以这三个估计中2最有效,1为次,3最差。 由于n2时,有
n(n2)3nn2(3) 由于1与2的方差都随着n而趋于零,故1与2都是的相合估计,但3不是的相合估的计。为了证明这一点,我们需要3的分布函数,由于zx(1)的分布函数为
zF(z)1(1)n,0z.
于是,3(n1)x(1)的分布函数为
F(t)1(1由此可得
t)n,0t(n1).
(n1)P(3)p(3)F()F()(1nn)(1)
(n1)(n1)e()e()(n)e1[ee].2(1),这是一个很小的数,它与1相差很大,这表明p(3)不会趋于1,故3不是的相合估计。
在充分小时,ee120.设x1,,xn是来自二点分布b(1,p)的一个样本, (1) 寻求p的无偏估计; (2) 寻求p(1p)的无偏估计; (3) 证明
21的无偏估计不存在。 p222解:(1)x是p的最大似然估计,x是p的最大似然估计,但不是p的无偏估计,这
是因为
E(x2)Var(x)[E(X)]2由此可见p2p(1p)pn12p2pp2, nnnn2xx是p2的无偏估计. n1n2(2) x(1x)xx是p(1p)的最大似然估计,但不是p(1p)无偏估计,这是因为E(xx)p(2p(1p)n1np2)p(1p)p(1p),由此可见x(1x)nnn11,xn)是的无偏估计,则有
p是p(p—1)的一个无偏估计,
(3)反证法,倘若g(x1,x1,xnng(x1,xn)pi1(1p)xi1nnxinxii1n1 p或者
x1xng(x,x1n)pi1(1p)xii1n10
上式是p的n+1次方程,它最多有n+1个实根,而p可在(0,1)取无穷多个值,所以不论取什么形式都不能使上述方程在0
1的无偏估计不存在. p21.设x1,xn是来自均匀分布U,的一个样本,寻求与的无偏估计。 解:容易看出,x(1)与x(n)分别是与的最大似然估计,但它们都不是无偏差估计,这是因为均匀分布U,的分布函数与密度函数分别为
0,xa,1,x,xF(x),x,和p(x)
其它.0,1,x由此可导出次序统计量yx(1)与zx(n)的密度函数分别为
yn11n(y)n1p(y)n(1),y, n()zn11n(y)n1p(z)n(),z, n()从而可以分别求出它们的期望
E(x(1))n()ny(y)n1dynn1, (*)
nE(x(n))()nz(za)n1dzna. (**) n1这表明:x(1)与x(n)不是与的无偏估计,但做恰当修改后,可获得与的无偏差估计。把(*)与(**)两式相加与相减可得
E(x(1)x(n)),
E(x(1)x(n))n1n1() 或 E(x(1)x(n))(), n1n1再使用加减消取法,即可得与的无偏估计发表为
ˆnx(1)x(n)ˆnx(n)x(1),.
n1n1ˆˆ(x,22.设x(1),x(n)是来自总体分布函数为F(x;)的一个样本,若1的有偏估计,且其期望有如下形式
,xn)是ˆ)(), (*) E(n其中()仅是的函数,而与样本量n无关.这时,为了减少偏差,常用如下的、“刀切法”:
ˆ是把原样本中的第i个分量剔除,用留下的容量为n-1的样本得到的类似估计量.即记iˆ)ˆ与ˆ的估计公式有相同形式,且E(ii()n1,i1,2,,n.
ˆ(1)nˆ是的无偏估计; (1) 证明:新的估计(一切的估计)i(2) 用刀切法寻求泊松分布p()中参数平方的一阶刀切估计。
2ˆ解:(1)一阶刀切估计(1)期望为
n1n()n1n()(1)ˆˆˆE()nE()E(i)n, ni1nni1n1ˆ是的无偏估计。 所以(1)ˆx不是的无偏估(2) 在泊松分布p()中,样本均值x是的无偏估计,但22计,这是因为E(x)Var(x)E(x)22n22,若做简单修改,用x/n代替/n,就
ˆ可以得到的一个无偏估计2(2)xx2.
n2ˆx是的有偏估计,且现在用“刀切法”寻找的一介刀切估计,已知22ˆ)(),其中()仅是的函数.若剔除样本中第i个分量,可得 E(nnnxxi212ˆ(xx)(), jii(n1)2j1n1再做一阶刀切估计
ˆ2(1)n1n1ˆnˆi, ni1ˆ和ˆ代入上式,可就可以得到的一个无偏估计,以下来化简这个一阶刀切估计,把i得
n1(nxxi)2 n(n1)i1ˆ(1)nx22n12nx[n(nx)2nxnxxi2]
n(n1)i1nn22n1x[n]xi2 n1n1n(n1)i121n2xin2n11n22i1x[nxxi], n1n1n1ni1这就是的另一个无偏差估计。
2§6.3 最小方差无便估计
内容概要
ˆ是的一个无偏估计,1.一致最小方差无偏估计 设如果对另外任意一个的无偏估
上都有 计,在参数空间ˆ)Var(), Var(ˆ是的一致最小方差无偏估计,简记为UMVUE。 则称ˆˆ(x,2.判断准则 设1ˆ).如果对任意一个,xn)是的一个无偏估计,Var(满足E((x1,,xn))0的,都有
ˆ,)0,, Cov(ˆ是的UMVUE。 则3. 充分性原则
➢ 任一参数的UNVUE不一定存在,若存在,则它一定是充分统计量的函数; ➢ 若的某个无偏估计不是充分统计量TT(x1,,xn)的函数,则通过条件期望
可以获得一个新的无偏估计ET,且方差比原估计的方差要小; ➢ 考虑的估计时,只需要在其充分估计量的函数中寻找即可,该说法对所有统计推
断都是正确的。这便是充分性原则。
4.费希尔信息量I() 设总体的概率函数p(x;),满足下列条件: (1) 参数空间是直线上的一个开去区间; (2) 支撑Sx:p(x;)0与无关; (3) 导数
^^^p(x;)对一切都存在; (4) 对p(x;),积分与微分运算可交换次序,即
p(x;)dxp(x;)dx; (5) 期望I()lnp(x;)存在,
则称该期望I()为总体分布的费希尔(Fisher)信息量.
如果二阶导数对一切都存在,则I()还可用下式计算
22I()E2Inp(x;)
5.常用分布的费希尔信息量
•二点分布b(1,p)的费希尔信息量I(P)P(1P);
1•泊松分布p()的费希尔信息量I()1; •指数分布Exp()的费希尔信息量I()2; •正态分布N(,1)的费希尔信息量I()1; •正态分布N(0,2)的费希尔信息量I(2)124;
12•正态分布N(,2)的费希尔信息量(信息矩阵)I(,2)06.C—R不等式
'设TT(x1,,xn)是未知参数g()的一个无偏估计,若g()0. 142g()存在,则在费希尔信息量I()也存在的条件下有
g()Var(T)'2nI()
上式称为克拉美-罗(C—R)不等式,g'()/(nI())称为g()的无偏估计的方差的C—R下界,简称g()的C——R下界.特别,对的无偏估计,有Var()(nI()).
注:g()的C-—R下界并不是对任意参数g()的无偏估计的方差都可达到。但能达C——R到下界的g()的估计TT(x1,,xn)一定是g()的UMVUE.
^^12习题与解答6。3
TT(x1,,xn)是的充分统计量,1.设总体概率函数是p(x;),x1,,xn是其样本,
则对g()的任一估计g,令gE(g\\T),证明MSE(g)MSE(g).这说明,在均方误差准则下,人们只需考虑基于充分统计量的估计。
证:我们将均方误差作如下分解
MSE(g)E(g)2E(ggg)2EggMSE(g)2E(gg)(g).2
注意到gE(g\\T),这说明
E(gg)|TE(g|T)EE(g|T)|TE(g|T)E(g|T)0,
于是
E(gg)(g)EE(gg)(g)|T=E(g)E(gg)|T0,
因而MSE(g)E(gg)MSE(g)MSE(g).
2。设T1,T2分别是1,2的UMVUE,证明:对任意的(非零)常数a,b,aT1bT2是
2a1b2的UMVUE.
证:由于T1,T2分别是1,2的UMVUE,故ETii,且对任意一个(x),满足E0,由本节11题结论有Cov(Ti,)0,i1,2,于是
E(aT1bT2)a1b2,Cov(aT1bT2,)aCOV(T1,)bCov(Y2,)0,因此aT1bT2是a1b2的UMVUE。
ˆ是g()的无偏估计,证明:若Var(gˆ),则3。设T是g()的UMVUE,gˆ)0. Cov(T,gˆ是g()的无偏估计,故其差Tgˆ是0的无偏估计,证:因为T是g()的UMVUE,gˆ)0,且Var(Tgˆ),由本节11题结论知Cov(T,Tgˆ)0,这说明 即E(Tgˆ)0,即Cov(T,gˆ)Var(T)0. Var(T)Cov(T,g1n1n24. 设总体X~N(,),x1,,xn为样本,证明,xxi,s(xix)ni1n1i122分别为,的UMVUE。
证:大家知道,x,s分别是,的无偏估计,设(x1,,xn)是0的任一无偏估计,则
222E即
i1n(xi)21expdx1222dxn0,
1n2nxn22xi22dx1(2)exp22i12n2dxn0. (*)
将(*)式两端对求导,并注意到E0,有
1n2nxn22xi22dx12(2)exp22i1nx2-n2dxn0. (**)
这说明E(nx22于是Cov(x)E(x)ExE0,从而x是的)0,即Ex0,
UMVUE。
为证明s是的UMVUE,我们将(**)式的两端再对求导,得
21n2nxn22xi22dx1(2)(2)exp22i1nx2n2dxn
dxn0.
0的项,有
n1n2nxnxnn2222xi22dx122(2)exp22i122由此可以得到E(x)0,下一步,将(*)式两端对求导,略去几个前面已经指出的积分为
1n2nxn2xi(2)exp2xi22dx12i12i1n22n2dxn0.
这表明E(xi)0,由此可得到E(s2)0,因而
2i1nCov(s2,)E(s2)E(s2)E0,
这就证明了s是的UMVUE。
222p(x;)对一5。设总体的概率数为p(x;),满足定义6。3。1的条件,若二阶导数2切的存在,证明费希尔信息量
2I()E(2lnp(x;)).
证:
记Slnp(x;),则
1p(x;)p(x;)dxp(x;)
p(x;) dxp(x;)dx0,ES所以
ES0.另一方面, ES(Sp(x;))dxSp(x;)p(x;)Sdx 22lnp(x;)lnp(x;)p(x;)dxp(x;)dx 22lnp(x;)2lnp(x;)2EESEI() 222lnp(x;)这就证明了I()E. 26.设总体密度函数为p(x;)x1,0x1,0,x1,,xn是其样本。 (1) 求g()1/的最大似然估计;(2) 求g()的有效估计。 解:
(1)似然函数为 L()nxi1n1i,对数似然函数为
1nlnL()nln(1)lnxinlng()g()1lnxi.
i1i1将似然函数求导并令其为0,得似然方程
nlnL()n1lnxi0,
g()g()g2()i11nˆ()lnxi. 解之得gni1(2) 令YlnX,则
P(Yy)P(lnXy)P(Xe)yx1dx1ey,
ye1ˆ()~Ga(n,n),于是 因此Y~Exp()Ga(1,),从而有gˆEgn1nˆ)g(),Var(g. 2nn为求有效估计,需求出的希尔信息量,注意到,lnp(x,)ln(1)lnx.
lnp(x;)12lnp(x,)1lnx,. 22而g()2,于是g()的任意无偏估计的C-R
g()下界为
nI()21,从而2n1n1nˆ()lnxi是g()的无偏估计,且方差达到了CR下界.所以gˆ()lnxigni1ni1是g()的有效估计
/x3,x0,0,求的费希尔信息量I().
2解:对数密度函数为 lnp(x,)ln2ln3lnx/x,求一、二阶导数,有
lnp(x,)112lnp(x,)12,, 22x7.设总体密度函数为p(x,)2e/x22lnp(x,)1由此给出 I()E2, 2(1),xc,c0已知,求的费希尔信息量I(). 8.设总体密度函数为p(x,)cx解:对数密度函数为 lnp(x,)lnlnc(1)lnx,求一、二阶导数,有
lnp(x,)12lnp(x,)1lnclnx,, 222lnp(x,)1由此给出 I()E2, 22X2,x2,,01,求的费希9。设总体分布列为P(XX)(X1)(1)尔信息量I().
解:对数分布为
lnp(Xx)ln(x1)2ln(x2)ln(1)
求一二阶导数,有
lnp(Xx)2x2lnp(Xx)1,
1在本章第3题中,我们已经算得E(x)2,于是
lnp(Xx)2E(x)2I()E 22(1)10。设x1,也是UMVUE
,xn是来自Ga(,)的样本,试证明x/是g()1/的有效估计,从而
1xxe,于是 解:总体Ga(,)的密度函数为p(x;)()lnp(x;)lnln()(1)lnxx, lnp(x;)2lnp(x;)x,
22,所以的费希尔信息量为()1,这就是说g(的任一无偏估计的C-R下界为 )2g()2n()又
1n2.
1x11x11E,Var22. 2nn这就证明了x/是g()1/的有效估计.从而也是UMVUE.
11.证明:定理6.3.3的逆也对,即:若是的UMVUE,则对任一满足E(x)0且
0Var(x)的(x)有
Cov,(x)0, .
证:采用反证法.倘若在参数空间中有一个0使得Cov0(,(x))defa0,取
baVar0(x)0,则
a2Var0(x)bVar0(x)2abb(a2a)20,
~~令b(x),则E0()E0()bE(x),这说明也是的无偏估计,但
~2~Var()Eb(x) 00222E0()bE0(x)2bE0()(x)
Var0()2bVar0(x)2abVar0(),
这与是的UMVUE矛盾,这就证明了对参数空间中任意的都有Cov,(x)0,
也即定理6.3.3的逆也对.由此我们知道,条件“对任意满足E(x)0的(x)有
Cov,(x)0\"“是的UMVUE”的充分必要条件.
212. 设总体X~N(,),x1,x2,,xn为样本,试求:
(1)342的最小方差无偏估计;(2)4的最小方差无偏估计.
2221n22(xx)解:(1)本节第4题已经证明了x和s分别是和的UMVUE,in1i12则由本节第2题知3x4s是34的最小无偏估计.
2(2)对任意一个0的无偏估计(即E0)有Cov(x,)0(见本节第4题证明过程)和Cov(s,)0,于是有
21n2n12Covxi,Covs,Cov(x,)0,
nni11n21n21n222222而Exi5s4且Covxi5s,0,所以xi5s是
ni1ni1ni1242的最小方差无偏估计。
13。
设x1,,xn同分布,x1 的取值有四种可能,其概率分别为
p11,p22,p323,p43
记为Nj为x1,,xn中出现各种可能结果的次数,N1N2N3N4n
(1) 确定a1,a2,a3,a4,使TaNii14i为的无偏估计;
(2) 将Var(T)与的无偏估计方差的C-—R下界比较. 解:(1) 由于Ni~b(n,pi),i1,2,3,4,所以ENinpi,从而有
ETajENja1n(1)a2n(2)a3n(23)a4n3
j123=na1n(a2a1)n(a3a2)n(a4a3)。
4若使T为的无偏估计,即要求
na10,n(aa)1,21 n(aa)0,23n(a4a3)0,解之得
a10,a2a3a4即T(N2N3N4)/n是的无偏估计。
(2)P(Njnj,j1,,4)1 n.n!(1)n1(2)n2(3)n3(3)n4
n1!n2!n3!n4!=
n!n22n3(1)n1n2n3,
n1!n2!n3!n4!对数似然函数为(略去与的无关的项)
lnP(n22n33n4)ln(n1n2n3)ln(1).
于是
lnPn22n33n4n1n2n3, 1n22n33n4n1n2n32lnP. 222(1)注意到观测量n1,n2,n3,n4是随机变量,且E(nj)npj,故
En12n23n3n222333n2..3, En1n222333nn1n1。
从而费希尔信息量为
2lnPn23n13n12. IE22211所以的无偏估计方差的C-R下界为
n1.由于
n12N2N3N4nN1~bn,
于是T1N3N2N4的方差为: nVarT111VarNNN, 23422nnn1即T的方差没有达到的无偏估计方差的C-R下界。
14。设x1,...,xn是来自正态总体N,22的一个样本,若均值已知,证明:
1nˆxi2是2的有效估计; (1) ni11nˆ(2) xi是的无偏估计,但不是有效估计。 n2i12ˆn证明:(1。)由
2ˆ~n知E222ˆ,Var2242.为了获得的无偏
n2估计的C—R下界,需要费希尔信息量,大家知道,正态分布N,数是
的密度函数p(x)的对
11x22lnpxln2ln, 2222x1x22。 lnpx122224242由此得的费希尔信息量
2lnpx14224I2EEx2Ex248 11444322448从而的无偏估计的C—R下界为nI222221n421242,此下界与上述无nˆ是的有效估计。 偏估计的方差相等,故此(2)由于Exi12xex222dx220yey22dy2
ˆ,即ˆ是的无偏估计,其方差为 可见,EˆVar2n22nVarxi1ni2
222222n2n2ExiExi为了获得的无偏估计的C—R下界,需要知道的费希尔信息量,由于
lnpx1x122x,332lnpx21422IxEEx2Ex46, 124446322从而的无偏估计的C—R下界为nI12n2122nˆ的方差,由于无偏估计22n22n222nˆ不是的有效估计.此处,的无偏估计的C—R下界与ˆ的方差的比,故1ˆ的效。 0.876,该比值常称为无偏估计222n 15。证明:若T1与T2是未知参数g()的两个UMVUE,则T1=T2(a.e).这个命题表明:g()的UMVUE在几乎处处的意义下是唯一的。 证明:首先,T1—T2是0的无偏估计,则由本节第11题
Cov(Ti,T1T2)E(Ti(T1T2))0, i1,2 于是
E(T1T2)2E(T12T222TT12)2由此立刻可得(T1T2) a.e 0,从而T1 a.e T2,
E(T((1T1T2)E(T2T1T2)0,
§ 6.4 贝叶斯估计
内容概要
1. 贝叶斯统计推断使用的三种信息
➢ 总体信息,总体分布和总体所属分布族提供的信息; ➢ 样本信息,从总体中抽取的样本所提供的信息;
➢ 先验信息,在实验前人们对要做的问题在经验上和资料上所占用的信息.
2. 贝叶斯统计的基本观点 任意一个未知量 都可看作一个随机变量,用一个概率分布来描述未知参数是最好的办法,这个分布称为先验分布。
3. 贝叶斯公式的密度函数形式
总体分布依赖于参数的概率函数在贝叶斯统计中记为 p(x|),他表示在随机变量 取某个给定的值时总体的条件概率函数;
根据参数 的先验信息可确定先验分布 ( );
从贝叶斯观点看,样本x1,x2,…,xn的产生分两步.首先从先验分布 ( )中产生一个样本0,然后从p(x1,x2,…,xn| )产生一组样本这时的样本联合条件概率函数为
p(x1,x2,这个分布综合了样本信息和总体信息
,xn|0)p(xi|0)
i1n 0 是未知的,它是按先验分布 ( )产生的,为把先验信息综合进去,不能只考虑0,对的其它值发生的可能性也要加以考虑,过要用 ( )进行综合,这样一来,样本x1,,xn和
参数的联合分布为h(x1,...xn,)p(x1,...xn|)(),这个联合分布把总体信息,样本信息和先验信息三种可用信息都综合进去了;
分析的目的是要对未知参数作统计推断.在没有样本信息时,人们只能依据先验分布对作出推断.在有了样本观察值x1,由于h(x1,,xn之后,则应依据h(x1,,xn,)对作出推断。
,xn,)可分解为
h(x1,,xn,)=(/x1,,xn)m(x1,,xn),
其中m(x1,,xn)h(x1,,xn,)d=p(x1,,xn|)()d是x1,,xn的边际概
率函数,它与无关,不含的任何信息.因此能用来对作出推断仅是条件分布
(/x1,,xn),它的计算公式是
(|x1,,xn)h(x1,,xn,)m(x1,,xn)p(x1,,xn/)(),xn/)()dp(x1,,
这个条件分布称为的后验分布,它集中了总体,样本和先验中有关的一切信息.
后验分布(|x1,...,xn)的计算公式就是用密度函数表示贝叶斯公式。它是用总体和样本对先验分布()作调整的结果,贝叶斯统计的一切推断都基于后验分布进行.
4. 贝叶斯估计 给予后验分布(|x1,...,xn)对所作的贝叶斯估计有多种,常用有如下三种:
• 使用后验分布的密度函数最大值作为的点估计,称为作大后验估计; • 用后验分布的中位数作为的点估计,称为后验中位数估计;
• 使用后验分布的均值作为的点估计,称为后验期望估计.这是使用最为频繁的贝叶
斯估计.
5. 共厄先验分布 设 是总体参数, ( )是其先验分布,若对任意的样本观测得到的后验分布 ( |X) 与 ( )属于同一分不族,则称该分布族是 的共轭先验分布(族)
➢ 二项分布B(n, )中成功概率 的共轭先验分布是贝塔分布Be(a,b); ➢ 泊松分布P( )的均值 的共轭先验分布是伽马分布Ga(,); ➢ 在方差已知时,正态总体均值 的共轭先验分布正态分布N(,2);
➢ 在均值已知时,正态总体方差2的共轭先验分布倒伽马分布IGa(,)(若X~ Ga(,),则X—1的分布称为倒伽马分布IGa(,);
习题与解答
1.
§ 6。5 区间估计
内容概要
1。 置信区间
设 是总体的一个参数,其参数空间为, x1,x2,…,xn是来自该总体的
ˆˆx,x,...,x,ˆˆx,x,...,x,样本,对给定一个(0<〈1),若有两个统计量LL12nUU12n使得对任意的,有
ˆˆPLU1
ˆ,ˆˆˆ则称随机区间[LU]为的置信水平为1-的置信区间,或简称[L,U]是的1—置信区ˆ,ˆ分别称为θ的(双侧)置信下限和置信上限. 间, LU这里置信水平1—的含义是指在大量使用该置信区间时,至少有100(1—)%的区间含有θ
2.同等置信区间 在上述记号下,若对给定的α(0〈α<1),对任意的θΘ,有
ˆˆ)1, p(LUˆ,ˆ则称[LU]为θ的1—α同等置信区间.
同等置信区间是把给定的置信水平1-α用足了。常在总体为连续分布场合下可以实现. 3.置信限
在上述记号下,若给定的α(0<α〈1),和任意的θΘ有
ˆ1,, pLˆ为 θ的1—α同等置信下限, 则称Lˆ)1,,则称ˆ为θ的1—α同等置信假如等号对一切,有p(UU上限.
4.枢轴量法 寻找同等置信区间常采用枢轴量法,其步骤如下: 设法构造一个样本和θ的函数GG(x1,数θ。此种G被称为枢轴量;
适当地选择两个常数c,d,使对给定的α,(0<α<1),有P(cGd)=1—α;
,xn,),使得G的分布不依赖于未知参
ˆˆ,则有p(ˆˆ)1, 若能将不等式cGd等价变形为LULUˆ,ˆ[LU]为θ的1—α同等置信区间.
关于置信区间的构造有两点说明
ˆˆ)达到最短 满足置信度要求的c,d通常不唯一,若有可能,应选平均长度E(UL的c,d,这在G的分布为对称分布的场合往往容易实现.
ˆˆ)尽可能短的c,d往往很难实现,因此通常这样选择c, 实际中,选平均长度E(ULd,是的两个尾部概率各为/2,即P(G〈c)=P(G〉d)=/2,这样的置信区间称为登尾置信区间.这是在G的分布为偏态分布的场合通常采用的方法。
5常用的置信区间
(1).设x1,x2,…,xn是来自N(,)的样本,x为均值,s为样本标准差,up为标准正态分布的p分位数,tp(k)为自由度是 k的t分布
2p(k)为自由度是 k的2分布的p分位数,
2取置信水平为1—a,则,2,的置信区间如下表所示
参数 枢轴量 置信区间 已知 uu 未知 x~N(0,1) /nx~t(n1) s/nn[xu1a/2/n,xu1a/2/n] [xt1a/2s/n,xt1a/2s/n] nn22(x)(x)iii1i12 ,2a/2(n)1a/2(n)已知 2 212(x)ii12~2(n) 未知 2(n1)s22~(n1) 2(n1)s2(n1)s2,22 (n1)(n1)a/21a/2(xi)(xi)i1 ,i1221a/2(n)a/2(n)n2n2已知 212(x)ii1n2~2(n) 未知 2(n1)s22~(n1) 2(n1)sn1s ,221a/2(n1)a/2(n1)2(1)。设x1,x2,…,xm是来自N(1,1)的样本,x为均值,sx为样本标准差; 设y1,y2,…,2ym是来自N(2,2)的样本,y为均值,sy为样本标准差,up为标准正态分布的p分位
数,tp(k)为自由度是 k的t分布,Fp(k1,k2)为自由度是 (k1,k2)的F分布的p分位数,取置信水平为1—a, 则均值差1—2,方差比12/22的置信区间如下表所示
参数 枢轴量 Uxy(12)置信区间 12与22已知 12m~N(0,1)22 nxyu1a/212m22 n12与22未知,但 12=22 均值差1—2, 22/12=已知 TTxy(12) ~t(mn2)11swmnxyt1a/2(mn2)sw11 mn其中sw22(m1)sx(n1)symn2 xy(12) ~t(mn2)1stmnxyt1a/2(mn2)st1 mn其中st22(m1)sx(n1)sy/mn22ssxy mn2 m,n都很大时 Uxy(12)ssmn2x2y~N(0,1) xyu1a/2一般场合 Uxy(12)ssmn2xm2y~t(l)① 2ssxxyt1a/2(l)y mn22(xi)222~F(m,n) 1,2已知 Fin1211(y)ni方差比1mi111m(x)2(xi)2miin1F1a/21(m,n),in1Fa/2(1m,n) 11(y)2(y)2ninii1i1mm12/22 1,2 之一未知
22sx2F22~F(m1,n1) sy12sx11sx2 ,22F(m1,n1)F(m1,n1)ss1a/2a/2yy习题与解答6.5
1。 某厂生产的化纤强度服从正态分布,长期以来其标准差稳定在=0。85,现抽取了一个容量为n=25的样本,测定其强度,算得样本均值为x=2。25,试求这批化纤平均强度的置信水平为0.95的置信区间。 ①
注:这里
22sysxs0mn,l为最接近于
2s0ssm2(m1)n2(n1)4x4y的整数
解 这是方差已知时正态均值的区间估计问题.由题设条件10.95,0.05,查表知u0.9751.96,于是这批化纤平均强度的置信水平为0.95的置信区间为
xu1/2/n,xu1/2/n2.251.960.85/25,2.251.960.85/25=[2.25-0。3332,2。25+0。3332],
即这批化纤平均强度的置信水平为0.95的置信区间为[1。9168,2。5832]。
2。 总体X~N(,),已知,问样本容量n取多大时才能保证的置信水平为95%的置信区间的长度不大于k.
解 由已知条件得的0.95置信区间为
22xu1/2/n,xu1/2/n,
222其区间长度为2u1/2n,若使2u1/2nk,只需n(2/k)u1/2。
3.923.92n由于u1/2=1。96,故n(2/k)221.962,即样本容量至少取时,
kk才能保证的置信水平为95%的置信区间的长度不大于k.
3.0。50,1.25,0.80,2。00是取自总体X的样本,已知Y=lnX服从正态分布N(,1)。 (1) 求的置信水平为95%的置信区间;
(2) 求X的数学期望的置信水平为95%的置信区间.
解 (1) 将数据进行对数交换,得到Y=lnX的样本值为:—0.6931,0.2231,-0。2231,0。6931.它可看作是来自正态分布N(,1)的样本,其样本均值为y=0,由于=1已知,因此,
22的置信水平为95%的置信区间为: yu1/2/n,yu1/2/n=[—0.9800,0.9800].
(2) 由于EX=e12是的严增函数,利用(1)的结果,可算得X的数学期望的置信水
0.980.5平为95%的置信区间为[e,e0.980.5]=[0.6188,4。3929].
4.用一个仪表测量某一物理量9次,得样本均值x=56.32,样本标准差s=0。22. (1) 测量标准差大小反映了测量仪表的精度,试求的置信水平为0.95的置信区间; (2) 求该物理量真值的置信水平为0。99的置信区间。
0.975(8)=17。解 (1)此处(n-1)s=8×0。22=0.3872,查表知0.025(8)=2。1797,5345,的1—置信区间为
22222(n1)s20.3872(n1)s20.3872,=,1/2(n1)/2(n1)17.53452.1797从而的置信水平为0.95的置信区间[0.1487,0.4215]。
=[0.0221,0。776] (2) 当 未知时,的1—置信区间为
[xt1/2(n1)s/n,xt1/2(n1)s/n].
查表得t10.005(8)=3。3554,因而的置信水平为0。99的置信区间为
[56.32-3。3554×0.22/9,56。32+3。3554×0。22/9]=[56.0739,56。5661]. 5.已知某种材料的抗压强度X~N(,),现随机地抽取10个试件进行抗压试验,测得数据如下:
482 493 457 471 510 446 435 418 394 469 .
(1) 求平均抗压强度的置信水平为95%的置信区间;
(2) 若已知=30,求平均抗压强度置信水平面为95%的置信区间; (3) 求的置信水平为95%的置信区间.
解: (1) 经计算得,x=457。5, s=35.2176, 在未知时,的置信水平为95%的置信区间为
[xt1/2(n1)s/n,xt1/2(n1)s/n]。
查表得,t10.025(9)=2。2622,因而的置信水平为95%的置信区间为
[457.5-2.2622×35。2176/10,457.5+2.2622×353。2176/10]=[432.30,482.6936]。
(2)在=30已知时,的置信水平为95%的置信区间为
2xu1/2/n,xu1/2/n,
查表得,u1/2=1.96,置信水平为95%的置信区间为
[457。5—1。96×30/10,457。5+1.96×30/10]=[438.9058,476.0942]。 (3) 此处,(n-1)s =11162.5141,取=0。05,查表得0.025(9)=2。7004,
2220.975(9)19.0228,因而2的置信水平为95%的置信区间为
11162.514111162.5141,[586.7966,4113.6521] 2.700419.0228由此可以得到的置信水平为95%的置信区间为[24。2239,.1378]。
6。在一批货物中随机抽取80件,发现有11件不合格品,试求这批货物的不合格品率的置信水平为0.90的置信区间。
解: 信区间为
此处n=80较大,可用正态分布求其近似置信区间.不合格品率的1—近似置
x(1x)x(1x)/2/2,xu1xu1.
nn此处x110.1375,u0.951.5,因而不合格品率的置信水平为0。90的置信区间为 800.13750.86250.13750.86250.13751.5,0.13751.5[0.0742,0.2008].8080
7.设x1,,xn是来自泊松分布()的样本,证明:当样本量n较大时,的近似1-置信区间为
x1u21(2x1u2)24x2,x1u21(2x1u2)24x2
2n1/22n1/22n1/222n1/2证 由中心极限定理知,当样本量n较大时,样本均值x~(,n),因而
uxn~(0,1),此u可作为枢轴量,对给定,利用标准正态分布的分位数u1/2可得
xpu1/21. n22括号里的事件等价于(x)u1/2/n,因而得
2(2xu12/2)x20.
其左侧的二次多项式二次项系数为正,故二次曲线开口向上,而其判别式
1nu1222xn4xu12/2u12/220 4xnn22故此二次曲线与轴有两个交点,记为L和U(LU),则有P(LU)1,其中L和U可表示为
112xu12/22xu12/24x2nn
2这就证明了的近似1置信区间为
22121121112222xu1/22xu1/24x,xu1/22xu1/24x2n2n2n2n2事实上,上述近似区间是在n比较大时使用的,此时有
121u1/20,2n22xu21/2/n4x2u1/2x/n
28.某商店某种商品的月销售量服从泊松分布,为合理进货,必须了解销售情况.现记录了该
商店过去的一些销售量,数据如下:
月销售量910111213141516月份数1613129421 试求平均月销售量的置信水平为0.95的置信区间。
解:平均月销售量 xnixi/nii1i1885751109792,此处=0。05,u1/21.96, 48n48较大,利用上一题的结果,平均月销售量的近似0。95的置信区间为
[11.97921.9611.9792/48,11.97921.9611.9792/48][11.0000,12.9584].
若用较为精确的近似公式,所得置信区间为[11.0392,12。9992],二者相差不大.
9。设从总体X~N(1,1)和总体Y~N(2,2)中分别抽取容量为
22n110,n215的样本,可计算得x82,sx56.5,y76,sy52.4.
22(1) 若已知1,249,求12的置信水平为95%的置信区间; (2) 若已知12,求12的置信水平为95%的置信区间;
(3) 若对1,2,一无所知,求12的置信水平为95%的近似置信区间; (4) 求1/2,的置信水平为95%的置信区间。
解:(1) 在1,2都已知时,12的1—的置信区间为
22122122,xyu1a/2xyu1a/2 mnmn2222222222经计算xy6,查表得u0。975=1—96,因而12的置信水平为95%的置信区间为
4949,61.960.0939,12.0939 61.9610151015(2)当12时,12的1置信区间为
n1n2n1n2xyst(nn2),xyst(nn2). w1/212w1/212n1n2n1n222这里s2w22(n11)sx(n21)syn1n22956.51452.454.0043,t0.975(23)=2.0687,因而
2312的置信水平为95%的置信区间为
10151015 82762.068754.0043,82762.068754.004310151015
0.2063,12.2063(3)当1,2未知时,由于两个样本量不是很大,故采用一般场合下的近似置信区间,即12的1近似置信区间为
22xys0t1/2(l),xys0t1/2(l).
这里
22ss56.552.4y2s0x9.1433
n1n210159.14332l18.918719 2224s56.552.4sxy229003150n1(n11)n2(n21)又查表得t0.975(19)2.0930,因而12的置信水平为95%的近似区间为
4s082762.093021(4)
229.1433,82762.0939.1433=0.3288,12.3288
的置信水平的置信区间为
22sxsx11,2. 2syF1/2(n11,n21)syF1/2(n11,n21)2111,因而查表得F0.975(9,14)3.21,F0.025(9,14)2的置信水平为
F0.975(14,9)3.80295%的置信区间为
56.5156.5,3.800.3359,4.0973 52.43.2152.410.假设人体身高服从正态分布。今抽测甲,乙两地区18岁~25岁女青年身高数据如下:甲地区抽取10名,样本均值1。m,样本标准差0。2m;乙地区抽取10名,样本均值1。62m,样本标准差0。4m。求:
(1) 两正态总体方差比的置信水平为95%的置信区间; (2) 两正态总体均值差的置信水平为95%的置信区间。
解:设x1,,x10为甲地抽取的女青年身高,为y1,,y10乙地抽去的女青年身高,由题设条件,x1.,sx0.2,y1.62,sy0.4.
2甲(1)2的1的置信区间
乙22sxsx11,2. 2syF1/2(m1,n1)syF/2(m1,n1)此处0.05,mn10,查表F0.975(9,9)4.03,F0.025的置信水平为95%的置信区间为
甲11由此,2F0.975(9,9)4.03,乙20.2210.22,4.031.0075. 0.424.030.420.0620,2甲(2)由(1),2的置信水平为95%的置信区间包含1,因此有一定理由假定两个正态总
乙体的方差相等,此时,
s2w22(m1)sx(n1)symn290.2290.421.80.1
1010218查表得F0.975(18)2.1009,故两正态总体均值差的置信水平为95%的置信区间为
101010101.1.622.10090.1,1.1.62.2.10090.1
10101010=0.2271,0.3171
还有另一种解法就是不对方差相等做假设,而采用近似方法求均值差的置信区间,由于
22ss0.040.160.022y2x13 s00.02,lmn10100.0420.1629003150查表得F0.975(13)2.6503,从而两正态总体均值差的置信水平为95%的近似置信区间为 [1.1.622.65030.02,1.1.62.2.65030.02]=[-0。3548,0。3948] 这二个置信区间相差不算太小,所以在应用中条件“方差相等”是否成立是要加以考证的.
因篇幅问题不能全部显示,请点此查看更多更全内容