随机事件与概率
基本概念
随机试验:E
样本点(基本事件):ω
样本空间:Ω
e.g.
E1 :抛一枚硬币
Ω1={H,T} (离散)
E2 :电视寿命
Ω2=[0,+∞) (连续)
事件:A,B⊆Ω
逆事件/对立事件:Aˉ=Ω−A
不相容:AB=∅
并:A∪B=A+B
交:A∩B=AB
差:A−B
若 F∈2Ω ,且
- Ω∈F
- A∈F⟺Aˉ∈F
- ∀An∈F,n≤1⟹∪n=1∞An∈F
称 F 为事件域,F 中的元素为事件
若 P:F→R ,且
- ∀A∈F,P(A)≥0 (非负性)
- P(Ω)=1 (规范性)
- 若 A1,A2,... 两两不相容,则 P(∪i=1∞Ai)=∑i=1∞P(Ai) (可列可加性)
称 P 为概率,(Ω,F,P) 为概率空间
半可列可加性:
P(∪i=1nAi)≥i=1∑nP(Ai)−1≤i<j≤n∑P(AiAj)
下连续性:若事件序列A1,A2,... 单调增(A1⊂A2⊂...),则
n→∞limP(An)=P(∪n=1∞An)
证明:
记 Bi=Ai−Ai−1
Bi 两两不相容
P(∪n=1∞An)=P(∪i=1∞Bi)=∑i=1∞P(Bi)=limn→∞∑i=1n(P(Ai)−P(Ai−1))=limn→∞P(Bi)
上连续性:若事件序列A1,A2,... 单调减(A1⊃A2⊃...),则
n→∞limP(An)=P(∩n=1∞An)
证明同理
古典概型(等可能概型)
样本空间元素有限,且可能性相等
Ω=...
A=...
P(A)=...
几何概型
P(A)=S(Ω)S(A)
蒲丰投针问题
Ω={(x,β)∣0≤x≤2α,0≤β≤π}
A={(x,β)∣0≤x≤2lsinβ}
P(A)=S(Ω)S(A)=2απ2l∫0πsinβdβ=απ2l
改为正方形
Ω={(x,β)∣0≤x≤2α,0≤β≤4π}
A={(x,β)∣0≤x≤min(22lcosβ,2α)}
P(A)=S(Ω)S(A)=8απ∫04πmin(22lcosβ,2α)dβ
条件概率
P(A∣B)=P(B)P(AB)
P(A1A2...An)=P(A1)P(A2∣A1)P(A3∣A1A2)...P(An∣A1A2...An−1)
全概率公式
若 ∪i=1nBi=Ω,BiBj=∅(i=j),P(Bi)>0 ,称 B1,B2,...,Bn 为完备事件组。
P(A)=∑i=1nP(A∣Bi)P(Bi)
可列个事件:
若 ∪i=1∞Bi=Ω,BiBj=∅(i=j),P(Bi)>0 ,称 B1,B2,... 为完备事件组。
P(A)=∑i=1∞P(A∣Bi)P(Bi)
Bayes 公式
P(Bi∣A)=∑j=1nP(Bj)P(A∣Bj)P(Bi)P(A∣Bi)
先验概率:P(Bi)
后验概率:P(Bi∣A)
若 B1=B,B2=Bˉ
P(B∣A)=P(B)P(A∣B)+P(Bˉ)P(A∣Bˉ)P(B)P(A∣B)
事件的独立性
若 P(AB)=P(A)P(B) 则 A,B 独立
若 A,B 独立,则 Aˉ,B 独立
证明:P(AˉB)=P(B−AB)=P(B)−P(AB)=P(B)−P(A)P(B)=P(Aˉ)P(B)
若 A,B,C 两两独立,且 P(ABC)=P(A)P(B)P(C) ,则称 A,B,C 相互独立
若 ∀1≤i1<i2<...<ik≤n,P(Ai1)P(Ai2)...P(Aik)=P(Ai1)P(Ai2)...P(Aik) ,称 A1,A2,...,An 相互独立
共 2n−n−1 个式子
Bernoulli试验
随机试验 E 结果只有 A,Aˉ ,重复做 n 次,称为 n 重Bernoulli试验,记作 E
样本空间:Ω={(w1,w2,...,wn)∣wi∈{A,Aˉ}}
P(Bk)=(kn)pk(1−p)n−k
随机变量与概率分布
若 (Ω,F,P) 为概率空间,X 为定义在 Ω 上的实值函数。若 ∀x∈R,{X≤x} 为随机事件,即 {ω:X(ω)≤x}∈F ,则称 X 为随机变量。
称实变实值函数 F(x)=P(X≤x) 为 X 的分布函数 (CDF)。
P(X<a)=F(a−0),P(X=a)=F(a)−F(a−0),P(a≤X≤b)=F(b)−F(a−0)
单调性、有界性、右连续性
离散型随机变量
退化分布:
F(x)={01x<ax≥a
分布律 \pmatrix{a\\1}
Bernoulli 分布:
F(x)=⎩⎪⎨⎪⎧01−p1x<00≤x<1x≥1
分布律 \pmatrix{0&1\\1-p&p}
E(X)=p
D(X)=p(1−p)
二项分布
P(X=k)=b(k;n,p)=(kn)pk(1−p)k
记作 X∼B(n,p)
[(n+1)p] 处取最大值
E(X)=np
D(X)=∑k=0nk2(kn)pk(1−p)n−k=∑k=1nn(k−1n−1)pk(1−p)n−k+∑k=2nn(n−1)(k−2n−2)pk(1−p)n−k=np+n(n−1)p2
D(X)=np(1−p)
Poisson定理:
若 limn→∞npn=λ,k∈Z+ (n 较大,p 很小,np 适中),则
p(k,λ)=n→∞lim(kn)pnk(1−pn)n−k=k!λke−λ
Poisson逼近:b(k;n,p)≈{p(k,np)=k!(np)ke−npp(k,n(1−p))=k!(n(1−p))ke−n(1−p)p很小p接近1
负二项分布(Pascal分布):
f(k;r,p)=(r−1k−1)pr−1(1−p)k−r
第 r 次成功出现在第 k 次试验的概率
Poisson分布
P(X=k)=p(k,λ)=k!λke−λ
记作 X∼P(λ)
E(X)=∑k=0+∞kk!λke−λ=e−λλ∑k=1+∞(k−1)!λk−1=λ
E(X2)=∑k=0+∞k2k!λke−λ=e−λ(λ∑k=1+∞(k−1)!λk−1+λ2∑k=2+∞(k−2)!λk−2)=λ+λ2
D(X)=λ
若 X1∼P(λ1),X2∼P(λ2)
则 X1+X2∼P(λ1+λ2)
λ 是单位时间内随机事件的平均发生率
适用大量实验中稀有事件的发生
几何分布、超几何分布
超几何分布:P(X=k)=(nN)(kM)(n−kN−M)
几何分布:P(X=k)=p(1−p)k−1
首次成功出现在在第 k 次试验中的概率
离散型唯一无记忆性的分布
连续型随机变量
概率密度函数 (PDF) f(x)
分布函数 (CDF) F(x)=∫−∞xf(y)dy
若 f(x) 为实变实值函数,则 x 为连续型随机变量
概率密度函数不唯一(在零测集上可改变)
均匀分布
f(x)={b−a10a≤x≤belse
F(x)=⎩⎪⎨⎪⎧0b−ax−a1x<aa≤x≤bx>b
记作 X∼U[a,b]
E(X)=2a+b
D(X)=121(b−a)2
指数分布
f(x)={λe−λx0x≥0x<0
F(x)={1−e−λx0x≥0x<0
无记忆性
记作 X∼E(λ)
E(X)=λ∫0+∞xe−λxdx=λ(x−λ1e−λx∣0+∞−∫0+∞−λ1e−λxdx)=∫0+∞e−λxdx=λ1
E(X2)=λ∫0+∞x2e−λxdx=λ(x2−λ1e−λx∣0+∞−∫0+∞2x−λ1e−λxdx)=λ2E(X)=λ22
D(X)=λ21
正态分布(Gauss分布)
f(x)=2πσ1exp(−2σ21(x−μ)2)
记作 X∼N(μ,σ2)
Stirling 公式:n!∼2πn(en)n,n→+∞
3σ 原则:
P(−σ≤X−μ≤σ)≈0.683
P(−2σ≤X−μ≤2σ)≈0.954
P(−3σ≤X−μ≤3σ)≈0.997
因此可基本认为 X−μ∈[−3σ,3σ]
标准化:F(X)=ϕ(σX−μ)
ϕ(x)=∫−∞x2π1e−u2/2du
ϕ′(x)=2π1e−x2/2
若 X1∼N(μ1,σ12),X2∼N(μ2,σ22) ,X1,X2 相互独立,则 X1+X2∼N(μ1+μ2,σ12+σ22) ,X2X1 服从 Cauchy 分布 f(x)=π(1+x2)1
标准正态分布:
X∼N(0,1)
ϕ(x)=∫−∞x2π1exp(−21t2)dt
上 α 分位数 zα : P(X>zα)=α
双侧 α 分位数 cα:P(∣C∣>cα)=α
若 X1,X2∼N(0,1) 且相互独立,则 X2X1 服从 Cauchy 分布:
f(x)=π(1+x2)1
Γ 分布
f(x)=Γ(α)λαxα−1e−λxI(0,+∞)(x)
其中 Γ(α)=∫0+∞uα−1e−udu
Γ(21)=π
Γ(n+1)=n!
记作 X∼Γ(α,λ)
Γ(1,λ)=E(λ),即 f(x)=λe−λxI(0,+∞)(x)
Γ(2n,21)=χ2(n) ,即 f(x)=22nΓ(2n)1x2n−1e−21xI(0,+∞)(x)
Beta 分布:f(x;α,β)=B(α,β)1xα−1(1−x)β−1
记作 X∼Be(α,β)
B(α,β)=Γ(α+β)Γ(α)Γ(β)
Maxwell 分布:f(v)=4π(2πkTm)23e−2kTmv2v2
随机变量函数分布
Y=g(X)
X 离散,Y 一定离散
X 连续,Y 不一定
若 X∼N(μ,σ2) ,则 Y=aX+b∼N(aμ+b,a2σ2)
对数正态分布:X∼N(μ,σ2),Y=eX
FY(y)=P(g(X)≤y)
若 FY(y) 几乎处处连续,则 fY(y)={FY′(y)0FY′(y)存在FY′(y)不存在
若 fX(x),g(x) 几乎处处连续,且 ∀h∈C(x),∫−∞+∞h(g(x))fX(x)dx=∫αβh(y)p(y)dy
则 fY(y)=p(y),α<y<β
多维随机变量与概率分布
二维
联合分布函数:
F(x,y)=P(X≤x,Y≤y)
边缘分布:
FX(x)=F(x,∞)
FY(y)=F(∞,y)
二维离散型
P(X=i,Y=j)=P(X=i)P(Y=j∣X=i)
联合分布律可以写成表格形式
二维连续型
联合概率密度函数:
f(x,y)=∂x∂y∂2F(x,y)
可以在零测集上任意更改
F(x,y)=∫−∞x∫=∞yf(u,v)dudv,(x,y)∈R2
fX(x)=∫−∞+∞f(x,v)dv
F(+∞,+∞)=1
F(−∞,y)=F(x,−∞)=0
二维正态分布
记 u=σ1x−μ1,v=σ2y−μ2
f(x,y)=2πσ1σ21−ρ21exp(−2(1−ρ2)1(u2−2ρuv+v2))=2πσ1σ21−ρ21exp(−2(1−ρ2)1((σ1x−μ1)2−2ρ(σ1x−μ1)(σ2y−μ2)+(σ2y−μ2)2))
记作 (X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
协方差矩阵 \Sigma=\pmatrix{\sigma_1^2&\rho \sigma_1\sigma_2\\\rho\sigma_1\sigma_2&\sigma_2^2}
X,Y 独立 ⟺ρ=0
k 维正态分布
N(μ,Σ):f(x)=(2π)−2k∣Σ∣−21e−21(x−μ)TΣ−1(x−μ)
各分量相互独立等价于两两不相关
若 X∼N(μ,Σ) ,则 CX∼N(Cμ,CΣCT)
条件分布
P(X=n∣Y=m)=P(Y=m)P(X=n,Y=m)
连续型:
条件概率密度:fX∣Y(x∣y)=fY(y)f(x,y)
条件分布:FX∣Y(x∣y)=∫−∞xfY(y)f(u,y)du
x,y 相互独立:F(x,y)=FX(x)FY(y)
连续:f(x,y)=fX(x)fY(y) 几乎处处成立
二维随机变量函数分布
独立随机变量函数仍相互独立
离散:
取值较少可一一列出
若 Z=X+Y
P(X+Y=k)=∑iP(X=i)P(Y=k−i)
若 X∼P(λ1),Y∼P(λ2) ,且 X,Y 相互独立,则 X+Y∼P(λ1+λ2) (再生性),但 X−Y 不是 Poisson 分布
若 X∼B(n,p),Y∼B(m,p) ,且 X,Y 相互独立,则 X+Y∼B(n+m,p)
∑i+j=k(in)(jm)=(kn+m)
连续:
若 Z=g(X,Y)
FZ(z)=P(g(x,y)≤z)=∬g(x,y)≤zf(x,y)dxdy
- 确定 z 取值范围
- 确定积分区域
- 积分
e.g.
{(x,y)∣0<x<1,0<y<2x},Z=2X−Y
0≤Z≤2 时 P(Z≤z)=1−∫2z1∫02x−zdydx
和的分布
若 Z=X+Y
fZ(z)=∬x+y=zf(x,y)dxdy=∫−∞+∞f(x,z−x)dx (卷积)
若 X∼N(0,1),Y∼N(0,1) ,则 X+Y∼N(0,2)
fZ(z)=∫−∞+∞f(x)f(z−x)dx=∫−∞+∞2π1e−2x2+(z−x)2dx=2π1e−4z2∫−∞+∞e−(x−2z)2dx=2π1e−4z2
联合分布
若 u=g1(x,y),v=g2(x,y)
J=∂(u,v)∂(x,y)
f(u,v)=f(x,y)∣J∣
积的分布
U=XY 为连续型随机变量,概率密度
fu(u)=∫−∞+∞∣v∣1f(vu,v)dv
商的分布
U=YX 为连续型随机变量,概率密度
fu(u)=∫−∞+∞∣v∣f(uv,v)dv
两个独立标准正态分布变量的商满足 Cauchy 分布:
f(x)=π(1+x2)1
最大值、最小值分布
最大值 FZ(z)=P(∀i(1≤i≤n),Xi≤z)
若 Xi 相互独立,FZ(z)=∏i=1nFi(z)
若 Xi i.i.d.,FZ(z)=(FX(z))n ,若 Xi 为连续型随机变量,fZ(z)=n(FX(z))n−1fX(z)
最小值同理,考虑 1−FZ(z)
e.g.
FX(x)=(1−e−λx)I(0,+∞)(x)
F_\max(x)=(1-e^{-\lambda x})^nI_{(0,+\infty)}(x)
1-F_\min(x)=e^{-n\lambda x}, x>0\implies F_\min(x)=(1-e^{-n\lambda x})I_{(0,+\infty)}(x)
多项分布
若每次试验有 r 种结果 A1,A2,...,Ar ,Xi 为 n 次重复试验中 Ai 出现次数
P(X1=n1,X2=n2,...,Xr=nr)=(n1,n2,...,nrn)p1n1p2n2...prnr
记作 (X1,X2,...,Xr)∼M(n,p1,p2,...,pr)
随机变量的数字特征
数学期望
若 X 分布律 \pmatrix{x_1&x_2&...\\p_1&p_2&...}
E(X)=∑xkpk
若 ∑∣xk∣pk 存在,则称 E(X) 存在(绝对收敛),否则不存在
条件收敛没用,因为要可交换
连续型:若 ∫−∞+∞∣x∣f(x)dx 存在,E(X)=∫−∞+∞xf(x)dx ,否则 E(X) 不存在
若 f(x)=π11+x21 ,则 ∫−∞+∞π(1+x2)∣x∣ 不绝对收敛,E(X) 不存在(厚尾)
E(g(X))=∑g(xk)pk
性质:
线性性:E(aX+bY+c)=aE(X)+bE(Y)+c
单调性:若 E(X),E(Y) 存在,则 X≤Y⟹E(X)≤E(Y)
乘积:若 X,Y 相互独立,则 E(XY)=E(X)E(Y)
证明:E(X,Y)=∫−∞+∞∫−∞+∞xyf(x,y)dxdy=(∫−∞+∞xfX(x)dx)(∫−∞+∞yfY(y)dy)=E(X)E(Y)
Markov 不等式:∀ϵ>0,P(∣X∣≥c)≤cE(∣X∣)
证明:P(∣X∣≥c)=E(I∣X∣≥c)≤E(c∣X∣)
若 E(∣X∣)=0 ,则 P(X=0)=1
证明:P(∣X∣>0)≤∑k=1+∞P(∣X∣≥k1)≤∑k=1+∞kE(∣X∣)=0
方差
D(X)=E((X−E(X))2)=E(X2)−E(X)2
标准差 σ=D(X)
性质:
D(kX)=k2D(X)
若 X1,X2 相互独立,则 D(X1+X2)=D(X1)+D(X2)
D(X)≤E((X−c)2)
Chebyshev 不等式:∀ϵ>0,P(∣X−E(X)∣≥ϵ)≤ϵ2D(X)
证明:由 Markov 不等式,P((X−E(X))2≥c)≤cD(X)
矩:
- E(Xk) :k 阶原点矩 (k=1 :期望)
- E((X−E(X))k) :k 阶中心矩 (k=2 :方差)
- E((X−E(X))k(Y−E(Y))l) :k+l 阶混合中心矩
若高阶矩存在,低阶矩一定存在
协方差、相关系数
协方差:混合中心矩
Cov(X,Y)=E((X−E(X))(Y−E(Y)))=E(XY)−E(X)E(Y)
若 X,Y 相互独立,则 Cov(X,Y)=0
性质:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
对称性:Cov(X,Y)=Cov(Y,X)
线性性: Cov(aX1+bX2+c,Y)=aCov(X1,Y)+bCov(X2,Y)
标准化:X∗=D(X)X−E(X) ,则 E(X∗)=0,D(X∗)=1
相关系数:
ρXY=Cov(X∗,Y∗)=D(X)D(Y)Cov(X,Y)
ρaX+b,cY+d=sgn(ac)ρXY
Cauchy-Schwarz 不等式:
若 E(X2),E(Y2)<+∞ ,则 E(XY)2≤E(X2)E(Y2)
等号⟺∃t0,P(Y=t0X)=1
∴ρXY∈[−1,1]
$\rho_{XY}^2=1\iff \exists a,b,P(Y=aX+b)=1 $
独立一定不相关,反之不一定
e.g. X=cosθ,Y=sinθ,θ∈[0,2π)
若 (X,Y)∼(μ1,μ2,σ1,σ2,ρ) ,则 Cov(X,Y)=σ1σ1ρ ,独立与不相关等价
若 X,Y 均为正态分布且不相关,不一定独立
e.g. Y=WX ,其中 W\sim \pmatrix{0&1\\\frac{1}{2}&\frac{1}{2}}
概率极限定理
大数定律
- 频率可以近似概率
- Xˉ 的稳定性
-
依概率收敛:{Xn} 为随机变量序列, ∀ϵ>0,limn→∞P(∣Xn−X∣>ϵ)=0 ,记作 XnPX
-
按分布收敛(弱收敛):CDF任一连续点均收敛,记作 XnLX
-
几乎必然收敛(强收敛):P(w:limn→∞Xn(w)=X(w))=1 ,称 Xn 几乎必然收敛于 X ,记作 Xna.s.X
Chebyshev 大数定律
若 {Xn} 独立,∃C,D(Xn)≤C ,则 n1∑k=1n(Xk−E(Xk))P0
证明:根据 Chebyshev 不等式
P(∣n1∑k=1n(Xk−E(Xk))∣>ϵ)≤ϵ2D(n1∑k=1nXk)=n21∑k=1nϵ2D(Xk)≤nϵ2C→0
Bernoulli 大数定律
设 nA 为 n 重 Bernoulli 试验中 A 发生的次数,每次事件 A 发生概率 p ,则 nnAPp
博雷尔强大数定律:
设 nA 为 n 重 Bernoulli 试验中 A 发生的次数,每次事件 A 发生概率 p ,则 nnAa.s.p
Khinchin 大数定律
若 {Xn} 独立同分布,E(X)=μ ,则 n1∑k=1nXkPμ
科尔莫戈罗夫强大数定律:
若 {Xn} 独立同分布,E(X)=μ ,则 n1∑k=1nXka.s.μ
一般地,大数定律需要满足 Markov条件:D(n1∑i=1nXk)→0
中心极限定理
莱维-林德伯格中心极限定理
若 Xn 独立同分布,E(Xn)=μ,D(Xn)=σ2>0 ,则
nσ1(∑k=1nXk−nμ) 的 CDF 收敛到 ϕ(x)=2π1∫−∞xe−2t2dt
棣莫弗-拉普拉斯极限定理
np(1−p)nA−np 的 CDF 收敛到 ϕ(x)
a,b 为整数
一般取 P(a≤nA≤b)=P(a−ϵ1≤nA≤b+ϵ2)=ϕ(np(1−p)nB+ϵ2−np)−ϕ(np(1−p)nA−ϵ1−np)
ϵ1=ϵ2=0.5
数理统计的基本概念
统计量
若 X1,X2,...,Xn 是来自总体 X 的样本,g(x1,x2,...,xn) 是 n 元连续函数,且不含未知参数,则称 g(x1,x2,...,xn) 为统计量。
常用统计量:
名称 |
定义 |
样本均值 |
Xˉ=n1∑i=1nXi |
样本方差 |
S2=n−11∑i=1n(Xi−Xˉ)2=n−11(∑i=1nXi2−nXˉ2) |
样本标准差 |
S=S2 |
样本 k 阶矩 |
Ak=n1∑i=1nXik |
样本 k 阶中心矩 |
Bk=n1∑i=1n(Xi−Xˉ)k |
Sn=B2 , S2=n−1nSn2
若 E(X)=μ,D(X)=σ2
则 E(Xˉ)=μ,D(Xˉ)=nσ2,E(S2)=σ2
证明:
E(Xˉ)=n1∑i=1nE(Xi)=μ
D(Xˉ)=n21∑i=1nD(Xi)=nσ2
E(S2)=n−11E(∑i=1nXi2−nXˉ2)=n−1n(E(X2)−E(Xˉ2))=n−1n((D(X)+E(X)2)−(D(Xˉ)+E(Xˉ)2))=n−11(n(σ2+μ2)−n(nσ2+μ2))=σ2
- 顺序统计量 X(k)(X1,...,Xn) 表示第 k 小值
fk(x)=n(k−1n−1)F(x)k−1(1−F(x))n−kf(x)
χ2 分布
X1,X2,...,Xn 相互独立且服从分布 N(0,1) , χ2=X12+X22+...+Xn2
称 χ2∼χ2(n)
f(x)=22nΓ(2n)1x2n−1e−2xI(0,+∞)(x)
t 分布
X∼N(0,1),Y∼χ2(n) ,X,Y 相互独立,称 T=Y/nX 服从自由度为 n 的 t 分布,记作 T∼t(n)
概率密度函数:h(t)=πnΓ(2n)Γ(2n+1)(1+nt2)−2t+1
F 分布
若 X∼χ2(n1),Y∼χ2(n2),F=Y/n2X/n1 ,记为 F∼F(n1,n2)
概率密度函数:ψ(x)=Γ(2n1)Γ(2n2)(1+n2n1x)2n1+n2Γ(2n1+n2)(n2n1)2n1x2n1−1I(0,+∞)(x)
当 n2→+∞ 时 FPχ2(n1)/n1
正态总体的抽样分布
正态总体基本定理
若 X1,X2,...,Xn 为来自正态总体 X∼N(μ,σ2) 的样本,Xˉ=n1∑i=1nXi,S2=n−11∑i=1n(Xi−Xˉ)2 ,则
- nσXˉ−μ∼N(0,1)
- σ2(n−1)S2∼χ2(n−1)
- Xˉ 与 S2 相互独立
- nSXˉ−μ∼t(n−1)
证明:
根据正态分布的性质, Xˉ∼N(μ,nσ2)
∴nσXˉ−μ∼N(0,1)
构造正交阵 A
A=⎣⎢⎢⎢⎢⎢⎢⎡n11×212×31...(n−1)n1n1−212×31...(n−1)n1n10−32...(n−1)n1...............n100...−nn−1⎦⎥⎥⎥⎥⎥⎥⎤
若 X∼N(μ,B)
则 Y=AX∼N(Aμ,ABAT)
∵B=σ2I
∴ABAT=σ2I
∴Yi 相互独立(因为满足多维正态)
根据正态分布的性质, Y1∼N(nμ,σ2);Yi∼N(0,σ2),i>1 ,均服从正态分布
∵Xˉ=nY1
且 ∑i=1nYi2=YTY=XXT=∑i=1nXi2
∴S2=n−11∑i=1nXi2−(n−1)nXˉ2=n−11∑i=2nYi2
∴Xˉ 和 S2 相互独立
∴σ2(n−1)S2∼χ2(n−1)
∴n−1σ2(n−1)S2nσXˉ−μ=nSXˉ−μ∼t(n−1)
若 X∼N(μ1,σ2),Y∼N(μ2,σ2) 且相互独立,S1=m−11∑i=1m(Xi−Xˉ)2,S2=n−11∑i=1n(Yi−Yˉ)2
则 T=Swm1+n1Xˉ−Yˉ−(μ1−μ2)∼t(m+n−2)
其中 Sw2=m+n−2(m−1)S12+(n−1)S22
参数估计
通过样本的观察值,估计未知分布的参数
点估计
用某一数值作为近似值
矩估计
若总体 X 的分布函数为 F(x;θ)
计算出 E(Xk)=gk(θ)
E(Xk) 替换为样本矩 n1∑i=1nXik
解出 θ=h(X1,X2,...,Xn)
(尽量使用低阶矩)
最大似然估计
似然函数:L(\theta)=L(\theta;x_1,x_2,...,x_n)=\cases{\prod_{i=1}^np(x_i;\theta), 离散型\\\prod_{i=1}^nf(x_i;\theta),连续型}
若 ∃θ^(x1,x2,...,xn), L(θ^)=maxθL(θ) ,称 θ^(x1,x2,...,xn) 为 θ 的最大似然估计值,θ(X1,X2,...,Xn) 为最大似然估计量。
最大似然估计值不一定唯一(e.g. U(θ,θ+1))
若 g(θ) 是单射,则 θ 的 MLE 也是 g(θ) 的 MLE
优良性准则
相合性
若 θ^Pθ,∀θ∈Θ ,称 θ^ 为 θ 的相合估计量
(样本均值、样本方差、样本矩都是)
渐进正态性:若 σn(θ)θ^n−θLN(0,1) ,记为 θ^n∼AN(θ,σn2(θ))
e.g. Poisson 分布: λ^n∼AN(λ,λ/n)
无偏性
若 E(θ^)=θ,∀θ∈Θ ,称 θ^ 为 θ 的无偏估计量
limn→θE(θ^)=θ 为渐进无偏估计
(样本均值、样本方差、样本矩都是)
若 g(θ) 是单射, θ 的无偏估计不一定是 g(θ) 的无偏估计,g(θ) 为线性函数时才是
有效性
若 θ^1,θ^2 均为 θ 的无偏估计量,且 D(θ^1)≤D(θ^2),∀θ∈Θ ,且 ∃θ∈Θ,D(θ^1)<D(θ^2) ,称 θ^1 比 θ^2 有效
一致最小方差无偏估计(UMVUE):D(θ^) 取到下界
均方误差:MSE(θ^)=E((θ^−θ)2)=E(θ^2)−2θE(θ^)+θ2
无偏估计 MSE(θ^)=D(θ^)
一致最小均方误差估计
区间估计
在要求的精度范围内指出参数区间
找两个统计量 θ(X1,X2,...,Xn) 和 θ(X1,X2,...,Xn)
若 P(θ<θ<θ)=1−α
称 (θ,θ) 是 θ 置信度为 1−α 的置信区间
若 θ 离散,置信区间可能不存在
枢轴量法:
-
构造 Z=Z(X1,X2,...,Xn;θ) ,Z 分布已知,不依赖 θ
-
选取 a,b 满足 P(a<Z(X1,X2,...,Xn;θ)<b)=1−α
-
求 θ 置信区间,若 P(θ<θ<θ)=1−α ,称 (θ,θ) 为 1−α 的置信区间
单侧置信区间:(θ,+∞),(−∞,θ)
正态总体均值和方差的区间估计
置信度 1−α
单样本:
X∼N(μ,σ2)
Xˉ=n1∑i=1nXi,S2=n−11∑i=1n(Xi−Xˉ)2
条件 |
估计变量 |
枢轴量 |
置信区间 |
σ2 已知 |
μ |
σ/nXˉ−μ∼N(0,1) |
(Xˉ±nσzα/2) |
σ2 未知 |
μ |
S/nXˉ−μ∼t(n−1) |
(Xˉ±nSt2α(n−1)) |
μ 已知 |
σ2 |
∑i=1n(σXi−μ)2∼χ2(n) |
∑i=1n(Xi−μ)2⋅(χα/22(n)1,χ1−α/22(n)1) |
μ 未知 |
σ2 |
σ2(n−1)S2∼χ2(n−1) |
(n−1)S2⋅(χα/22(n−1)1,χ1−α/22(n−1)1) |
单侧置信区间
单侧置信下限
P(θ>θ)=1−α
单侧置信上限
P(θ<θ)=1−α
假设检验
基本思想和概念
- 建立假设
- 选择检验统计量 T ,确定拒绝域形式(单侧,双侧)
- 给定 α ,通过临界值确定拒绝域
- 作出判断
H0 :原假设
H1 :备择假设
第一类错误(弃真):PH0(拒绝H0)=α
第二类错误(取伪):PH1(接受H0)=β
正态总体均值和方差假设检验
单个
若 x1,x2,...,xn 为正态总体 x∼N(μ,σ2) 的样本,xˉ=n1∑i=1nxi,S2=n−11∑i=1n(xi−xˉ)2
μ 的假设检验:μ 未知, μ0 为假设
- 若 σ2 已知:检验统计量 u=σ/nxˉ−μ0∼N(0,1)
- 若 σ2 未知:检验统计量 T=S/nxˉ−μ0∼t(n−1)
σ2 的假设检验:σ2 未知,σ02 为假设
- 若 μ 已知,检验统计量 T=σ021∑i=1n(xi−μ)2∼χ2(n)
- 若 μ 未知,检验统计量 T=σ021(n−1)S2∼χ2(n−1)
两个
略