概率论与数理统计

随机变量的分布

分布函数

F(x)=P{Xk}F(x)=P\left\{ X\leq k \right\}

可推知

P{x1<Xx2}=F(x2)F(x1)P\left\{ x_1<X\leq x_2 \right\}=F(x_2)-F(x_1)

二元情况下有

F(x,y)=P{Xx,Yy}F(x,y)=P\{X\leq x,Y\leq y\}

P{x1<Xx2,y1<Yy2}=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)P\{x_1<X\leq x_2,y_1<Y\leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)

密度函数

F(x)=xf(t)dtF(x)=\displaystyle \int^x_{-\infty}f(t)dt

f(x)f(x)XX的概率密度函数

f(x)=F(x)f(x)=F'(x)

二元情况下有

F(x,y)=xyf(u,v)dudvF(x,y)=\displaystyle \int^x_{-\infty}\int^y_{-\infty}f(u,v)dudv

P{(X,Y)D}=Df(x,y)dxdyP\{(X,Y)\in D\}= \iint \limits_Df(x,y)dxdy

2F(x,y)xy=f(x,y)\dfrac{\partial^2F(x,y)}{\partial x \partial y}=f(x,y)

边际密度函数

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dxf_X(x)=\displaystyle\int^{+\infty}_{-\infty}f(x,y)dy\\ f_Y(y)=\displaystyle\int^{+\infty}_{-\infty}f(x,y)dx

条件密度函数

给定{X=x}\{X=x\}的情况下YY的条件密度函数

fYX(yx)=f(x,y)fX(x)f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}

P(XxY=y)=xfXY(xy)dxP(X\leq x|Y=y)=\displaystyle\int^x_{-\infty}f_{X|Y}(x|y)dx

反函数的密度函数

Y=g(X)Y=g(X),若函数gg是一处处可导的严格单调函数,其值域为DD,记y=g(x)y=g(x)的反函数为x=h(y)x=h(y),则YY的密度函数为

fY(y)={fX(h(y))h(y),yD0,yDf_Y(y)=\begin{cases} f_X(h(y))\cdot|h'(y)|,y\in D\\ 0,y\notin D \end{cases}

联合分布律

P{X=xi,Y=yj}=pij,i,j=1,2,...P\{X = x_i,Y = y_j\}=p_{ij},i,j=1,2,...

边际分布律

P{X=xi}=j=1+pij=piP{Y=yj}=i=1+pij=pjP\{X=x_i\}=\displaystyle \sum^{+\infty}_{j=1}p_{ij}=p_i\\ P\{Y=y_j\}=\displaystyle \sum^{+\infty}_{i=1}p_{ij}=p_j

条件分布律

P{X=xiY=yj}=P{X=xi,Y=yj}P{Y=yj},i=1,2,...P\{X=x_i|Y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}},i=1,2,...

即给定给定Y=yjY=y_j条件下的条件分布律

独立性

  1. X,YX,Y相互独立当且仅当对任意实数x,yx,y

F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)

  1. X,YX,Y相互独立当且仅当对任意实数xi,xjx_i,x_j都有

P{X=xi,Y=yj}=P{X=xi}P{X=xj}P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{X=x_j\}

  1. X,YX,Y相互独立当且仅当下式几乎处处成立(即面积等于0的区域可以不成立,具体参见课本。)

f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)

独立充要条件的定理

二维连续型随机变量X,YX,Y相互独立的充要条件是X,YX,Y的联合密度函数f(x,y)f(x,y)几乎处处可以写成xx的函数m(x)m(x)yy的函数n(y)n(y)的乘积,即

f(x,y)=m(x)n(y),<x,y<+,f(x,y)=m(x)\cdot n(y),-\infty<x,y<+\infty,

Z=X+YZ=X+Y的分布

二维离散型随机变量

显然有

P{Z=zk}=P{X+Y=zk}=i=1+P{X=xi,Y=zkxi},k=1,2,...P\{Z=z_k\}=P\{X+Y=z_k\}=\displaystyle\sum^{+\infty}_{i=1}P\{X=x_i,Y=z_k-x_i\},k=1,2,...

同理

P{Z=zk}=P{X+Y=zk}=i=1+P{X=zkyi,Y=yi},k=1,2,...P\{Z=z_k\}=P\{X+Y=z_k\}=\displaystyle\sum^{+\infty}_{i=1}P\{X=z_k-y_i,Y=y_i\},k=1,2,...

X,YX,Y相互独立时有

P{Z=zk}=P{X=xi}P{Y=zkyi}P\{Z=z_k\}=P\{X=x_i\}P\{Y=z_k-y_i\}

P{Z=zk}=P{X=zkyi}P{Y=yi}P\{Z=z_k\}=P\{X=z_k-y_i\}P\{Y=y_i\}

二维连续型随机变量

fz(z)=+f(x,zx)dyf_z(z)=\displaystyle\int^{+\infty}_{-\infty}f(x,z-x)dy

fz(z)=+f(zy,y)dyf_z(z)=\displaystyle\int^{+\infty}_{-\infty}f(z-y,y)dy

X,YX,Y相互独立时有

fZ(z)=+fX(x)fY(zx)dxf_Z(z)=\displaystyle\int^{+\infty}_{-\infty}f_X(x)f_Y(z-x)dx

fZ(z)=+fX(zy)fY(y)dyf_Z(z)=\displaystyle\int^{+\infty}_{-\infty}f_X(z-y)f_Y(y)dy

例题

设某服务台顾客等待时间(以min计)XX服从参数为λ\lambda的指数分布,接受服务的时间YY服从区间(0.20)(0.20)上的均匀分布,且设X,YX,Y相互独立。记Z=X+YZ=X+Y.
(1)求ZZ的密度函数fZ(t)f_Z(t)
(2)设λ=120\lambda=\frac{1}{20},求等待与接收服务的总时间不超过45min的概率。

(1)由题意知

fX(x)={λeλx,x>00,x0,fY(y)={120,0<y<200,其他f_X(x)=\begin{cases} \lambda e^{-\lambda x},x>0\\ 0,x\leq 0 \end{cases},f_Y(y)=\begin{cases} \dfrac{1}{20},0<y<20\\ 0,其他 \end{cases}

X,YX,Y相互独立,可知X,YX,Y的联合密度函数为

f(x,y)=fX(x)fY(y)={120λeλx,x>0,0<y<200,其他f(x,y)=f_X(x)f_Y(y)=\begin{cases} \dfrac{1}{20}\lambda e^{-\lambda x},x>0,0<y<20\\ 0,其他 \end{cases}

f(x,tx)={120λeλx,x>0,0<tx<200,其他f(x,t-x)=\begin{cases} \dfrac{1}{20}\lambda e^{-\lambda x},x>0,0<t-x<20\\ 0,其他 \end{cases}

fZ(t)=+f(x,tx)dxf_Z(t)=\displaystyle\int^{+\infty}_{-\infty}f(x,t-x)dx

如图
t0t\leq 0时,fZ(t)=0f_Z(t)=0

0<t<200<t<20时,fZ(t)=0t120λeλx=120(1eλt)f_Z(t)=\displaystyle\int^{t}_{0}\frac{1}{20}\lambda e^{-\lambda x}=\frac{1}{20}(1-e^{-\lambda t})

t20t\geq20时,fZ(t)=t20t120λeλx=120eλt(e20λ1)f_Z(t)=\displaystyle\int^{t}_{t-20}\frac{1}{20}\lambda e^{-\lambda x}=\frac{1}{20}e^{-\lambda t}(e^{20\lambda }-1)

(2)P{X45}=45fZ(t)=0.8189P\{X\leq 45\}=\displaystyle \int^{45}_{-\infty}f_Z(t)=0.8189

M=max{X,Y},m=min{X,Y}M=max\{X,Y\},m=min\{X,Y\}的分布

FM(t)=P{max{X,Y}t}=P{Xt,Yt}=F(t,t)F_M(t)=P\{max\{X,Y\}\leq t\}=P\{X\leq t,Y\leq t\}=F(t,t)

X,YX,Y独立时

FM(t)=FX(t)FY(t)F_M(t)=F_X(t)\cdot F_Y(t)

FN(t)=P{min{X,Y}t}=P{(Xt)(Yt)}=FX(t)+FY(t)F(t,t)F_N(t)=P\{min\{X,Y\}\leq t\}=P\{(X\leq t)\cup (Y\leq t)\}=F_X(t)+F_Y(t)-F(t,t)

或者

FN(t)=1P{X>t,Y>t}F_N(t)=1-P\{X>t,Y>t\}

X,YX,Y独立时

FN(t)=FX(t)+FY(t)FX(t)FY(t)F_N(t)=F_X(t)+F_Y(t)-F_X(t)F_Y(t)

推广到nn

FM(t)=i=1nFi(t)F_M(t)=\displaystyle\prod^n_{i=1}F_i(t)

FN(t)=1i=1n[1Fi(t)]F_N(t)=\displaystyle1-\prod^n_{i=1}\left[1-F_i(t)\right]

随机变量的数字特征

期望

对于离散型随机变量XX

P{X=xi}=pi,i=1,2,3P\{X=x_i\}=p_i,i=1,2,3

若级数xipi\displaystyle x_ip_i绝对收敛,则称级数xipi\displaystyle x_ip_iXX的期望
对于连续型随机变量XX,若

+xf(x)<+\displaystyle\int^{+\infty}_{-\infty}|x|f(x)<+\infty

则称+xf(x)<+\displaystyle\int^{+\infty}_{-\infty}xf(x)<+\inftyXX的期望

E(g(X))=i=1ng(xi)piE(g(X))=\displaystyle\sum^n_{i=1}g(x_i)p_i

E(g(X))=+g(x)f(x)dxE(g(X))=\displaystyle\int^{+\infty}_{-\infty}g(x)f(x)dx

其中f(x)f(x)XX的密度函数

E(h(X,Y))=++h(x,y)f(x,y)dxdyE(h(X,Y))=\displaystyle\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}h(x,y)f(x,y)dxdy

其中f(x,y)f(x,y)X,YX,Y的联合密度函数

期望的性质

E(c0+i=1nciXi)=c0+i=1nciE(Xi)E\left(c_0+\displaystyle\sum^n_{i=1}c_iX_i\right)=c_0+\displaystyle\sum^n_{i=1} c_iE(X_i)

  1. Xi(i=1,2,...,n)X_i(i=1,2,...,n)相互独立,且数学期望都存在,则有

E(i=1nXi)=i=1nE(Xi)E\left(\prod^n_{i=1}X_i\right)=\prod^n_{i=1}E(X_i)

条件期望

给定X=xX=x

E{Yx}=E{YX=x}=j=1+yjpj(x)E\{Y|x\}=E\{Y|X=x\}=\displaystyle\sum^{+\infty}_{j=1}y_jp_j(x)

E{Yx}=E{YX=x}=+yfYX(yx)dyE\{Y|x\}=E\{Y|X=x\}=\displaystyle\int^{+\infty}_{-\infty}yf_{Y|X}(y|x)dy

全期望公式

E(Y)=E[E(YX)]E(Y)=E[E(Y|X)]

当(X,Y)为二维离散型随机变量时

E(Y)=i=1+E(YX=i)P{X=i}E(Y)=\displaystyle\sum^{+\infty}_{i=1}E(Y|X=i)P\{X=i\}

当(X,Y)为二维连续型随机变量时

E(Y)=+E(YX=x)fX(x)dxE(Y)=\displaystyle\int^{+\infty}_{-\infty}E(Y|X=x)f_X(x)dx

方差

Var(X)=E[(XE(X))2]Var(X)=E[(X-E(X))^2]

对于离散变量

Var(X)=i=0+(xiE(X))2piVar(X)=\displaystyle\sum^{+\infty}_{i=0}(x_i-E(X))^2p_i

对于连续变量

Var(X)=+(xE(X))2f(x)dxVar(X)=\displaystyle\int^{+\infty}_{-\infty}(x-E(X))^2f(x)dx

Var(X)=E(X2)E(X)2Var(X)=E(X^2)-E(X)^2

推论:若某一随机变量平方的数学期望存在,则一定保证了这个随机变量数学期望的存在性。

方差的性质

  1. Var(cX)=c2Var(X)Var(cX)=c^2Var(X)
  2. Var(X+c)=Var(X)Var(X+c)=Var(X)
  3. 推广:Var(c0+i=1nciXi)=i=1nci2Var(Xi)Var\left(c_0+\displaystyle\sum^n_{i=1}c_iX_i\right)=\displaystyle\sum^n_{i=1}c_i^2Var(X_i)
  4. Var(X)E[(Xc)2]Var(X)\leq E[(X-c)^2],当且仅当E(X)=cE(X)=c时等号成立
  5. X1,X2,...,XnX_1,X_2,...,X_n为两两独立的随机变量,方差都存在,则

Var(i=1nXi)=i=1nVar(Xi)Var\left(\displaystyle\sum^n_{i=1}X_i\right)=\displaystyle\sum^{n}_{i=1}Var(X_i)

  1. XX的方差存在时,Var(x)=0Var(x)=0当且仅当P{X=c}=1P\{X=c\}=1,其中c=E(X)c=E(X)

协方差

Cov(X,Y)=E[(XE(X))(YE(Y))]Cov(X,Y)=E[(X-E(X))(Y-E(Y))]

对二维离散型变量

Cov(X,Y)=i=1+j=1+(xiE(X))(yjE(Y))pijCov(X,Y)=\displaystyle\sum^{+\infty}_{i=1}\sum^{+\infty}_{j=1}(x_i-E(X))(y_j-E(Y))p_{ij}

对二维连续型变量

Cov(x,y)=++(xE(X))(yE(Y))f(x,y)dxdyCov(x,y)=\displaystyle\int^{+\infty}_{-\infty}\displaystyle\int^{+\infty}_{-\infty}(x-E(X))(y-E(Y))f(x,y)dxdy

通常使用以下公式

Cov(X,Y)=E(XY)E(X)E(Y)Cov(X,Y)=E(XY)-E(X)E(Y)

协方差的性质

Var(i=1nXi)=i=1nVar(Xi)+21i<jnCov(Xi,Xj)Var(\displaystyle\sum^{n}_{i=1}X_i)=\displaystyle\sum_{i=1}^{n}Var(X_i)+2\sum_{1\leq i < j \leq n}Cov(X_i,X_j)

  1. Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
  2. Cov(X,X)=Var(X)Cov(X,X)=Var(X)
  3. Cov(aX,bY)=abCov(X,Y)Cov(aX,bY)=abCov(X,Y)
  4. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)
  5. Var(X)Var(Y)0时,有(Cov(X,Y))2Var(X)Var(Y)Var(X)\cdot Var(Y)\neq 0 时,有(Cov(X,Y))^2\leq Var(X)Var(Y),其中等号成立当且仅当X,YX,Y有严格的线性关系

独立与相关

相关系数

ρXY=Cov(X,Y)Var(X)Var(Y)\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}

ρXY=0\rho_{XY}=0则称X,YX,Y不相关

不相关

  1. ρ(X,Y)=0\rho(X,Y)=0
  2. Cov(X,Y)=0Cov(X,Y)=0
  3. E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
  4. Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y)
  5. 独立一定不相关,但反之不然。

重要随机变量的概率分布

0-1(p)分布,两点分布

P{X=k}=pk(1p)1k,k=0,1...P\left\{ X=k \right\}=p^k(1-p)^{1-k}, k=0,1...

二项分布,n重伯努利实验

P{X=k}=Cnkpk(1p)nk,k=0,1,2,...,n.P\left\{ X=k \right\}=C_n^kp^k(1-p)^{n-k},k=0,1,2,...,n.

泊松分布

P{X=k}=eλλkk!,k=0,1,2,...P\left\{ X=k \right\}=\frac{e^{-\lambda}\lambda^k}{k!},k=0,1,2,...

均匀分布

f(x)={1ba,x(a,b)0,其他f(x)=\begin{cases} \dfrac{1}{b-a},x\in(a,b)\\ 0,其他 \end{cases}

F(x)={0,x<axaba,ax<b1,xbF(x)=\begin{cases} 0,x<a\\ \dfrac{x-a}{b-a},a\leq x<b\\ 1,x\geq b \end{cases}

正态分布

指数分布

f(x)={λeλx,x>00,x0f(x)=\begin{cases} \lambda e^{-\lambda x},x>0\\ 0,x\leq 0 \end{cases}

F(x)=xf(t)dt={1eλx,x>00,x0F(x)=\displaystyle \int^x_{-\infty}f(t)dt=\begin{cases} 1-e^{-\lambda x},x>0\\ 0,x\leq 0 \end{cases}

二元均匀分布

f(x,y)={1SD,(x,y)D0,其他f(x,y)=\begin{cases} \dfrac{1}{S_D},(x,y)\in D\\ 0,其他 \end{cases}

二元正态分布

f(x,y)=12πρ1ρ21ρ2e12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]f(x,y)=\frac{1}{2\pi \rho_1 \rho_2}\sqrt{1-\rho^2}\cdot e^{\displaystyle -\dfrac{1}{2(1-\rho^2)}\left[\dfrac{(x-\mu_1)^2}{\sigma_1^2} - 2\rho \dfrac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2} + \dfrac{(y-\mu_2)^2}{\sigma_2^2}\right]}

fX(x)=12πσ1e(xμ1)22σ12f_X(x)=\dfrac{1}{\sqrt{2\pi}\sigma_1}e^{-\dfrac{(x-\mu_1)^2}{2\sigma_1^2}}

fY(y)=12πσ2e(xμ2)22σ22f_Y(y)=\dfrac{1}{\sqrt{2\pi}\sigma_2}e^{-\dfrac{(x-\mu_2)^2}{2\sigma_2^2}}

XN(μ1,σ12),YN(μ2,σ22)X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)

给定X=xX=x

YN(μ2+ρσ2σ1(xμ1),(1ρ2σ2)2)Y\sim N(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(x-\mu_1),(\sqrt{1-\rho^2}\sigma_2)^2)

给定Y=yY=y

YN(μ1+ρσ1σ2(yμ2),(1ρ2σ1)2)Y\sim N(\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2),(\sqrt{1-\rho^2}\sigma_1)^2)