随机变量及其分布
随机变量及其分布
分布函数: $def: F(x) = P(X \le x)$
- 性质: 非负性、单调性、规范性、连续性(右连续)
离散分布
- 二项分布: $X \sim B(n, p)$
- $P(X=k) = C_n^k p^k (1-p)^{n-k} \quad (k=0, 1, \dots, n)$
- $EX = np$, $VarX = np(1-p)$
- 几何分布: $X \sim Ge(p)$
- $P(X=k) = (1-p)^{k-1}p \quad (k=1, 2, \dots)$
- $EX = \frac{1}{p}$, $VarX = \frac{1-p}{p^2}$
- 泊松分布: $X \sim P(\lambda)$
- $P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad (k=0, 1, 2, \dots)$
- $EX = \lambda$, $VarX = \lambda$
- 泊松定理: $X \sim B(n, p) \xrightarrow[\text{近似}]{np \to \lambda, n \text{很大}} X \sim P(np)$
连续分布
均匀分布: $X \sim U(a, b)$
- $f(x) = \begin{cases} \frac{1}{b-a} & a < x < b \ 0 & \text{余} \end{cases}$
- $EX = \frac{a+b}{2}$
- $VarX = \frac{(b-a)^2}{12}$
- $F(x) = \begin{cases} 0 & x < a \ \frac{x-a}{b-a} & a \le x < b \ 1 & x \ge b \end{cases}$
指数分布: $X \sim E(\lambda)$
- $f(x) = \begin{cases} \lambda e^{-\lambda x} & x > 0 \ 0 & \text{余} \end{cases}$
- $EX = \frac{1}{\lambda}$
- $VarX = \frac{1}{\lambda^2}$
- $F(x) = \begin{cases} 1 - e^{-\lambda x} & x > 0 \ 0 & x \le 0 \end{cases}$
- tips:指数分布具有无记忆性,即 $P(X > s+t | X > s) = P(X > t)$
① 问“小于” ($X \le x$):即“在 $x$ 时间前坏掉/发生”的概率:
$$F(x) = P(X \le x) = 1 - e^{-\lambda x}$$
② 问“大于” ($X > x$):即“活过 $x$ 时间 / 至少能用 $x$ 小时”的概率(这叫生存函数):
$$P(X > x) = e^{-\lambda x}$$
正态分布: $X \sim N(\mu, \sigma^2)$
- $f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \quad -\infty < x < +\infty$
- $EX = \mu$, $VarX = \sigma^2$
- 标准正态分布: $X \sim N(0, 1)$, $\varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$
- $F(x) = P(X \le x) = P(\frac{X-\mu}{\sigma} \le \frac{x-\mu}{\sigma}) = \Phi(\frac{x-\mu}{\sigma})$
- 性质: $\Phi(-a) = 1 - \Phi(a)$, $\Phi(0) = \frac{1}{2}$, $P(|X| \le a) = 2\Phi(a) - 1$
if $f(x) = Ae^{ax+bx+c}$ $(x \in (a, b) (or) x \in (-\infty, +\infty))$ 则为正态
随机变量函数的分布
- 命题: $F_Y(y) = P(Y \le y) = P(g(X) \le y) = \int_{g(x)\le y} f_X(x)dx$
- 定理: $X$ 的密度函数 $f_X(x)$ 在 $(a, b)$ 之间严格单调,则 $Y=f(X)$ 服从 $(a, b)$ 上的分布:
- $0 \le y \le 1$: $f_Y(y) = P(|{y}|) = P(F^{-1}(y)) |(F^{-1})’(y)|$
- $ = P|X \le F^{-1}(y)| = F(F^{-1}(y)) = y$ (均匀分布)
- 一般地:$f_Y(y) = f_X[h(y)] \cdot |h’(y)|$ (其中 $x=h(y)$ 是反函数)
多维随机变量及分布
$$F(x, y) = P(X \le x, Y \le y)$$
- 性质:
- $F(+\infty, +\infty) = 1$, $F(-\infty, +\infty) = 0$, $F(+\infty, -\infty) = 0$
- 非负性、规范性、单调不减性、右连续性
- $P(x_1 < X \le x_2, y_1 < Y \le y_2) = F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1)$
二维连续
- $F(x, y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) du dv$
- $P((X,Y) \in G) = \iint_G f(x, y) dx dy$
边缘概率密度
- $f_X(x) = \int_{-\infty}^{+\infty} f(x, y) dy$
- $f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) dx$
条件概率密度
- $f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$ 为在 $Y=y$ 条件下 $X$ 的概率密度(要写出来)
独立性
$f(x, y) = f_X(x) \cdot f_Y(y)$
二维均匀分布
$A = S_D$, $f(x, y) = \begin{cases} \frac{1}{S_D} & (x, y) \in D \ 0 & \text{余} \end{cases}$
性质:
- $(X, Y)$ 在 $D = { (x, y) | a \le x \le b, c \le y \le d }$ 上服从二维均匀分布 $\iff X \sim U(a, b), Y \sim U(c, d)$
- $(X, Y) \in G, P((X, Y) \in G) = \frac{S_G}{S_D}$
- But!!! $(X, Y)$ 服从二维均匀分布 $\nRightarrow X, Y$ 服从一维均匀分布 (反之亦然)
二维正态、极值、可加性与数字特征
二维正态分布: $(X, Y) \sim N(\mu_1, \mu_2; \sigma_1^2, \sigma_2^2; \rho)$
性质:
- 边缘分布是正态分布: $X \sim N(\mu_1, \sigma_1^2)$, $Y \sim N(\mu_2, \sigma_2^2)$
- $X$ 与 $Y$ 相互独立之充要条件 $\rho = 0$
- $aX + bY \sim N(a\mu_1 + b\mu_2, a^2\sigma_1^2 + b^2\sigma_2^2 + 2ab\rho\sigma_1\sigma_2)$
- 条件分布正态分布
- $(aX+b, cY+d)$ 也服从二维正态。$|\begin{smallmatrix} a & b \ c & d \end{smallmatrix}| \ne 0$
计算: $X_1 \sim N(\mu_1, \sigma_1^2)$ 且相互独立 $\sum a_i X_i \sim N(\sum a_i \mu_i, \sum a_i^2 \sigma_i^2)$
二维随机变量函数分布:
$F_Z(z) = P(Z \le z) = P(X+Y \le z) = \iint_{x+y \le z} f(x, y) dx dy$
两种方法,一种分布函数法,普遍适用,如果相互独立,可以卷积
如果 $X$ 和 $Y$ 独立,我们可以跳过二重积分,直接套单重积分公式。
卷积公式:
$$f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) \cdot f_Y(z-x) , dx$$
两个坑
- $f_Y(z-x)$ 是啥? 就是把 $f_Y(y)$ 里的 $y$ 替换成 $z-x$。
- 积分限怎么定?
- 公式写的是 $-\infty$ 到 $+\infty$,但实际上要看 $f_X(x)$ 和 $f_Y(z-x)$ 哪里不为 0
- 我们要找这两个函数“非零区域”的交集
最大值最小值分布:
$$X_1 \dots X_n$$ 相互独立
- $U = \max{X_1 \dots X_n}$
- $F_{max}(z) = F_{X_1}(z) F_{X_2}(z) \dots F_{X_n}(z)$
- if iid $F_{max}(z) = [F(z)]^n$
- $V = \min{X_1 \dots X_n}$
- $F_{min}(z) = 1 - [1-F_{X_1}(z)][1-F_{X_2}(z)]\dots[1-F_{X_n}(z)]$
- if iid $F_{min}(z) = 1 - [1-F(z)]^n$
具有可加性的分布:
- $X_i \sim B(n_i, p) \Rightarrow X_1 + X_2 + \dots + X_n \sim B(n_1+\dots+n_k, p)$
- (独立同分布)
- $X_i \sim P(\lambda_i) \Rightarrow X_1 + X_2 + \dots + X_k \sim P(\lambda_1 + \dots + \lambda_k)$
- $X_i \sim N(\mu_i, \sigma_i^2) \Rightarrow a_1 X_1 + a_2 X_2 + \dots + a_k X_k \sim N(\sum a_i \mu_i, \sum a_i^2 \sigma_i^2)$
- $X_i \sim \chi^2(n_i) \Rightarrow X_1 + X_2 + \dots + X_k \sim \chi^2(n_1 + n_2 + \dots + n_k)$
- $X_i \sim E(\lambda) \Rightarrow \min(X_1, X_2 \dots X_k) \sim E(\lambda_1 + \lambda_2 + \dots + \lambda_k)$
数字特征
- 期望:性质:$E(c) = c$, $E(cX) = cE(X)$, $E(X+c) = E(X)+c$, $X, Y$ 相互独立 $E(XY) = E(X)E(Y)$
- 方差:性质:$Var(c) = 0$, $Var(cX) = c^2 VarX$, if $X, Y$ 相互独立 $Var(X \pm Y) = VarX + VarY$
- 切比雪夫不等式: $def: P(|X - EX| \ge \varepsilon) \le \frac{VarX}{\varepsilon^2}$
协方差、相关系数、大数定律
协方差
$def: Cov(XY) = E(XY) - EX \cdot EY$
性质:
- $Cov(X, X) = Cov(Y, Y)$
- $Cov(X, c) = 0$
- $Cov(aX, bY) = ab Cov(X, Y)$
- $Cov(X \pm Y, Z) = Cov(X, Z) + Cov(Y, Z)$
- $if$ $X, Y$ 独立 $Cov(X, Y) = 0$
- $Var(X \pm Y) = VarX + VarY \pm 2Cov(X, Y)$
- $Cov(X, X) = VarX$
相关系数
$def: \rho_{XY} = Corr(X, Y) = \frac{Cov(X, Y)}{\sqrt{VarX}\sqrt{VarY}}$
- if $Corr(X, Y) = 0$ 则 $X, Y$ 不相关
性质:
- $|\rho_{XY}| \le 1$, $\rho_{XX} = \rho_{YX}$, $\rho_{XX} = 1$
- $|\rho_{XY}| = 1 \iff P(Y = aX+b) = 1$
- $|\rho_{XY}|$ 越接近1,表明 $X, Y$ 的线性相关程度越大
- 只有当 $(X, Y) \sim N$,独立 $\iff$ 不相关
大数定律和中心极限定理
大数定律
$def: \lim_{n \to \infty} P(|X_n - a| \ge \varepsilon) = 0 \Rightarrow X_n \xrightarrow{P} a$ (依概率收敛)
性质: $X_n \xrightarrow{P} a$, 则 $g(X_n) \xrightarrow{P} g(a)$ ($g(x)$ 在 $a$ 处连续)
切比雪夫大数定律: $X_1 \dots X_n$ 两两不相关,且 $Var X_n$ 一致有界。 $\bar{X} \xrightarrow{P} E\bar{X}$
- $\lim_{n \to \infty} P(|\frac{1}{n}\sum X_i - \frac{1}{n}\sum EX_i| < \varepsilon) = 1$.
(常用) 辛钦大数定律: $1^\circ X_1 \dots X_n$ iid $2^\circ EX_i = \mu$ 存在。
- $\bar{X} \xrightarrow{P} \mu$, $\lim_{n \to \infty} P(|\frac{1}{n}\sum X_i - \mu| < \varepsilon) = 1$
列维-林德伯格定理: $X_1 \dots X_n$ iid, $EX_k = \mu, Var X_k = \sigma^2 > 0$
- 即:$\sum X_i \xrightarrow{近似} N(n\mu, n\sigma^2)$
- $\frac{\sum X_i - n\mu}{\sqrt{n}\sigma} = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \xrightarrow{近似} (0, 1)$.
- 棣莫弗-拉普拉斯定理: $X_n \sim B(n, p)$, $X_n \xrightarrow{n \to \infty} N(np, np(1-p))$
抽样分布、Fisher定理
常用统计量的数字特征
1. 样本均值$$\overline{X} = \frac{1}{n}\sum_{i=1}^{n}X_i ;$$
2. 样本方差$$S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2 ;$$
- 样本标准差$$S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2} ;$$
● 5个常用结论
$X_1, X_2, \cdots, X_n$ 为来自总体 $X$ 的样本,$EX = \mu, VarX = \sigma^2$
$EX_i = \mu, \quad VarX_i = \sigma^2$;
$E\overline{X} = \mu, \quad Var\overline{X} = \frac{\sigma^2}{n}$;
$ES^2 = \sigma^2$ ,$Var S^2=\frac{2\sigma^{4}}{n-1}$
三大抽样分布
- $\chi^2$ 分布: $def$: $X_1 \dots X_n$ 相互独立 $N(0, 1)$,相互独立。则 $\chi^2 = X_1^2 + \dots + X_n^2$
- $\chi^2 \sim \chi^2(n)$
- $E\chi^2 = n$, $Var\chi^2 = 2n$
- 性质:可加性: $\chi_1^2 \sim \chi^2(n_1), \chi_2^2 \sim \chi^2(n_2)$ 且独立,则 $\chi_1^2+\chi_2^2 \sim \chi^2(n_1+n_2)$
- t 分布: $def: X \sim N(0, 1), Y \sim \chi^2(n)$, $X, Y$ 独立。
- $t = \frac{X}{\sqrt{Y/n}} \sim t(n)$ (自由度为 $n$ 的 $t$ 分布)
- 性质: $t$ 分布的概率密度是偶函数
- F 分布: $def: X \sim \chi^2(n_1), Y \sim \chi^2(n_2)$, $X, Y$ 独立
- $F = \frac{X/n_1}{Y/n_2} \sim F(n_1, n_2)$
- 性质: $1) F \sim F(n_1, n_2) \Rightarrow \frac{1}{F} \sim F(n_2, n_1)$, $2) X \sim t(n) \Rightarrow X^2 \sim F(1, n)$.
正态总体抽样分布
$def: X_1 \dots X_n$ 来自 $N(\mu, \sigma^2)$,$\bar{x} = \frac{1}{n}\sum X_i, S^2 = \frac{1}{n-1}\sum (X_i - \bar{x})^2$
- $1): \bar{x} \sim N(\mu, \frac{\sigma^2}{n})$, $(\bar{x} - \mu)\sqrt{n} / \sigma \sim N(0, 1)$
- $2): \bar{x}$ 与 $S^2$ 相互独立
- $3): \frac{(n-1)S^2}{\sigma^2} = \frac{\sum (X_i - \bar{x})^2}{\sigma^2} \sim \chi^2(n-1)$; $\frac{\sum (X_i - \mu)^2}{\sigma^2} \sim \chi^2(n)$.
- $4): T = \frac{\bar{x} - \mu}{S/\sqrt{n}} \sim t(n-1)$
参数估计
点估计
- 矩估计法:$\frac{1}{n} \sum X_i^k \xrightarrow{P} EX^k$, $\frac{1}{n}\sum (X_i - \bar{x})^k \xrightarrow{P} E(X - EX)^k$
最大似然估计:
离散型总体
若总体 $X$ 的分布律为 $P(X=x) = p(x; \theta)$,则似然函数为:
$$L(\theta) = \prod_{i=1}^{n} p(x_i; \theta)$$连续型总体
若总体 $X$ 的概率密度函数为 $f(x; \theta)$,则似然函数为:
$$L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)$$第一步:构造似然函数
写出样本的联合概率分布(或联合密度函数):
$$L(\theta) = \prod_{i=1}^{n} p(x_i; \theta) \quad \text{或} \quad \prod_{i=1}^{n} f(x_i; \theta)$$第二步:取对数
为了简化计算(将连乘 $\prod$ 转化为求和 $\sum$,方便求导),对 $L(\theta)$ 取自然对数:
$$\ln L(\theta) = \sum_{i=1}^{n} \ln p(x_i; \theta) \quad \text{或} \quad \sum_{i=1}^{n} \ln f(x_i; \theta)$$第三步:建立似然方程并求解
对 $\theta$ 求导,并令导数为 0(寻找驻点):
$$\frac{d[\ln L(\theta)]}{d\theta} = 0$$
解出的 $\hat{\theta}$ 即为最大似然估计值。似然函数单调的用次序统计量
估计量的评价标准 区间估计
估计量的评价标准:
- 无偏性: $E(\hat{\theta}) = \theta \Rightarrow$ 无偏估计
- 有效性: $Var \hat{\theta}_1 < Var \hat{\theta}_2$,则 $\hat{\theta}_1$ 更有效。
- 相合性: $\hat{\theta} \xrightarrow{P} \theta$
区间估计:枢轴量
| 待估参数 | 已知条件 | 枢轴量 & 分布 | 置信区间 $(1-\alpha)$ |
|---|---|---|---|
| $\mu$ | $\sigma^2$ 已知 | $\displaystyle \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$ | $\displaystyle \left( \bar{x} - u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}, \quad \bar{x} + u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \right)$ |
| $\mu$ | $\sigma^2$ 未知 | $\displaystyle \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$ | $\displaystyle \left( \bar{x} - t_{1-\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}, \quad \bar{x} + t_{1-\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}} \right)$ |
| $\sigma^2$ | $\mu$ 已知 | $\displaystyle \frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2} \sim \chi^2(n)$ | $\displaystyle \left( \frac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)}, \quad \frac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)} \right)$ |
| $\sigma^2$ | $\mu$ 未知 | $\displaystyle \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ | $\displaystyle \left( \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}, \quad \frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)} \right)$ |
算单侧的把$\frac{\alpha}{2}$$换成$$\alpha$

次序统计量:
最小值分布 (记为 $X_{(1)}$ 或 $\min$):
$$F_{X_{(1)}}(x) = 1 - {1 - F(x)}^n$$最大值分布 (记为 $X_{(n)}$ 或 $\max$):
$$F_{X_{(n)}}(x) = [F(x)]^n$$