随机变量与分布函数¶
随机变量与分布函数¶
随机变量是定义在概率空间上取实数值的可测函数
随机变量
- 掷骰子出现的点数
- 测量灯泡的寿命
- 测量物体的长度
离散型随机变量与分布列¶
取有限个或者可列个值的随机变量
假设 \((\Omega, \mathcal{A}, P)\) 是概率空间,定义 \(X:\Omega \mapsto \mathbb{R}\) .
取值 \(x_1, \cdots, x_N, N\leq\infty\)
取每个值的概率大小
分布列:
Note
-
\(p_i\)
\[ p_i > 0, \sum_{i=1}^N p_i = 1 \] -
对于任意 Borel 集 \(B\) ,
\[ P(X\in B) = \sum_{i:x_i\in B}p_i \]特别,
\[ \begin{align} P(X \leq x) &= \sum_{i:x_i \leq x}p_i \\ P(X > x) &= \sum_{i:x_i > x}p_i \\ P(a < X \leq b) &= \sum_{i:a< x_i \leq b}p_i \end{align} \]
离散型随机变量的典型例子¶
退化分布
常数可以看作退化随机变量
两点分布
适用于描述“正面、反面”、“成功、失败”等随机现象
二项分布
简记 \(X \sim B(n, p)\)
- 二项分布适用于 n 重 Bernoulli 试验
-
二项展开系数
\[ (p+q)^n = \sum_{k = 0}^n{n \choose k}p^kq^{n-k} \] -
\(X\) 最可能的值
\[ \begin{align} \frac{p_k}{p_{k+1}} =& \frac{{n \choose k}p^k(1-p)^{n-k}}{{n \choose k + 1}p^{k+1}(1-p)^{n-k-1}} \\ =& \frac{(k+1)(1-p)}{(n-k)p} \\ &\begin{cases} <1, &\quad k+1 < (n + 1)p \\ >1, &\quad k+1 > (n + 1)p \end{cases} \end{align} \]
Poisson 分布
简记 \(X \sim \mathcal{P}(\lambda)\)
\(X\) 取非负整数值,
Note
- \(\sum p_i = 1\)
- Poisson 分布是 Poisson 过程的基础,用于描述随机服务系统
-
当 \(k\) 足够大
\[ P(X\geq k) = \sum_{l = k}^\infty\frac{\lambda^l}{l!}e^{-\lambda} \asymp \frac{\lambda^k}{k!}e^{-\lambda} \]\(X\) 只集中在小值中。稀有事件。
Poisson 分布和二项分布之间的关系(Poisson 极限定理)
假设 \(S_n \sim B(n, p_n)\)。当 \(n \to \infty, np_n \to \lambda > 0\)。对于任意 \(k \leq 0\)
Proof
几何分布
随机试验 \(E\) 和事件 \(A\) ,\(P(A) = p, 0<p<1\)。独立重复 \(E\) 直到 \(A\) 发生,记所做的试验次数记为 \(X\)
其中
分布列:
超几何分布
\(N\) 件产品中有 \(M\) 件次品,随机抽样 \(n<N\) 件,用 \(X\) 表示 \(n\) 件产品中次品数。
\(0\leq X \leq \min\{M,n\}\)
连续型随机变量与密度函数¶
连续型随机变量特点:
- 随机变量取值是一个或几个区间
-
存在函数 \(p(x)\)
\[ p(x)\geq 0, \quad \int_{-\infty}^{\infty}p(x)\text{d}x = 1 \]使得对任何 Borel 集 \(B\),
\[ P(X\in B) = \int_{B} p(x)\text{d}x \]简记 \(X \sim p(x)\)
称 \(p(x)\) 为 \(X\) 的密度函数
Note
- \(P(X=x) = 0, \quad x\in \mathbb{R}\)
- \(P(X\in(a,b]) = \int_{a}^{b} p(x)\text{d}x\)
连续型随机变量的例子¶
均匀分布
向 \((a,b)\) 上随机投点,记落点的位置为 \(X\)
- \(X\) 落在 \((a,b)\) 上每一点等可能 \(P(X=x) = 0\)
- \(P(X\in A) = \frac{|A|}{b-a}\)
简记 \(X \sim U(a,b)\)
指数分布
如果 \(X\) 取非负实数,且
简记 \(X \sim \exp(\lambda)\)
Note
- 通常描述寿命
- 和 Poisson 分布有密切联系:Poisson 过程
-
\(X\) 取大值的可能性迅速衰减
\[ P(X>x) = e^{-\lambda x}, \quad x \geq 0 \] -
无记忆性。使用了 \(y\) 小时之后还能使用 \(x\) 的概率
\[ \begin{align} P(X>x+y | X>y) =& \frac{P(X > x+y)}{P(X > y)} \\ =& \frac{e^{-\lambda(x+y)}}{e^{-\lambda y}} \\ =& e^{-\lambda x} \\ =& P(X>x) \end{align} \]
正态分布
随机变量 \(X\) 取所有实数值,密度
称 \(X\) 是服从正态分布的随机变量,简记 \(X \sim N(\mu,\sigma^2)\)
Note
- \(-\infty < \mu < \infty, \sigma > 0\)
- 标准正态分布 \(\mu = 0, \sigma^2 = 1\),称 \(X \sim N(0,1)\)
验证
验证
令 \(t = \frac{x-\mu}{\sigma}\) ,只需证明
考虑
极坐标变换:
正态分布的性质
- 对称性:关于 \(x = \mu\) 对称
- 光滑性:\(p(x)\) 任意次可微
- 单调性
- 渐近线 \(y = 0\)
- 最大值:\(P(x)\) 在 \(x=\mu\) 初取最大值 \(\frac{1}{\sqrt{2\pi}\sigma}\)
- \(\sigma\) 变大,曲线变平坦;\(\sigma\) 变小,曲线变陡峭
-
类似积分
\[ \begin{align} P(X > \mu + \sigma x) =& \int_{\mu + \sigma x}^{\infty} \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(u - \mu)^2}{2\sigma^2}}\text{d}u \\ \sim & \frac{1}{\sqrt{2\pi}x}e^{-\frac{x^2}{2}}, \quad x\to \infty \end{align} \]同理
\[ P(X < \mu - \sigma x) \sim \frac{1}{\sqrt{2\pi}x}e^{-\frac{x^2}{2}}, \quad x\to \infty \]
一般型随机变量与分布函数¶
-
分布函数
\[ F(x) = P(\omega: X(\omega) \leq x), \quad -\infty < x < \infty \] -
分布函数的性质
- \(\lim_{x\to -\infty}F(x) = 0, \lim_{x\to \infty}F(x) = 1\)
- \(F(x_1) \leq F(x_2), \quad x_1 \leq x_2\)
-
\(F(x)\) 左极限和右极限存在
\[ \lim_{x\to x_0-0}F(x) = F(x_0-0), \quad \lim_{x\to x_0+0}F(x) = F(x_0+0) \]Note
- \(F(x_0-0) = P(X < x_0)\)
- \(P(x = x_0) = F(x_0) - F(x_0-0)\)
- \(P(X \in (x_1, x_2]) = F(x_2) - F(x_1)\)
-
连续性随机变量的分布函数
\[ \begin{align*} F(x) =& P(X \leq x) \\ =& \int_{-\infty}^{x}p(u)\text{d}u \end{align*} \]\(F(x)\) 是连续函数,且 \(F'(x) = p(x)\)
正态分布的分布函数
假定 \(X \sim N(0, 1)\)
\[ F(x) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{u^2}{2}}\text{d}u \]没有显性表达式,用 \(\Phi(x)\) 表示分布函数(Probit 函数)
误差函数
\[ erf(x) = \frac{2}{\sqrt{\pi}}\int_{0}^{x}e^{-u^2}\text{d}u \]采用误差函数表示 \(\Phi(x)\)
\[ \Phi(x) = \frac{1}{2}\left[1 + \frac{1}{\sqrt{2}}erf(x)\right] \]\(\Phi(x)\) 的值:查表。
随机变量的函数¶
考虑
\(Y\) 是随机变量的条件
\(X\) 是随机变量,\(f\) 是可测函数
-
当 \(X\) 是离散型随机变量时,\(Y\) 也是离散型随机变量
\[ X \sim \begin{pmatrix} x_1 & x_2 & \cdots & x_i & \cdots & x_N \\ p_1 & p_2 & \cdots & p_i & \cdots & p_N \end{pmatrix} \]\[ P(Y = y_i) = \sum_{x_j: f(x_j) = y_i}p_j \] -
当 \(X\) 是连续型随机变量时,\(Y\) 不一定是连续型随机变量。无统一公式。
一般地,假设 \(X \sim p_X(x)\),\(f\) 具有反函数 \(f^{-1}\),且 \(f^{-1}\) 可导。则 \(Y\) 是连续型随机变量,其密度函数为
\[ Y \sim p_Y(y) = p_X(f^{-1}(y))\left|\frac{\text{d}f^{-1}(y)}{\text{d}y}\right| \]Example
假设 \(X\) 具有连续的分布函数 \(F(x)\),求 \(Y = F(X)\) 的分布
\[ \begin{align} P(Y \leq y) =& P(F(X) \leq y) \\ =& P(X \leq F^{-1}(y)) \\ =& F(F^{-1}(y)) \\ =& y, \quad 0 \leq y \leq 1 \end{align} \]则 \(Y \sim U(0,1)\)
随机向量与联合分布函数¶
离散型随机变量¶
\((X,Y)\) 是 2-随机向量。\(X\) 取值 \(x_1, x_2, \cdots\),\(Y\) 取值 \(y_1, y_2, \cdots\)。称 \((X,Y)\) 为离散型随机向量。
称
为 \((X,Y)\) 的联合分布。
-
边际分布
\[ \begin{align} P(X = x_i) =& \sum_{j=1}^{\infty}p_{ij} \\ P(Y = y_j) =& \sum_{i=1}^{\infty}p_{ij} \end{align} \]Warning
边际分布由联合分布唯一确定,反之不成立。
-
条件分布
\[ P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)} = \frac{p_{ij}}{p_{\cdot j}} \]条件分布列
\[ X|Y = y_j \sim \begin{pmatrix} x_1 & x_2 & \cdots & x_i & \cdots \\ \frac{p_{1j}}{p_{\cdot j}} & \frac{p_{2j}}{p_{\cdot j}} & \cdots & \frac{p_{ij}}{p_{\cdot j}} & \cdots \end{pmatrix} \] -
独立离散型随机变量
\[ P(X = x_i, Y = y_j) = P(X = x_i)P(Y = y_j), \forall i,j \]即
\[ p_{ij} = p_{i\cdot}p_{\cdot j}, \quad \forall i,j \]
连续型随机变量¶
联合密度函数 \(p(x,y)\)
并且
称 \((X,Y)\) 为连续型随机向量。
-
边际密度
\[ X \sim p_X(x), \quad Y \sim p_Y(y) \]\[ p_X(x) = \int_{-\infty}^{\infty}p(x,y)\text{d}y, \quad p_Y(y) = \int_{-\infty}^{\infty}p(x,y)\text{d}x \]
联合正态分布
称 \((X,Y)\) 服从二元正态分布,简记 \((X,Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\)
-
边际分布
\[ X \sim N(\mu_1, \sigma_1^2), \quad Y \sim N(\mu_2, \sigma_2^2) \]
-
条件分布
\[ p_{Y|X}(y|x) = \frac{p(x,y)}{p_X(x)} \]\[ P(Y \leq y | X = x) = \frac{\int_{-\infty}^{y}p(x,v)\text{d}v}{p_X(x)} \] -
独立连续型随机变量
\[ p(x,y) = p_X(x)p_Y(y), \quad \forall x,y \]
一般型随机变量¶
一般利用分布函数
\(F(x)\) 性质
- \(F(-\infty, y) = F(x, -\infty) = 0, F(+\infty, +\infty) = 1\)
- \(F(x, y)\) 关于 \(x\) 和 \(y\) 都是非减函数
- \(F(x, y)\) 关于 \(x\) 和 \(y\) 左极限存在,右连续
- \(P(a < X \leq b, c < Y \leq d) = F(b,d) - F(a,d) - F(b,c) + F(a,c)\)
-
边际分布
\[ F_X(x) = F(x, +\infty), \quad F_Y(y) = F(+\infty, y) \] -
条件分布
\[ \begin{align} P(Y \leq y | X = x) =& \lim_{\epsilon \to 0} P(Y \leq y | x - \epsilon < X \leq x + \epsilon) \\ =& \lim_{\epsilon \to 0} \frac{F(x+\epsilon, y) - F(x-\epsilon, y)}{F_X(x+\epsilon) - F_X(x-\epsilon)} \end{align} \] -
独立一般型随机变量
\[ F(x,y) = F_X(x)F_Y(y), \quad \forall x,y \]如果 \(X, Y\) 相互独立,那么对于任意 Borel 函数 \(f,g\),\(f(X)\) 和 \(g(Y)\) 也相互独立。
Proof
\[ \begin{align} P(f(X) \in A, g(Y) \in B) =& P(X \in f^{-1}(A), Y \in g^{-1}(B)) \\ =& P(X \in f^{-1}(A))P(Y \in g^{-1}(B)) \\ =& P(f(X) \in A)P(g(Y) \in B) \end{align} \]
多维随机向量¶
\(\mathbf{X} = (X_1, X_2, \cdots, X_n)\) 是 \(n\)-维随机向量。
-
\(n\)-元联合分布函数
\[ F_{\mathbf{X}}(\mathbf{x}) = P(X_1 \leq x_1, X_2 \leq x_2, \cdots, X_n \leq x_n) \] -
边际分布
\[ F_{X_i}(x_i) = F_{\mathbf{X}}(\infty, \cdots, \infty, x_i, \infty, \cdots, \infty) = P(X_i \leq x_i) \] -
独立随机变量
\[ F_{\mathbf{X}}(\mathbf{x}) = \prod_{i=1}^{n}F_{X_i}(x_i) \]则 \(X_1, X_2, \cdots, X_n\) 相互独立。
随机向量的运算¶
随机向量的加减¶
-
离散型随机变量
分布为
\[ P(X = x_i, Y = y_j) = p_{ij} \]记 \(Z = X + Y\),则
\[ P(Z = z_k) = \sum_{i,j: x_i + y_j = z_k}p_{ij} \] -
连续型随机变量
\[ \begin{align*} F_Z(z) = P(X + Y \leq z) =& \int_{-\infty}^{\infty}\int_{-\infty}^{z-x}p(x,y)\text{d}y\text{d}x \\ =& \int_{-\infty}^{z}\int_{-\infty}^{\infty}p(x, y - x)\text{d}y\text{d}x \end{align*} \]密度函数
\[ p_Z(z) = \int_{-\infty}^{\infty}p(x, z - x)\text{d}x \]减法类似:\(Z = Y - X\)
\[ p_Z(z) = \int_{-\infty}^{\infty}p(x, x + z)\text{d}x \]
\(\Gamma(\alpha, \beta)\) 分布
令 \(\alpha, \beta > 0\),定义
\(\Gamma(n) = (n - 1)!, \Gamma(\alpha + 1) = \alpha\Gamma(\alpha)\)
分布密度函数
随机向量的乘除¶
-
乘法
假设 \((X,Y)\) 是连续型随机向量,\(Z = XY\),则
\[ \begin{align*} F_Z(z) =& P(XY \leq z) \\ =& \int_{xy \leq z}p(x, y)\text{d}x\text{d}y \\ =& \int_{-\infty}^{0}\text{d}x\int_{z/x}^{\infty}p(x, y)\text{d}y + \int_{0}^{\infty}\text{d}x\int_{-\infty}^{z/x}p(x, y)\text{d}y \\ =& -\int_{-\infty}^{0}\text{d}x\int_{-\infty}^{z}\frac{1}{x}p(x, \frac{y}{x})\text{d}y + \int_{0}^{\infty}\text{d}x\int_{-\infty}^{z}\frac{1}{x}p(x, \frac{y}{x})\text{d}y \\ =& -\int_{-\infty}^{z}\int_{-\infty}^{0}\frac{1}{x}p(x, \frac{y}{x})\text{d}x\text{d}y + \int_{-\infty}^{z}\int_{0}^{\infty}\frac{1}{x}p(x, \frac{y}{x})\text{d}x\text{d}y \end{align*} \]密度函数
\[ \begin{align*} p_Z(z) =& -\int_{-\infty}^{0}\frac{1}{x}p(x, \frac{z}{x})\text{d}x + \int_{0}^{\infty}\frac{1}{x}p(x, \frac{z}{x})\text{d}x \\ =& \int_{-\infty}^{\infty}\frac{1}{|x|}p(x, \frac{z}{x})\text{d}x \end{align*} \] -
除法
\(Z = \frac{Y}{X}\) 的密度函数
\[ p_Z(z) = \int_{-\infty}^{\infty}|x|p(x, xz)\text{d}x \]
Cauchy 分布
随机向量的变换¶
\((X, Y)\) 为连续型随机向量,有联合密度函数 \(p_{XY}(x, y)\),变换如下
-
基本方法
\[ \begin{align*} P(U \leq u, V \leq v) =& P(f_1(X, Y) \leq u, f_2(X, Y) \leq v) \\ =& \iint_{f_1(x, y) \leq u, f_2(x, y) \leq v}p_{XY}(x, y)\text{d}x\text{d}y \end{align*} \] -
特殊情形
假设 \(f_1, f_2\) 存在逆变换:
\[ \begin{cases} X = g_1(u, v) \\ Y = g_2(u, v) \end{cases} \]假设 \(g_1, g_2\) 可微,且雅可比式
\[ J = \frac{\partial(x, y)}{\partial(u, v)} \]那么 \((U, V)\) 的为连续型随机向量,其密度函数为
\[ p_{UV}(u, v) = p_{XY}(x, y)|J| \]
极值随机变量¶
\(X_1, X_2, \cdots, X_n\) 是独立随机变量,有相同的分布函数 \(F(x)\),记
即 \(X_{(k)}\) 为第 k 小值。\(X_{(1)} = \min\{X_1, X_2, \cdots, X_n\}\),\(X_{(n)} = \max\{X_1, X_2, \cdots, X_n\}\)。
-
\(X_{(n)}\) 的分布
\[ \begin{align*} F_{X_{(n)}}(x) =& P(X_{(n)} \leq x) \\ =& P(X_1 \leq x, X_2 \leq x, \cdots, X_n \leq x) \\ =& P(X_1 \leq x)P(X_2 \leq x)\cdots P(X_n \leq x) \\ =& F^n(x) \end{align*} \]密度函数
\[ p_{X_{(n)}}(x) = \frac{\text{d}F_{X_{(n)}}}{\text{d}x} = nF^{n-1}(x)F'(x) \] -
\(X_{(1)}\) 的分布
\[ \begin{align*} F_{X_{(1)}}(x) =& P(X_{(1)} \leq x) \\ =& 1 - P(X_{(1)} > x) \\ =& 1 - P(X_1 > x, X_2 > x, \cdots, X_n > x) \\ =& 1 - P(X_1 > x)P(X_2 > x)\cdots P(X_n > x) \\ =& 1 - (1 - F(x))^n \end{align*} \]密度函数
\[ p_{X_{(1)}}(x) = \frac{\text{d}F_{X_{(1)}}}{\text{d}x} = n(1 - F(x))^{n-1}F'(x) \] -
\(X_{(k)}\) 的分布
\[ \begin{align*} F_{X_{(k)}}(x) =& P(X_{(k)} \leq x) \\ =& {n \choose k} F^k(x)(1 - F(x))^{n-k} \end{align*} \]
Example
设 \(X_1, X_2, \cdots, X_n\) 相互独立且服从 \([0, a]\) 上的均匀分布,求 \(Y = \max\{X_1, X_2, \cdots, X_n\}, Z = \min\{X_1, X_2, \cdots, X_n\}\) 的联合分布。
解:
总结¶
-
二项 Bernoulli 分布
\[ P(X = k) = {n \choose k}p^k(1-p)^{n-k}, \quad k = 0, 1, \cdots, n \]Poisson 分布:
\[ P(X = k) = \frac{\lambda^k}{k!}e^{-\lambda}, \quad k = 0, 1, \cdots \]几何分布:不断重复直到事件发生
\[ P(X = k) = p(1-p)^{k-1}, \quad k = 1, 2, \cdots \]超几何分布:\(N\) 件产品 \(M\) 件次品,随机抽样 \(n\) 件,\(X\) 表示 \(n\) 件产品中次品数
\[ P(X = k) = \frac{{M \choose k}{N - M \choose n - k}}{{N \choose n}}, \quad k = 0, 1, \cdots, \min\{M, n\} \]指数分布
\[ p(x) = \begin{cases} \lambda e^{-\lambda x}, & x\geq 0 \\ 0 , & \text{其他} \end{cases} \quad \lambda > 0 \] -
连续型随机变量
密度函数 \(p(x)\),分布函数 \(F(x)\)
\[ p(x) \geq 0, \int_{-\infty}^{\infty}p(x)\text{d}x = 1 \]\[ F(x) = P(X \leq x) = \int_{-\infty}^{x}p(u)\text{d}u \]