概率极限定理¶

经典概率极限定理¶

下面三个定理只涉及 Bernoulli 试验，\(X \sim B(n, p)\)。

\[ \begin{aligned} P(X = k) &= \binom{n}{k} p^k (1 - p)^{n - k} \\ E(X) &= np \\ Var(X) &= np(1 - p) \end{aligned} \]

Bernoulli 大数定律¶

依概率收敛

设 \(X_n, n \geq 1\) 是一列随机变量，\(X\) 是另一个随机变量，如果对于任意的 \(\varepsilon > 0\)，有

\[ P(\omega: \left| X_n(\omega) - X(\omega) \right| > \varepsilon) \rightarrow 0, \quad n \rightarrow \infty \]

则称 \(X_n\) 依概率收敛到 \(X\)，记作 \(X_n \xrightarrow{P} X\)。

设 \(0 < p < 1\)，\(S_n \sim B(n, p)\)，则

\[ P(\omega: \left| \frac{S_n(\omega)}{n} - p \right| > \varepsilon) \rightarrow 0, \quad n \rightarrow \infty \]

即 频率接近概率真值 的数学解释。即 \(\dfrac{S_n}{n}\) 依概率收敛到 \(p\)。

\[ \frac{S_n}{n} \xrightarrow{P} p, \quad n \rightarrow \infty \]

Info

不能使用 \(\varepsilon - N\) 语言来描述，因为随机变量取值范围和 \(n\) 无关。

\[ P(\omega: \left| \frac{S_n(\omega)}{n} - p \right| > \varepsilon) = \sum_{k: \left| \frac{k}{n} - p \right| > \varepsilon} \binom{n}{k} p^k (1 - p)^{n - k} > 0 \]

即总会发生 \(\left| \frac{S_n}{n} - p \right| > \varepsilon\)。

de Moivre-Laplace 中心极限定理¶

依分布收敛

设 \(X_n, n \geq 1\) 是一列随机变量，相应分布函数为 \(F_n(x)\)，\(X\) 是另一个随机变量，分布函数为 \(F(x)\)，如果对于任意的 \(F(x)\) 的连续点 \(x\)，有

\[ F_n(x) \rightarrow F(x), \quad n \rightarrow \infty \]

则称 \(X_n\) 依分布收敛到 \(X\)，记作 \(X_n \xrightarrow{D} X\) 或 \(F_n \xrightarrow{D} F\)。

假设 \(S_n \sim B(n, p)\)，则

\[ P(\frac{S_n - np}{\sqrt{np(1 - p)}} \leq x) \asymp \int^x_{-\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \ \mathrm{d} t, \quad n \rightarrow \infty \]

\(\asymp\) 意为渐进相等

即 \(f \asymp g \Leftrightarrow \exists C, D > 0\)，使得 \(C|g| \leq |f| \leq D|g|\)。

其中 \(\dfrac{S_n - np}{\sqrt{np(1 - p)}}\) 称为 规范化随机变量，记作 \(Z_n\)，满足 \(EZ_n = 0, VarZ_n = 1\)；等式右侧为 标准正态分布 的分布函数 \(\Phi(x)\)。即

\[ F_{Z_n}(x) \xrightarrow{D} \Phi(x), \quad n \rightarrow \infty \]

即满足 Bernoulli 二项分布的规范化随机变量分布渐进于标准正态分布。

应用

\[ \begin{aligned} P(a \leq S_n \leq b) &= P(\frac{a - np}{\sqrt{np(1 - p)}} \leq \frac{S_n - np}{\sqrt{np(1 - p)}} \leq \frac{b - np}{\sqrt{np(1 - p)}}) \\ &\asymp \Phi(\frac{b - np}{\sqrt{np(1 - p)}}) - \Phi(\frac{a - np}{\sqrt{np(1 - p)}}) \end{aligned} \]

证明（\(p=1/2\) 的情况）

出发点

\[ P(a \leq \frac{S_n - np}{\sqrt{np(1 - p)}} \leq b) = \sum_{k: a \leq \frac{k - np}{\sqrt{np(1 - p)}} \leq b} \binom{n}{k} p^k (1 - p)^{n - k} \]

:TODO:

（szg：感兴趣的了解）

Poisson 极限定理¶

设 \(S_n \sim B(n, p_n)\)，若 \(np_n \rightarrow \lambda\)，则

\[ P(S_n = k) \rightarrow \frac{\lambda^k}{k!} e^{-\lambda}, \quad n \rightarrow \infty \]

证明

由 \(np_n \rightarrow \lambda\)，可知 \(p_n = \frac{\lambda}{n} + o(\frac{1}{n})\)。

\[ \begin{align} P(S_n = k) =& {n \choose k}p_n^k(1-p_n)^{n-k} \\ =& \frac{1}{k!} \cdot n(n-1)\cdots(n-k+1)\cdot \frac{1}{n^k}\cdot (np_k)^k \cdot (1 - \frac{\lambda}{n} + o(\frac{1}{n}))^{n-k} \\ =& \left[(1-\frac{1}{n})(1-\frac{2}{n})\cdots(1-\frac{k-1}{n})\right] \left[\frac{\lambda^k}{k!}\right] \left[(1-\frac{\lambda}{n})^{n-k}\right] \\ \to & \frac{\lambda^k}{k!} e^{-\lambda}, \quad n\to \infty \end{align} \]

经典极限定理的推广¶

Bernoulli 大数定理的推广¶

Chebyshev 大数定律¶

Chebyshev 不等式

设 \(X\) 是一个随机变量，则对于任意的 \(\varepsilon > 0\)，有

\[ P(\left|X - EX \right| > \epsilon) \leq \frac{VarX}{\varepsilon^2} \]

证明 Bernoulli 大数定理

\[ \begin{aligned} P(\left| \frac{S_n}{n} - p \right| > \varepsilon) &= P(\left| S_n - np \right| > n\varepsilon) \\ &\leq \frac{np(1 - p)}{n^2\varepsilon^2} \\ &= \frac{p(1 - p)}{n\varepsilon^2} \\ &\rightarrow 0, \quad n \rightarrow \infty \end{aligned} \]

假设 \(X_k, k \geq 1\) 是一列随机变量，且 \(EX_k = \mu_k\)，设 \(S_n = \sum_{k=1}^nX_k\)，若

\[ \frac{VarS_n}{n^2} \rightarrow 0, \quad n \rightarrow \infty \]

则

\[ \frac{S_n}{n} - \frac{\sum_{k=1}^n\mu_k}{n} \xrightarrow{P} 0, \quad n \rightarrow \infty \]

特别的，若 \(EX_k = \mu\)，则

\[ \frac{S_n}{n} \xrightarrow{P} \mu, \quad n \rightarrow \infty \]

证明

首先有

\[ ES_n = E\sum_{k=1}^nX_k = \sum_{k=1}^nEX_k = \sum_{k=1}^n\mu_k \]

对于 \(\forall \varepsilon > 0\)，有

\[ \begin{aligned} P(\left| \frac{S_n}{n} - \frac{\sum_{k=1}^n\mu_k}{n} \right| > \varepsilon) &= P(\left| S_n - ES_n \right| > n\varepsilon) \\ &\leq \frac{VarS_n}{n^2\varepsilon^2}, \quad \text{Chebyshev 不等式} \\ &\rightarrow 0, \quad n \rightarrow \infty, \quad \text{前提条件} \end{aligned} \]

揭示了 样本的均值渐近于总体的均值，且没有独立性要求。

缺点：要求方差存在。

应用

设 \(\xi_k, k \geq 1\) 是一列独立的随机变量，有 \(\xi_1 \equiv 0\)，且当 \(k \geq 2\) 有

\[ \begin{aligned} P(\xi_k = k) = P(\xi_k = -k) &= \frac{1}{2k \log k} \\ P(\xi_k = 0) &= 1 - \frac{1}{k \log k} \end{aligned} \]

记 \(S_n = \sum_{k=1}^n\xi_k\)，证明

\[ \frac{S_n}{n} \xrightarrow{P} 0, \quad n \rightarrow \infty \]

证明

由于 \(\xi_k\) 不是同分布，故使用 Chebyshev 大数定律。

有 \(E\xi_k = 0\)，\(Var\xi_k = \frac{k}{\log k}\)，故

\[ \frac{VarS_n}{n^2} = \frac{1}{n^2} \sum_{k=1}^n\frac{k}{\log k} \sim \frac{1}{n^2} \frac{n^2}{\log n} \rightarrow 0, \quad n \rightarrow \infty \]

故

\[ \frac{S_n}{n} \xrightarrow{P} 0, \quad n \rightarrow \infty \]

Khintchine 大数定律¶

假设 \(X_k, k \geq 1\) 是一列独立同分布的随机变量，\(EX_k = \mu\)，设 \(S_n = \sum_{k=1}^nX_k\)，则

\[ \frac{S_n}{n} \xrightarrow{P} \mu, \quad n \rightarrow \infty \]

de Moivre-Laplace 中心极限定理的推广¶

Levy-Feller 中心极限定理¶

设 \(X_k, k \geq 1\) 是一列独立同分布的随机变量，\(EX_k = \mu, VarX_k = \sigma^2\)，设 \(S_n = \sum_{k=1}^nX_k\)，则

\[ P(\frac{S_n - n\mu}{\sigma\sqrt{n}} \leq x) \rightarrow \Phi(x), \quad \forall x, n \rightarrow \infty \]

即

\[ \frac{S_n - n\mu}{\sigma\sqrt{n}} \xrightarrow{D} N(0, 1), \quad n \rightarrow \infty \]

说明测量误差可以用正态分布描述。

Lyapunov 中心极限定理¶

设 \(X_k, k \geq 1\) 是一列独立随机变量，\(EX_k = \mu_k, VarX_k = \sigma_k^2\)，设

\[ S_n = \sum_{k=1}^nX_k, B_n = \sum_{k=1}^n\sigma_k^2 \]

若

\[ \begin{aligned} B_n &\rightarrow \infty, \\ E|X_k|^3 &< \infty, \quad \forall k \\ \frac{\sum_{k=1}^nE|X_k|^3}{B_n^{3/2}} &\rightarrow 0, \quad n \rightarrow \infty \end{aligned} \]

则

\[ P(\frac{\sum_{k=1}^n(\xi_k - \mu_k)}{\sqrt{B_n}} \leq x) \rightarrow \Phi(x), \quad \forall x, n \rightarrow \infty \]

即

\[ \frac{\sum_{k=1}^n(\xi_k - \mu_k)}{\sqrt{B_n}} \xrightarrow{D} N(0, 1), \quad n \rightarrow \infty \]

Example

假设 \(\xi_k, k \geq 1\) 是一列独立随机变量，且

\[ P(\xi_k = 1) = p_k, \quad P(\xi_k = 0) = 1 - p_k, \quad 0 < p_k < 1 \]

若

\[ B_n = \sum_{k=1}^n p_k(1 - p_k) \rightarrow 0, \quad n \rightarrow \infty \]

则

\[ \frac{\sum_{k=1}^n(\xi_k - p_k)}{\sqrt{\sum_{k=1}^n p_k(1 - p_k)}} \xrightarrow{D} N(0, 1), \quad n \rightarrow \infty \]

依概率收敛¶

设 \(X_n, n \geq 1\) 是一列随机变量，\(X\) 是另一个随机变量，如果对于任意的 \(\varepsilon > 0\)，有

\[ P(\omega: \left| X_n(\omega) - X(\omega) \right| > \varepsilon) \rightarrow 0, \quad n \rightarrow \infty \]

则称 \(X_n\) 依概率收敛到 \(X\)，记作 \(X_n \xrightarrow{P} X\)。（\(X\) 可以是常数）

判别法则¶

若存在 \(r > 0\)，使得

\[ E|X_n - X|^r \rightarrow 0, \quad n \rightarrow \infty \]

则 \(X_n \xrightarrow{P} X\)。

基本性质¶

唯一性

若 \(X_n \xrightarrow{P} X\)，\(X_n \xrightarrow{P} Y\)，则 \(X = Y\)。
运算性质：若 \(X_n \xrightarrow{P} X\)，\(Y_n \xrightarrow{P} Y\)，则
- \(X_n + Y_n \xrightarrow{P} X + Y\)
- \(X_nY_n \xrightarrow{P} XY\)
- 若 \(Y \neq 0\)，则 \(\dfrac{X_n}{Y_n} \xrightarrow{P} \dfrac{X}{Y}\)
- 若 \(g\) 连续，则 \(g(X_n) \xrightarrow{P} g(X)\)

依分布收敛¶

设 \(X_n, n \geq 1\) 是一列随机变量，相应分布函数为 \(F_n(x)\)，\(X\) 是另一个随机变量，分布函数为 \(F(x)\)，如果对于任意的 \(F(x)\) 的连续点 \(x\)，有

\[ F_n(x) \rightarrow F(x), \quad n \rightarrow \infty \]

则称 \(X_n\) 依分布收敛到 \(X\)，记作 \(X_n \xrightarrow{D} X\) 或 \(F_n \xrightarrow{D} F\)。

判别法则¶

Levy 连续性定理：设 \(X_n, n \geq 1\) 是一列随机变量，具有相应特征函数 \(\varphi_n(t)\)，\(X\) 是另一个随机变量，特征函数为 \(\varphi(t)\)，则

\[ X_n \xrightarrow{D} X \Leftrightarrow \varphi_n(t) \rightarrow \varphi(t), \quad t \in \mathbb{R}, n \rightarrow \infty \]

Levy 连续性定理的另一种形式

若 \(X_n, n \geq 1\) 是一列随机变量，具有相应密度函数 \(\varphi_n(t)\)，若

\[ \varphi_n(t) \rightarrow \varphi(t), \quad t \in \mathbb{R}, n \rightarrow \infty \]

且 \(\varphi(t)\) 在 \(0\) 处连续，则 \(\varphi(t)\) 一定是特征函数，对应的随机变量 \(X\) 满足

\[ X_n \xrightarrow{D} X, \quad n \rightarrow \infty \]

基本性质¶

依概率收敛意味着依分布收敛

若 \(X_n \xrightarrow{P} X\)，则 \(X_n \xrightarrow{D} X\)。
依分布收敛不意味着依概率收敛

特殊情况

\[ X_n \xrightarrow{D} c \Rightarrow X_n \xrightarrow{P} c \]
运算性质
1. 线性运算
  - 设 \(X_n \xrightarrow{D} X\)，\(b_n \rightarrow b\)，则 \(X_n + b_n \xrightarrow{D} X + b\)
  - 设 \(X_n \xrightarrow{D} X\)，\(a_n \rightarrow a\)，则 \(a_nX_n \xrightarrow{D} aX\)
2. 设 \(X_n \xrightarrow{D} X\)，\(Y_n \xrightarrow{D} c\)，则 \(X_nY_n \xrightarrow{D} cX\)
3. 若 \(g\) 连续，则 \(g(X_n) \xrightarrow{D} g(X)\)