Site Overlay

概率论复习笔记

题型部分为了提高效率就直接在卷子上标记了,还没来得及整理过来。

概念

概率论的基本概念

分布函数:定义 设 $X$ 是一个随机变量, $x$ 是任意实数,函数

$$
F(x)=P\{X \leqslant x\},-\infty

称为 $X$ 的分布函数.

概率密度函数(概率密度):用区间面积表示概率值的函数。下面的 $f(t)$ 是概率密度函数。

$$
F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t
$$

性质:

  • 大于零(概率不能为负)
  • $f(x)$$x$ 围成的总面积为 $1$(概率空间为 1)
  • $P\left\{x_{1} (区间内面积代表落在区间概率)

相互独立$F(x, y)=F_{X}(x) F_{Y}(y)$。充分条件:

  1. $f(x, y)=f_{X}(x) f_{Y}(y)$
  2. $P\left\{X=x_{i}, Y=y_{j}\right\}=P\left\{X=x_{i}\right\} P\left\{Y=y_{j}\right\}$

随机变量及其分布

二项分布

概率:$P\{X=k\}=\left(\begin{array}{l}n \\k\end{array}\right) p^{k}(1-p)^{n-k}$

记号:$X\sim B(n,p)$

均值:$np$

方差:$np(1-p)$

泊松分布

概率:

$$
P\{X=k\}=\frac{\lambda^{k} e^{-\lambda}}{k !}, \quad k=0,1,2, \cdots
$$

其中 $\lambda>0$ 是常数.则称 $X$ 服从参数为 $\lambda$ 的泊松分布

记号:$X \sim \pi(\lambda)$ 或者 $X\sim P(\lambda)$

均值:$\lambda$

方差:$\lambda$

二项分布,当 $n$ 很大,$p$ 很小时,就转化为泊松分布($\lambda = np$)。

连续均匀分布

若连续型随机变量 $X$ 具有概率密度:

$$
f(x)=\left\{\begin{array}{ll}
\frac{1}{b-a}, & a

则称 $X$ 在区间 $(a, b)$ 上服从均匀分布.

记号:$X \sim U(a, b)$

期望:$\dfrac{a+b}{2}$

方差:$\dfrac{(b-a)^2}{12}$

指数分布

概率密度:

$$
f(x)=\left\{\begin{array}{ll}
\frac{1}{\theta} \mathrm{e}^{-x / \theta}, x>0 \\
0, & \text { 其他 }
\end{array}\right.
$$

分布函数:

$$
F(x)=\left\{\begin{array}{ll}
1-\mathrm{e}^{-x / \theta}, & x>0 \\
0, & \text { 其他. }
\end{array}\right.
$$

记号:$X\sim \operatorname{Exp}(\theta)$

期望:$E(x) = \dfrac{1}{\lambda}$

方差:$D(x) = \dfrac{1}{\lambda^2}$

性质:

  • 无记忆性:$P\{X>s+t \mid X>s\}=P\{X>t\}$

正态分布

概率密度:

$$
f(x)=\dfrac{1}{\sqrt{2 \pi} \sigma} \mathrm{exp}\left[{-\dfrac{(x-\mu)^{2}}{2 \sigma^{2}}}\right],-\infty

记号:$X\sim N(\mu, \sigma^2)$

期望:$\mu$

方差:$\sigma^2$

多维随机变量及其分布

随机变量的数字特征

期望:就是样本平均值。

  • 性质:
    • 常量的期望是它本身。
    • 推论:$E(E(X)) = E(X)$
    • $E(X+c) = EX+c$
    • 每个人踩个砖头,那平均高就踩了个砖头
    • $E(cX) = cE(X)$
    • 每个人身高拉长 c 倍,那平均值就扩大 c 倍。
    • $E(X\pm Y) = E(X) \pm E(Y)$
    • 独立随机变量:$E(XY) = E(X)E(Y)$

条件期望:一个条件定了的情况下,另一个条件的期望。写作 $E(X\mid Y = y_j)$

  • 连续性条件期望公式:$E(X\mid Y = y) = \int_{-\infty}^{\infty}xf(x|y)\mathrm{d}x$

离差$\eta = X-E(X)$

方差$D(X) = E(\eta)^2$

  • 离散方差:$D(X) = \sum_k p_k (x_k - EX)^2$
  • 计算公式:$D(X) = E(X^2) - E^2(X)$
  • 性质:
    • $D(c) = 0$
    • $D(X+c) = D(X)$
    • $D(cX) = c^2D(X)$
    • $D(X\pm Y) = D(X) + D(Y)$
    • 考试常用:$D(\bar{X}) = \dfrac{\sigma^2}{n}$

标准差(均方差)$\sqrt{D(X)}$

标准化: 经过 $X^\*=$ 处理

协方差$\operatorname{cov}(X,Y) = E((X-EX)(Y-EY)) = E(XY) - E(X)E(Y)$

  • $X,Y$ 独立,协方差一定等于零。但反之不然。
  • 连续性求协方差的方法?
  • 性质:
    • 可交换:$\operatorname{cov}(X,Y) = \operatorname{cov}(Y,X)$
    • $\operatorname{cov}(aX,bY) = ab \operatorname{cov}(X,Y)$
    • $\operatorname{cov}(X_1+X_2,Y) = \operatorname{cov}(X_1,Y)+\operatorname{cov}(X_2,Y)$
    • $\operatorname{cov}(X,c) = 0$
  • 推论:
    • $D(a X \pm b Y)=a^{2} D X+b^{2} D Y \pm 2 a b \operatorname{cov}(X, Y)$

协方差矩阵:每个元素是 $\operatorname{cov}(X_i,X_j)$ 。此矩阵对称。

相关系数

大数定律及中心极限定理

$X_{1}, X_{2}, \cdots, X_{n}, \cdots$ 独立同分布,
则当 $n$ 充分大时, $\sum_{i=1}^{n} X_{i}$ 近似地服从正态分布 $N\left(n E\left(X_{i}\right), n D\left(X_{i}\right)\right)$.
特别地, 设 $Y \sim B(n, p)$,
则当 $n$ 充分大时, $Y$ 近似地服从正态分布 $N(n p, n p(1-p))$.

样本及其抽样分布

参数估计

总体:比如全校学生的身高。

样本:比如选出我们班 10 个人,他们的身高构成了样本空间。

估计量(统计量):一个函数,从样本空间映射到估计值。$\theta$ 的估计量函数记为 $\hat{\theta}$。不含样本参数!

样本均值:一组样本对应的随机变量的均值。表示为 $\overline X$。样本均值等于总体均值 $\mu$,i.e. $E(X) = \mu$

样本方差:每个随机变量减去均值 的平方和除以 n-1

$$
S^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}=\frac{1}{n-1}\left(\sum_{i=1}^{n} X_{i}^{2}-n X^{2}\right)
$$

总体方差为 $\sigma^{2},$$E\left(S^{2}\right)=\sigma^{2}, D\left(S^{2}\right)=\frac{2 \sigma^{4}}{n-1}$

参数估计:知道是个啥分布,不知道参数。比如用我们班十个人的身高,估计全校学生的身高。

非参数估计:连是个啥分布也不知道,要估计是啥分布。

待估参数:被选定用来估计的参数,记作 $\theta$。比如你要估计正态分布的 $\mu, \sigma^2$ 这两个参数。

卡方分布

卡方分布($\chi ^2$分布):若 $X_1,\cdots,X_n$ 都服从 $N(0,1)$,则:

$\chi^2 = \sum _{i=1}^nX_i^2$ 服从自由度为 $n$$\chi^2$ 分布。概率密度(一般不考):

$$
f(y)=\left\{\begin{array}{cc}
\frac{1}{2^{n / 2} \Gamma(n / 2)} y^{\frac{n}{2}-1} e^{-\frac{y}{2}}, & y>0 \\
0, & y \leq 0
\end{array}\right.
$$

性质:

  1. $\chi^2 \sim \chi^2(n)$,则 $E(\chi^2) = n, D(\chi^2) = 2n$
  2. $X \sim \chi^{2}\left(n_{1}\right), Y \sim \chi^{2}\left(n_{2}\right),$$X, Y$ 相互独立,则 $X+Y \sim \chi^{2}\left(n_{1}+n_{2}\right)$
  3. $n$ 充分大时,$\dfrac{\chi^2 (n)-n}{\sqrt{2n}}$ 近似服从 $N(0,1)$。也即 $\chi^2(n)$ 近似服从分布 $N(n,2n)$
  • 设总体 $X \sim \chi^{2}(n), X_{1}, X_{2}, \cdots, X_{10}$ 是来 自 $X$ 的样本, 求 $E(\bar{X}), D(\bar{X})$
    $E\left(S^{2}\right)$

    • $E(X)=n, D(X)=2 n,$ 故有
$$
E(\bar{X})=n, D(\bar{X})=\frac{2 n}{10}=\frac{n}{5} \\
E\left(S^{2}\right)=D(X)=2 n
$$

t 分布

t 分布:设 $X\sim N(0,1), Y \sim \chi_n^2$ 相互独立,则

$$
T = \dfrac{X}{\sqrt{\dfrac{Y}{n}}}
$$

是自由度为 $n$$t$ 分布,记作 $T\sim t_n$

$n > 45$ 时,近似 $T = \dfrac{X}{\sqrt{Y/n}}\sim N(0,1)$

均值和方差:$E(X) = 0$$D(X) = n/n-2$

概率密度函数为:

$$
t_
{n}(x)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{
\Gamma\left(\frac{n}{2}\right) \sqrt{n \pi}}
\left(1+\frac{x^{2}}{n}\right)^{-\frac{n+1}{2}},-\infty < x < \infty $$

F 分布

F 分布:设 $X\sim \chi^2_m, Y \sim \chi_n^2$,且相互独立,则

$$
F = \dfrac{X/m}{Y/n}
$$

是自由度分别为 $m,n$$F$ 分布,记作 $F\sim F_{m,n}$

概率密度函数为:

$$
f_{m, n}(x)=\left\{\begin{array}{ll}
\frac{\Gamma\left(\frac{m+n}{2}\right)}{\Gamma\left(\frac{n}{2}\right) \Gamma\left(\frac{m}{2}\right)} m^{\frac{m}{2}} n^{\frac{n}{2}} x^{\frac{m}{2}-1}(n+m x)^{-\frac{m+n}{2}}, & x>0 \\
0, & \text { 其它. }
\end{array}\right.
$$

误差$e(x)= \hat{\theta}(x) - \theta$

均方误差$\operatorname{MSE} = E(e^2(x))$

偏差$\operatorname{bias}(\hat\theta(x)) = E(\hat\theta (x)) - \theta$

无偏估计:偏差为 0 的估计,$\operatorname{bias}(\hat\theta(x)) = 0$ 也即 $\theta = E(\hat\theta(x))$

  • 方差是一个有偏估计量:$\begin{equation}\hat{\sigma}^2_{\text{有偏}} = \frac{1}{n}\sum_{i=1}^n \left(x_i - \hat{\mu}\right)^2,\quad \hat{\mu} = \frac{1}{n}\sum_{i=1}^n x_i\end{equation}$
  • 无偏方差:$\begin{equation}\hat{\sigma}^2_{\text{无偏}} = \frac{1}{n-1}\sum_{i=1}^n \left(x_i - \hat{\mu}\right)^2\end{equation}$

矩估计法:用 样本的各阶矩 估计 总体的各阶矩

置信区间:是对参数分布的参数值以区间形式给出的估计。

一个区间 $(\underline{\theta},\overline{\theta})$ 满足 $P(\theta \in (\underline{\theta},\overline{\theta})) \geqslant \alpha$,则称该区间是 置信区间,置信水平为 $1-\alpha$

假设检验

假设检验:对总体的参数提出一个假设值,利用样本判断该假设成立与否。

两个假设

  1. 原假设:例如设 $H_0: a \geqslant c$,其中 $a$ 为总体参数,$c$ 为常数
  2. 备择假设:例如设 $H_0: a< c$
  3. 其中,想要拒绝的是原假设

弃真错误(第 I 类错误或 α 错误):拒绝了 为真的原假设。错误的概率记为 $\alpha$,即是 显著性水平$\alpha$ 是事先规定的值。

取伪错误(第 II 类错误或 β 错误):接受了 为假的原假设。错误的概率记为 $\beta$

显著性水平:犯弃真错误的概率 $\alpha$

容错比例$1-\alpha$

拒绝域:犯弃真错误的区域,例如下面的阴影部分:

右侧检验的拒绝域

检验方式

  • 双侧检验:形如 “$\ne$” 的检验假设。
  • 单侧检验:带有方向的检验假设
    • 左侧检验:$<$
    • 右侧检验:$>$

检验统计量:检验统计量是根据样本数据计算的随机变量,用于确定是否要否定原假设。

方差分析及回归分析

如果难以理解,先去看题吧~

全概率公式(Total Probability Theorem): $P(A) = \sum P(A|B_i)P(B_i)$ ,其中 $B_i$ 是对样本空间 $S$ 的划分。

贝叶斯公式:用于判断事件 $A$ 来自某个划分 $B_i$ 的概率。 $P\left(B_{i} \mid A\right)=\dfrac{P\left(A \mid B_{i}\right) P\left(B_{i}\right)}{P(A)}$

超几何分布(hypergeometric distribution)$A$ 件产品,有 $F$ 件不合格。在产品中随机抽n件做检查,发现k件不合格品的概率。 $P(X=k)=\frac{C_{F}^{k} C_{A-F}^{n-k}}{C_{A}^{n}}$ 。记号: $X \sim H(n, M,N)$ 。数学期望为 $n q$ ,其中 $q = \dfrac{F}{A}$ (合格率)。

二项分布(Binomial Distribution):A的发生概率为 $p$, n次试验中事件A恰好发生k次的概率。 $P \{X = n\} = C_n^k p^k (n-p)^{n-k}$。记号: $X \sim B(n,p)$ 。期望: $np$ ,方差: $np(1-p)$

均匀分布(Uniform Distribution)$f(x)=\left\{\begin{array}{ll}\dfrac{1}{b-a}, & a,记作 $X\sim U(a, b)$

指数分布$ f(x;\lambda) = \left\{\begin{matrix} \lambda e^{-\lambda x} &,\; x \ge 0, \\ 0 &,\; x < 0. \end{matrix}\right.$,均值 $1/\lambda$,方差 $1/\lambda^2$

正态分布(Normal distribution)$f(x)=\frac{1}{\sqrt{2 \pi} \sigma} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right)$

二维正态分布

$$
f(x, y)=\left(2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}\right)^{-1} \exp \left[-\frac{1}{2\left(1-\rho^{2}\right)}\left(\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-\frac{2 \rho\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right)\right]
$$

泊松分布(poisson distribution):$P(X=k)=\frac{\lambda^{k}}{k !} e^{-\lambda}$,期望 $E(X)=λ$,方差 $D(X)=λ$

伽马函数(Gamma function)$\Gamma(z+1) = \int_0^\infty x^{z}e^{-x}\mathrm{d}x = z \Gamma(z)$

标准正态分布函数$\Phi(x) = \int_{-\infty}^x \phi(t)dt$

u 分布:就是标准正态分布 $N(0,1)$

期望的运算性质

  • $E(kX) = kE(X)$
  • $E(X+Y) = E(X) + E(Y)$
  • $E(X-Y) = E(X) - E(Y)$
  • $X, Y$ 相互独立时:$E(XY)= E(X)E(Y)$

方差的运算性质

  • $D(kX) = k^2D(x)$
  • $D(X+k) = D(X)$
  • $D(cX+a) = c^2D(X)$
  • $D(X\pm Y = D(X) + D(Y)$

另外有:$D(X) = E(X^2) - [E(X)]^2$

协方差$\operatorname{cov}(X,Y) = E((X-E(X))(Y-E(Y))) = E(XY) - E(X)E(Y)$ 表示两个随机变量之间的线性关系。正负表示正负相关性。

协方差的性质

  • 可交换
  • $\operatorname{cov}(aX,bY) = ab\operatorname{cov}(X,Y)$
  • $\operatorname{cov}(X_1 + X_2 , Y) = \operatorname{cov}(X_1, Y) + \operatorname{cov}(X_2, Y)$
  • $D(X\pm Y) = D(X) + D(Y) \pm 2 \operatorname{cov}(X,Y)$

相关系数: 设相关系数为 $\rho_{XY}$,则 $\operatorname{cov}(X,Y) = \rho_{XY}\sqrt{D(X)D(Y)}$。可以看到相关系数通过对协方差归一化得到。

切比雪夫不等式

$$
\operatorname{Pr}(|X-\mu| \geq k \sigma) \leq \frac{1}{k^{2}}
$$

其中:

  • $X$ 是随机变量
  • $\mu$ 是期望值
  • $\sigma$ 是标准差
  • $k$

也写作这样:

$$
\mathrm{P}(|x-\mu| \geqslant \varepsilon)\leqslant \frac{\sigma^2}{\varepsilon^2}
$$

或者

$$
\mathrm{P}(|x-\mu| < \varepsilon)\geqslant 1-\frac{\sigma^2}{\varepsilon^2} $$

考试一般填空题带公式就完事儿了。

$S^2$ 样本方差。

$E(S^2)$ 样本方差的均值。

片段

化标准正态分布

减去方差,再比上标准差。

$$
x\sim N(\mu, \sigma^2) \longrightarrow \dfrac{x-\mu}{\sigma}\sim N(0,1)
$$

总体均值化标准正态分布:

$$
X\sim N(\mu, \sigma^2)\longrightarrow \dfrac{\bar X - \mu}{\sigma / \sqrt{n}}\sim N(0,1)
$$

题型/易错提示

简单排列组合、古典概型问题

【例子】10 个产品中有 2 个次品。10 个任取 3 个,恰好取到一个次品的概率是?

【分析】

$$
C_2^1 \cdot C_8^2 / C_{10}^3 = 7/15
$$

求条件期望,别忘了除以新的和

typora\20201222221113_4e9393e71ec177bcb4b5d7ad7030abbf.png

$X=1$ 行,$0.2+0.1+0.1 = 0.4$,新的分布要 $0.2/0.4 = 1/2, 0.1/0.4 = 1/4, 1/4$

求边缘分布率、条件分布律

【例子】

typora\20201114231106_8aa3888d2940b1797dd7f0a9968e5b6b.png

(1)求 X 的边缘分布率,就把每个 X 从 Y 的方向加起来就行:

typora\20201114232035_2b225232b8ff311179dd07ae0259e523.png

ANS:

$$
\begin{array}{c|ccccc}
X & 51 & 52 & 53 & 54 & 55 \\
\hline p_{k} & 0.28 & 0.28 & 0.22 & 0.09 & 0.13
\end{array}
$$
$$
\begin{array}{c|ccccc}
Y & 51 & 52 & 53 & 54 & 55 \\
\hline p_{k} & 0.18 & 0.15 & 0.35 & 0.12 & 0.20
\end{array}
$$

第二问根据条件概率公式: $P\{Y=j \mid X=51\}=\frac{P\{X=51, Y=j\}}{P\{X=51\}}$ ,也就是说把 $X = 51$ 那一列的数据除以 $P(X = 51) = 0.28$ 即可。

$$
\begin{array}{c|ccccc}
Y=j & 51 & 52 & 53 & 54 & 55 \\
\hline P\{Y=j \mid X=51\} & \frac{6}{28} & \frac{7}{28} & \frac{5}{28} & \frac{5}{28} & \frac{5}{28}
\end{array}
$$

【例子】 含有阶乘的数列求和,这种一般要利用一下二项式定理。

typora\20201114233459_fff3fca4316cd9ac7d8596ac6ef84363.png

通过 $C_n^m = \dfrac{n!}{m!(n-m)!}$ 易得

X 边缘分布律: $\dfrac{14^n e^{14}}{n!}$

Y 边缘分布律: $\dfrac{(7.14)^m e ^{7.14 }}{m!}$

这是泊松分布。

根据条件概率公式

$$
\begin{aligned}
P\{X=n \mid Y=m\} &=\frac{P\{X=n, Y=m\}}{P\{Y=m\}} \\
&=\frac{e^{-14}(7.14)^{m}(6.86)^{n-m}}{m !(n-m) !} / \frac{(7.14)^{m}}{m !} \mathrm{e}^{-7.14} \\
&=\frac{(6.86)^{n-m}}{(n-m) !} \mathrm{e}^{-6.86}, \quad n=m, m+1, \cdots
\end{aligned}
$$
$$
\begin{aligned}
P\{Y=m \mid X=n\} &=\frac{P\{X=n, Y=m\}}{P\{X=n\}} \\
&=\frac{e^{-14}(7.14)^{m}(6.86)^{n-m}}{m !(n-m) !} / \frac{14^{n} \mathrm{e}^{-14}}{n !}
\end{aligned}
$$
$$
\begin{array}{l}
=\left(\begin{array}{c}
n \\
m
\end{array}\right)\left(\frac{7.14}{14}\right)^{m}\left(\frac{6.86}{14}\right)^{n-m} \\
=\left(\begin{array}{c}
n \\
m
\end{array}\right)(0.51)^{m}(0.49)^{n-m}, \quad m=0,1, \cdots, n
\end{array}
$$

第三问略

【例子】 设概率密度 $f(x, y)=\left{\begin{array}{ll}
c x^{2} y, & x^{2} \leqslant y \leqslant 1, \
0, & \text { 其他. }
\end{array}\right.$

$c$ , 边缘概率密度,条件概率密度以及条件概率 $P\left\{Y \geqslant \frac{1}{4} \mid X=\frac{1}{2}\right\}, \quad P\left\{Y \geqslant \frac{3}{4} \mid X=\frac{1}{2}\right\}$

(1) 根据概率密度函数的性质, $1 = \int_{-\infty }^{+ \infty }\int_{-\infty }^{+ \infty }f(x,y) \mathrm{d}x \mathrm{d}y$ ,可得 $c = \dfrac{21}{4}$

(2) $f_X(x)$ 就是 $y$ 方向积分, $f_Y(y)$ 就是 $x$ 方向积分。可得

$f_X(x)=\left{\begin{array}{ll}
\frac{21}{8} x^{2}\left(1-x^{4}\right), & -1 \leqslant x \leqslant 1, \
0, & \text { 其他. }
\end{array}\right.$

$f_Y(y)=\left{\begin{array}{ll}
\frac{7}{2} y^{5 / 2}, & 0 \leqslant y \leqslant 1 \
0, & \text { 其他. }
\end{array}\right.$

(3) 直接带条件概率公式。

(4) 直接带入上一问即可。

证明独立性

【例子】

设随机变量 $(X, Y)$ 具有分布函数

$$
F(x, y)=\left\{\begin{array}{ll}
\left(1-\mathrm{e}^{-\alpha x}\right) y, & x \geqslant 0,0 \leqslant y \leqslant 1, \quad \alpha>0 \\
1-\mathrm{e}^{-a x}, & x \geqslant 0, y>1 \\
0, & \text { 其他. }
\end{array}\right.
$$

证明 $X, Y$ 相互独立.
(2)设随机变量( $X, Y$ ) 具有分布律 $P\{X=x, Y=y\}=p^{2}(1-p)^{x+y-2}, 0 均为正整数
$X, Y$ 是否相互独立.

【分析】

证明相互独立就是证明 对于所有的 $x, y$ 都有 $F(x, y)=F_{X}(x) F_{Y}(y)$

求联合概率密度

【例子】

$X$$Y$ 是两个相互独立的随机变量, $X$ 在区间 (0,1) 上服从均匀分 布, $Y$ 的概率密度为

$$
f_{Y}(y)=\left\{\begin{array}{ll}
\frac{1}{2} \mathrm{e}^{-\mathrm{y} / 2}, & y>0 \\
0, & y \leqslant 0
\end{array}\right.
$$

(1)求 X 和 $Y$ 的联合概率密度.
(2) 设含有 $a$ 的二次方程为 $a^{2}+2 X a+Y=0,$ 试求 $a$ 有实根的概率.

【分析】

因为相互独立,所以直接合到一起就行:

$$
f(x, y)=\left\{\begin{array}{ll}
\frac{1}{2} \mathrm{e}^{-y / 2}, & 00 \\
0, & \text { 其他. }
\end{array}\right.
$$

瑞利分布

  1. $X, Y$ 是相互独立的随机变量,它们都服从正态分布 $N\left(0, \sigma^{2}\right) .$ 试验证
    随机变量 $Z=\sqrt{X^{2}+Y^{2}}$ 的概率密度为

    $$
    f_{Z}(z)=\left\{\begin{array}{ll}
    \frac{z}{\sigma^{2}} \mathrm{e}^{-z^{2} /\left(2 \sigma^{2}\right)}, & z \geqslant 0 \\
    0, & \text { 其他. }
    \end{array}\right.
    $$

    我们称 $Z$ 服从参数为 $\sigma(\sigma>0)$ 的瑞利(Rayleigh) 分布.

typora\20201222221124_af8fb260fa2b3077a95e79e7e3093dc5.png

怎么求 $E(g(x))$

$$
E(g(x)) = \int_{-\infty}^{+\infty} g(x) f(x) \mathrm{d}x
$$

如何判断独立性和相关性

typora\20201222221137_c57794ee18f0f3e6eea7766bd4ed5ee3.png

输入:密度函数,相关系数。输出:联合分布

typora\20201222221143_5e7ce22ee3fa280f717a32874d8e97f3.png

独立同分布:中心极限定理。输入:arr[n]{$\bar{x}$},$\sigma$。输出:$P\sum > c$

【例子】一保险公司有10 000个汽车投保人,每个投保人索赔金额的数学期望为280美元,标准差为800美元,求索赔总金额超过2700 000美元的概率.

【分析】

根据中心极限定理:

$$
\bar{X} = \dfrac{1}{10000}\sum_{i=1}^{10000}X_i \sim N(280, \dfrac{800^2}{10000})
$$
$$
\begin{aligned}
p_{1} &=P(\bar{X}>270) \approx 1-\Phi\left(\frac{270-280}{8}\right)=1-\Phi\left(-\frac{5}{4}\right) \\
&=\Phi\left(\frac{5}{4}\right)=\Phi(1.25)=0.8944
\end{aligned}
$$

输入:来自正态分布的样本,输出 $P\{\sum X_i^2 > c\}$

【例子】设 $X_1, X_2, \cdots , X_{10}$ 是来自 $N(0,0.09)$ 总体的样本,求 $P\{\sum_{i=1}^{10} > 1.44\}$.

【分析】每个 $X_i \sim N(0,0.09)$,则 $\dfrac{X_i - 0}{0.3}\sim N(0,1)$

$$
\sum_{i=1}^{10}(\dfrac{X_i}{0.3})^2 = \dfrac{1}{0.3^2}\sum_{i=1}^{10}X_i^2\sim \chi^2(10)\\
P\left\{\sum_{i=1}^{10} X_{i}^{2}>1.44\right\}=P\left\{\left(\frac{1}{0.3^{2}} \sum_{i=1}^{10} X_{i}^{2}>\frac{1.44}{0.3^{2}}\right\}\right. = P(\chi^2(10)> 16)
$$

输入:来自正态分布的样本,求抽样得到样本 $P\{\sigma^2 < c\}$

【例子】设总体 $X \sim N\left(\mu, 3^{2}\right),$ 其中 $\mu$ 为未知参数 从总体 $X$ 中抽取样本容量为16的样本,求样本方差小于 16.5 的概率。

$$
\frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1)
$$
$$
\begin{array}{l}\\\text { 即 } \frac{(16-1) S^{2}}{9}=\frac{5}{3} S^{2} \sim \chi^{2}(15) . \\
P\left\{S^{2}<16.5\right\} \end{array} $$

求来自总体的样本的联合概率密度

设总体 $X \sim N\left(\mu, \sigma^{2}\right), X_{1}, X_{2}, \cdots, X_{10}$ 是来自 $X$ 的样本.
(1) 写出 $X_{1}, X_{2}, \cdots, X_{10}$ 的联合概率密度.
(2) 写出 $\bar{X}$ 的概率密度

(1) 由假设 $X_{i}(i=1,2, \cdots, 10)$ 的概率密度为

$$
f_{X_{i}}\left(x_{i}\right)=\frac{1}{\sqrt{2 \pi \sigma}} \mathrm{e}^{-\left(x_{i}-\mu\right)^{2} /\left(2 \sigma^{2}\right)}
$$

$X_{1}, X_{2}, \cdots, X_{10}$ 的联合概率密度为

$$
\begin{aligned}
\prod_{i=1}^{10} f_{X_{i}}\left(x_{i}\right) &=\prod_{i=1}^{10} \frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\left(x_{i}-\mu\right)^{2} /\left(2 \sigma^{2}\right)} \\
&=\frac{1}{\left(2 \pi \sigma^{2}\right)^{5}} \mathrm{e}^{-\sum_{i=1}^{10}\left(x_{i}-\mu\right)^{2} /\left(2 \sigma^{2}\right)}
\end{aligned}
$$

(2) $\bar{X} \sim N\left(\mu, \frac{\sigma^{2}}{10}\right)$, 故 $\bar{X}$ 的概率密度为

$$
f_{\bar{X}}(x)=\frac{\sqrt{10}}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-5(x-\mu)^{2} / \sigma^{2}}=\frac{\sqrt{5}}{\sqrt{\pi} \sigma} \mathrm{e}^{-5(x-\mu)^{2} / \sigma^{2}}
$$

参考资料

https://www.zybuluo.com/catscarf/note/971426

https://bookdown.org/yifei/book/probability.html

感谢高中同学曹盛为我提供了他的手写笔记!

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注