📊 概率与统计：数据分析与随机模型

掌握从计数原理到概率分布，再到统计推断的完整逻辑链条。

🔹 计数原理与排列组合

第 22 章计数原理

22.00 知识网络

Link to original

22.01 计数原理、排列与组合
🟦 计数原理、排列与组合专题

核心心法

“分类用加法，分步用乘法；有序选排列，无序选组合”。计数原理是解决“有多少种可能”的底层逻辑。排列关注的是元素的位置顺序，而组合关注的是元素的选取结果。掌握排列组合数之间的倍数关系（ $A_{n}^{m} = C_{n}^{m} \cdot m!$ ），能帮助你理清复杂计数问题中的逻辑层次。

一、计数原理 (Counting Principles)

1. 分类加法计数原理

定义：完成一件事有 $n$ 类办法，各步方法相互独立。

公式： $N = m_{1} + m_{2} + \dots + m_{n}$ 。

特点：每种方法都能直接独立完成这件事。

2. 分步乘法计数原理

定义：完成一件事需要分成 $n$ 个必经步骤，各步相互依存。

公式： $N = m_{1} \times m_{2} \times \dots \times m_{n}$ 。

特点：必须完成所有步骤，这件事才算完成。

二、排列 (Permutation)

1. 定义与排列数

排列：从 $n$ 个不同元素中取出 $m$ 个， $* * 按照一定顺序 * *$ 排成一列。

排列数：所有不同排列的个数，用 $A_{n}^{m}$ 表示。

2. 排列数公式

一般公式： $A_{n}^{m} = n (n - 1) \dots (n - m + 1) = \frac{n !}{( n - m )!}$ （ $m \leq n$ ）。

全排列： $A_{n}^{n} = n!$ 。规定 $0! = 1$ 。

3. 排列数的性质

① $n \cdot A_{n}^{n} = (n + 1)! - n!$

② $\frac{n}{( n + 1 )!} = \frac{1}{n !} - \frac{1}{( n + 1 )!}$ （常用于数列裂项求和）

三、组合 (Combination)

1. 定义与组合数

组合：从 $n$ 个不同元素中取出 $m$ 个 $* * 合成一组 * *$ （不考虑顺序）。

组合数：所有不同组合的个数，用 $C_{n}^{m}$ 表示。

2. 组合数公式

计算式： $C_{n}^{m} = \frac{A _{n}^{m}}{A _{m}^{m}} = \frac{n !}{m ! ( n - m )!}$ （ $m \leq n$ ）。

规定： $C_{n}^{0} = 1$ 。

3. 组合数的性质

① 对称性： $C_{n}^{m} = C_{n}^{n - m}$ 。

若 $C_{n}^{x} = C_{n}^{y}$ ，则 $x = y$ 或 $x + y = n$ 。

② 递推性 (杨辉三角基础)： $C_{n}^{m} + C_{n}^{m - 1} = C_{n + 1}^{m}$ 。

四、排列数与组合数的关系

$A_{n}^{m} = C_{n}^{m} \cdot A_{m}^{m}$

理解：从 $n$ 个中取 $m$ 个的排列过程，可以看作先“组合”（取出 $m$ 个），再“排列”（将这 $m$ 个全排列）。

⚠️ 考场避坑与做题技巧

“有序”还是“无序”的判定

拿到题目先自问：“换个位置，结果变吗？”。如果换位置结果变了（如排队、发职务、组数字），用排列 $A$ ；如果换位置结果不变（如选代表、抽样检查、配菜），用组合 $C$ 。

防止重复与遗漏

分类计数时，要确保各类别之间不重不漏；分步计数时，要确保各步骤之间连续且完整。

处理排列组合的常用模型

相邻问题：捆绑法（将相邻元素视为一个大元素）。

不相邻问题：插空法（先排其他元素，再将不相邻元素插入空位）。

定序问题：除法倍数法（总排列数除以定序全排列）。

至多/至少问题：反难则易（使用间接法，总数减去不符合要求的情况）。

Link to original

22.02 排列组合 16 种核心解题模型与策略
🟦 排列组合 16 种核心解题模型与策略

核心心法

“结构定模型，限制定顺序”。排列组合问题的复杂性源于各种限制条件（相邻、不相邻、定序、重复等）。掌握这 16 种核心模型，本质上是掌握了将复杂计数问题“降维”为基础加乘原理的工具箱。

1. 特殊元素和特殊位置优先安排

核心思想：优先处理有特殊限制的元素（如“首位不为0”）或位置（如“末位为奇数”），消除矛盾。

例：0,1,2,3,4,5 组成无重复五位奇数。

步1：末位 $C_{3}^{1}$ ；步2：首位 $C_{4}^{1}$ （不为0且不为末位）；步3：余位 $A_{4}^{3}$ 。

结论： $C_{3}^{1} \times C_{4}^{1} \times A_{4}^{3} = 288$ 。

2. 相邻元素捆绑法

核心思想：相邻元素看作一个整体（大元素），排完后再考虑内部排列。

例：7人站一排，甲乙相邻且丙丁相邻。

步1：整体排 $A_{5}^{5}$ ；步2：内部自排 $A_{2}^{2} \times A_{2}^{2}$ 。

结论： $A_{5}^{5} \times A_{2}^{2} \times A_{2}^{2} = 480$ 。

3. 不相邻问题插空法

核心思想：先排无限制元素，再将不相邻元素插入形成的空隙中。

例：4个舞蹈、2个相声、3个独唱，舞蹈不连续。

步1：排余项 $A_{5}^{5}$ ；步2：插空位 $A_{6}^{4}$ （5个元素形成6个空）。

结论： $A_{5}^{5} \times A_{6}^{4}$ 。

4. 定序问题整除法

核心思想：先全排列，再除以定序元素的全排列数以消除顺序影响。

例：7人排队，甲乙丙3人顺序一定。

结论： $\frac{A _{7}^{7}}{A _{3}^{3}}$ 。

5. 重排问题求幂法

核心思想：允许重复抽取，每一步的选择数均相等。

例：6名实习生分配到7个车间。

结论： $7^{6}$ 。

6. 圆排列问题

核心思想：圆排列无首尾，需固定一个元素。

结论： $n$ 个不同元素圆排列种数为 $(n - 1)!$ 。

7. 多排问题直排法

核心思想：将多排位置拉直成一排来处理。

例：8人前后两排各4人，甲乙前排，丙后排。

结论： $A_{4}^{2} \times A_{4}^{1} \times A_{5}^{5}$ 。

8. 排列组合混合问题先选后排

核心思想：先从总体中选出符合要求的元素组，再对这组元素进行排列。

例：5个球装入4个盒，每盒至少一个。

步1：选2球绑在一起 $C_{5}^{2}$ ；步2：4个元素排入4盒 $A_{4}^{4}$ 。

结论： $C_{5}^{2} \times A_{4}^{4}$ 。

9. 小集团问题先整体后局部

核心思想：类似于捆绑法，但侧重于集团内外的多层次排列。

例：1-5组成五位数，恰有两个偶数夹在1,5之间。

结论： $A_{2}^{2} \times A_{2}^{2} \times A_{2}^{2}$ （整体排 $\times$ 1,5自排 $\times$ 偶数自排）。

10. 元素相同问题隔板法 (Star and Bars)

核心思想：在相同元素的空隙中插入“挡板”进行分配。

例：10个名额分给7个班，每班至少一个。

结论： $C_{9}^{6}$ 。

模型扩展：

正整数解： $x_{1} + \dots + x_{n} = m ⟹ C_{m - 1}^{n - 1}$ 。

非负整数解： $x_{1} + \dots + x_{n} = m ⟹ C_{m + n - 1}^{n - 1}$ 。

11. 正难则反总体淘汰法

核心思想：当正面分类过多时，用总数减去违规数。

结论： $N_{total} - N_{illegal}$ 。

12. 不同元素分组分配法

核心思想：先分组（注意均匀分组需除以 $A_{k}^{k}$ ），再分配。

均匀分组判定：若有 $k$ 组元素个数相等，需除以 $A_{k}^{k}$ 。

13. 合理分类与分步

核心思想：寻找“全能型”关键元素作为分类标准。

14. 错位排列 (Derangement)

核心思想：每个元素都不在对应位置。

常用数： $a_{1} = 0, a_{2} = 1, a_{3} = 2, a_{4} = 9, a_{5} = 44$ 。

15. 分解与合成策略

例：30030 的偶因数个数。

核心：必须含质因数 2，其余 5 个质因数任取。

结论： $2^{5} - 1$ （即 $C_{5}^{1} + \dots + C_{5}^{5}$ ）。

16. 特殊模型

异面直线对： $3 (C_{n}^{4} - m)$ 。

圆内交点： $C_{n}^{4}$ 。

连续号码： $C_{n - 2 (m - 1)}^{2}$ 。

传球递推： $a_{n} = 4^{n - 1} - a_{n - 1}$ 。

⚠️ 考场避坑与做题技巧

隔板法的使用前提

隔板法只能用于相同元素（如名额、一样的球）分给不同对象（如班级、盒子）。如果球是不同的，必须使用分组分配法。

重复计数的重灾区

在“平均分组”问题中，如 4 人平均分成两组，如果不除以 $A_{2}^{2}$ ，就会将 ${A, B}$ 与 ${C, D}$ 的组合计算两次。

“至少”不一定都要用间接法

当“至少”的情况只有 1-2 类时，直接分类计算往往比总数减去反面更不容易出错。

Link to original

22.03 二项式定理全总结
🟦 二项式定理全总结 (Binomial Theorem)

核心心法

“通项定位置，赋值定系数”。二项式定理的核心在于对 $(a + b)^{n}$ 展开结构的把握。通项公式 $T_{k + 1}$ 是解决特定项问题的钥匙；而面对复杂的系数和问题，“赋值法”则是化繁为简的神技。

一、二项式定理及通项公式

1. 基本公式

$(a + b)^{n} = C_{n}^{0} a^{n} + C_{n}^{1} a^{n - 1} b + C_{n}^{2} a^{n - 2} b^{2} + \dots + C_{n}^{n} b^{n} = \sum_{k = 0}^{n} C_{n}^{k} a^{n - k} b^{k}$

项数：共有 $n + 1$ 项。

二项式系数： $C_{n}^{0}, C_{n}^{1}, \dots, C_{n}^{n}$ 。

2. 通项公式 (General Term)

$T_{k + 1} = C_{n}^{k} a^{n - k} b^{k}, k = 0, 1, 2, \dots, n$

用途：求指定项（如第 3 项）、有理项（指数为整数）、常数项等。

3. 特殊形式

(1+x)ⁿ： $(1 + x)^{n} = 1 + C_{n}^{1} x + C_{n}^{2} x^{2} + \dots + C_{n}^{n} x^{n}$

(a-b)ⁿ： $T_{k + 1} = (- 1)^{k} C_{n}^{k} a^{n - k} b^{k}$ （注意符号交替）

二、二项式系数的性质

对称性： $C_{n}^{m} = C_{n}^{n - m}$ （与首末两端等距离的系数相等）。

增减性与最大值：系数从两端向中间先增后减。

$n$ 为奇数：中间两项 $C_{n}^{\frac{n - 1}{2}}$ 和 $C_{n}^{\frac{n + 1}{2}}$ 相等且最大。

$n$ 为偶数：中间一项 $C_{n}^{\frac{n}{2}}$ 最大。

系数和公式：

全系数和： $\sum_{k = 0}^{n} C_{n}^{k} = 2^{n}$

奇/偶项系数和： $C_{n}^{0} + C_{n}^{2} + \dots = C_{n}^{1} + C_{n}^{3} + \dots = 2^{n - 1}$

三、赋值法求系数和 (The Assignment Method)

设 $(a x + b)^{n} = a_{0} + a_{1} x + a_{2} x^{2} + \dots + a_{n} x^{n} = f (x)$ ：

常数项： $a_{0} = f (0)$

所有项系数和： $f (1) = (a + b)^{n}$

正负交替和： $f (- 1) = (b - a)^{n}$

绝对值系数和： $(∣ a ∣ + ∣ b ∣)^{n}$

进阶技巧 (导数法)：对 $f (x)$ 求导并令 $x = 1$ ，可求 $a_{1} + 2 a_{2} + 3 a_{3} + \dots + n a_{n}$ 。

四、系数最大（小）项的求法

设第 $k$ 项的系数为 $A_{k}$ ：

求最大系数项：解不等式组 ${A_{k} \geq A_{k - 1} A_{k} \geq A_{k + 1}$

求最小系数项：解不等式组 ${A_{k} \leq A_{k - 1} A_{k} \leq A_{k + 1}$

五、二项式定理的其他应用

整除问题：将数字拆分为 $(a + b)^{n}$ ，通常取 $a$ 为除数的倍数（如 $8^{n} = (7 + 1)^{n}$ 判定被 7 除的余数）。

不等式证明：结合放缩法。

近似计算：当 $∣ x ∣ ≪ 1$ 时， $(1 + x)^{n} \approx 1 + n x$ 。

整数与小数部分 (共轭构造)：利用 $(A + B)^{n}$ 与 $(A - B)^{n}$ 配对（对偶式），因对偶式通常在 $(0, 1)$ 之间，从而锁定整数部分。

⚠️ 考场避坑与做题技巧

区分“二项式系数”与“项的系数”

二项式系数：仅指 $C_{n}^{k}$ ，与 $a, b$ 中的具体数值无关，永远为正。

项的系数：通项 $T_{k + 1}$ 中除了变量之外的所有常数部分，包含正负号。

通项公式的下标陷阱

通项是 $T_{k + 1}$ ，这意味着第 5 项对应的是 $k = 4$ 。在计算时千万不要把 $k$ 直接当成项数。

有理项的判定

求有理项时，将 $T_{k + 1}$ 化简为变量 $x$ 的 $f (k)$ 次方形式，解方程使 $f (k) \in Z$ ，且 $0 \leq k \leq n$ 。

Link to original

🔹 概率初步与古典概型 (第 14，15 章)

第 14 章统计

14.00 知识网络

Link to original

14.01随机抽样、平均数与方差
🟦 统计学基础：随机抽样、平均数与方差 (Statistics)

核心心法

“样本推断总体，分层化繁为简”。统计学的核心是通过科学的抽样方法（如简单随机抽样、分层随机抽样）获取具有代表性的样本，并利用平均数（集中趋势）和方差（离散程度）来定量描述总体的特征。

一、随机抽样 (Random Sampling)

1. 调查方式

(1) 全面调查：对调查对象全体逐一调查（如人口普查）。

(2) 抽样调查：从总体中抽取部分个体调查，以此推断总体情况。核心是样本需具有代表性。

2. 基本概念

总体：调查对象的全体。

个体：组成总体的每一个调查对象。

样本：从总体中抽取的部分个体。

样本容量：样本中包含的个体数量。

3. 抽样方法

简单随机抽样：

放回式：每次抽取后放回，个体概率始终相等。

不放回式（常用）：每次抽取后不放回，个体概率始终相等。

分层随机抽样：

按变量将总体划分为互不重叠的层，各层独立抽样。

比例分配：每层的样本量与该层的大小成比例。

二、平均数的计算 (Mean)

普通平均数： $\overset{x}{ˉ} = \frac{1}{n} \sum_{i = 1}^{n} x_{i}$

加权平均数： $\overset{x}{ˉ} = \sum_{i = 1}^{n} p_{i} x_{i}$ （ $p_{i}$ 为频率）

分层抽样的总平均数 ( $\overset{w}{ˉ}$ )：

两层： $\overset{w}{ˉ} = \frac{m}{m + n} \overset{x}{ˉ} + \frac{n}{m + n} \overset{y}{ˉ}$

三层： $\overset{w}{ˉ} = \frac{l}{l + m + n} \overset{x}{ˉ} + \frac{m}{l + m + n} \overset{y}{ˉ} + \frac{n}{l + m + n} \overset{z}{ˉ}$

三、方差与标准差 (Variance & Standard Deviation)

1. 基本计算

普通方差： $s^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \overset{x}{ˉ})^{2} = \frac{1}{n} \sum_{i = 1}^{n} x_{i}^{2} - \overset{x}{ˉ}^{2}$

加权方差： $s^{2} = \sum_{i = 1}^{n} p_{i} (x_{i} - \overset{x}{ˉ})^{2}$

标准差： $s = s^{2}$ 。刻画数据的离散程度， $s$ 越大波动越大。

2. 分层抽样的方差公式

若两层样本分别为 $(m, \overset{x}{ˉ}, s_{x}^{2})$ 和 $(n, \overset{y}{ˉ}, s_{y}^{2})$ ，总平均数为 $\overset{w}{ˉ}$ ： $s^{2} = \frac{m}{m + n} [s_{x}^{2} + (\overset{x}{ˉ} - \overset{w}{ˉ})^{2}] + \frac{n}{m + n} [s_{y}^{2} + (\overset{y}{ˉ} - \overset{w}{ˉ})^{2}]$

🔍 证明简述：利用方差定义式展开，通过添加项 $(\overset{x}{ˉ} - \overset{x}{ˉ})$ 进行平移，利用 $\sum (x_{i} - \overset{x}{ˉ}) = 0$ 的性质简化交叉项，最终合并为各层方差与各层均值偏离度的加权和。

三层情况： $s^{2} = \sum_{l a yer = 1}^{3} \frac{n _{i}}{n _{t o t a l}} [s_{i}^{2} + (\overset{x}{ˉ}_{i} - \overset{w}{ˉ})^{2}]$

四、数据的线性变换结论 (Linear Transformation)

若新数据 $y_{i} = a x_{i} + b$ ，原数据特征为 $(\overset{x}{ˉ}, s_{x}^{2}, x_{p}, x_{0})$ ，则新特征如下：

统计量变换公式备注
平均数 $\overset{y}{ˉ} = a \overset{x}{ˉ} + b$ 随 $a, b$ 同步平移伸缩
方差 $s_{y}^{2} = a^{2} s_{x}^{2}$ 与常数 $b$ 无关
百分位数 $y_{p} = a x_{p} + b$ 保持顺序关系
众数 $y_{0} = a x_{0} + b$ 对应位置平移
极差 $R_y = a

⚠️ 考场避坑与做题技巧

分层方差的物理意义

分层方差公式由两部分组成：层内方差（ $s_{x}^{2}$ ）和层间方差（ $(\overset{x}{ˉ} - \overset{w}{ˉ})^{2}$ ）。如果各层均值差异很大，即使各层内部很稳定，总方差也会非常大。

方差计算的捷径

在手动计算方差时，优先使用公式 $s^{2} = \frac{1}{n} \sum x_{i}^{2} - \overset{x}{ˉ}^{2}$ （平方的平均减去平均的平方），这通常比直接用差值平方和计算量更小。

抽样概率的公平性

无论是不放回抽样还是分层抽样，在没有任何附加信息的情况下，总体中每个个体被抽到的概率都是 $n / N$ 。这是判断抽样方法是否科学的核心标准。

Link to original

统计量	变换公式	备注
平均数	$\overset{y}{ˉ} = a \overset{x}{ˉ} + b$	随 $a, b$ 同步平移伸缩
方差	$s_{y}^{2} = a^{2} s_{x}^{2}$	与常数 $b$ 无关
百分位数	$y_{p} = a x_{p} + b$	保持顺序关系
众数	$y_{0} = a x_{0} + b$	对应位置平移
极差	$R_y =	a

14.02 百分位数与四分位数
🟦 百分位数与四分位数 (Percentiles & Quartiles)

核心心法

“位置决定数值”。百分位数是刻画数据分布特征的重要指标，它不仅反映了数据的集中趋势，更体现了数据在整体中的相对排位。通过将数据“切片”，我们可以直观地观察到不同比例段的数据水平。

一、第 $p$ 百分位数的概念

一般地，一组数据的第 $p$ 百分位数是这样一个值，它满足：

这组数据中至少有 $p %$ 的数据小于或等于这个值；

且至少有 $(100 - p) %$ 的数据大于或等于这个值。

二、计算步骤 (三步走法则)

对于一组包含 $n$ 个数据的样本，计算第 $p$ 百分位数的步骤如下：

第一步：排序 将原始数据按从小到大的顺序排列。

第二步：计算指数 $i$ 利用公式计算位置指数： $i = n \times p %$ 。

第三步：判定取值

情况 A：若 $i$ 不是整数，记大于 $i$ 的比邻整数为 $j$ ，则第 $p$ 百分位数为第 $j$ 项数据。

情况 B：若 $i$ 是整数，则第 $p$ 百分位数为第 $i$ 项与第 $(i + 1)$ 项数据的平均数。

三、四分位数的概念 (Quartiles)

四分位数是将一组数据等分为四部分的三个数值点：

名称百分位对应常用简称
第一四分位数 第 25 百分位数下四分位数 ( $Q_{1}$ )
第二四分位数 第 50 百分位数 中位数 ( $Q_{2} / M$ )
第三四分位数 第 75 百分位数上四分位数 ( $Q_{3}$ )

⚠️ 考场避坑与做题技巧

整数判定是核心

很多同学在 $i$ 是整数时直接取第 $i$ 项，这是错误的。请记住：整数取均值，小数向上取。例如 $i = 3.1$ 取第 4 项， $i = 3$ 则取第 3、4 项的平均数。

中位数的两种求法

注意百分位数求法与传统初中中位数求法（奇数取中间，偶数取平均）在逻辑上是完全统一的。当 $p = 50$ 时，套用上述三步走法则所得结果与传统中位数定义一致。

百分位数的应用背景

在大型考试（如高考、SAT）中，百分位数常用来表示考生的相对排位。如果你处在第 90 百分位数，意味着你超过了 90% 的考生。

Link to original

名称	百分位对应	常用简称
第一四分位数	第 25 百分位数	下四分位数 ( $Q_{1}$ )
第二四分位数	第 50 百分位数	中位数 ( $Q_{2} / M$ )
第三四分位数	第 75 百分位数	上四分位数 ( $Q_{3}$ )

14.03 频率分布直方图中的数据计算
🟦 频率分布直方图中的数据计算 (Data Calculation in Histograms)

核心心法

“以面积代频率，以中值代区间”。在频率分布直方图中，小长方形的面积即为频率，其总和恒等于 1。处理直方图数据的关键在于“估算”：用组中值代表组内个体的平均水平，用线性插值法锁定百分位数的精确位置。

一、频率分布直方图的含义

核心定义：频率分布直方图以面积的形式反映了数据落在各个小组的频率大小。

基本性质：

各个小长方形的面积 $S_{i} = 组距 \times \frac{频率}{组距} = 该组频率$ 。

各个小长方形的面积总和等于 1，即样本数据落在整个区间的频率为 1。

二、样本平均数的估算

在频率分布直方图中，认为每一组的数据都集中在该组的组中值上：设 $x_{i}$ 为第 $i$ 组的组中值， $p_{i}$ 为第 $i$ 组的频率，则样本平均数 $\overset{x}{ˉ}$ 为： $\overset{x}{ˉ} = x_{1} p_{1} + x_{2} p_{2} + \dots + x_{n} p_{n} = \sum_{i = 1}^{n} x_{i} p_{i}$

三、百分位数的计算 (面积分割法)

在频率分布直方图中，通常认为数据均匀分布在各自的区间上。

1. 确定所在组

计算第 $p$ 百分位数时，先寻找第一个累积面积大于或等于 $p %$ 的小组 $i$ ： ${p_{1} + p_{2} + \dots + p_{i - 1} < p % p_{1} + p_{2} + \dots + p_{i - 1} + p_{i} \geq p %$

2. 精确值求解 (线性插值)

设第 $i$ 组对应的区间为 $(a, b)$ ，第 $p$ 百分位数为 $x_{0}$ ，则满足： $p_{1} + p_{2} + \dots + p_{i - 1} + (x_{0} - a) \cdot \frac{p _{i}}{b - a} = p %$

几何意义：直线 $x = x_{0}$ 左侧所有小长方形的面积之和恰好为 $p %$ 。

四、样本方差的估算

利用组中值和频率进行加权计算：设 $x_{i}$ 为组中值， $p_{i}$ 为频率， $\overset{x}{ˉ}$ 为前述估算的平均数，则方差 $s^{2}$ 为： $s^{2} = (x_{1} - \overset{x}{ˉ})^{2} p_{1} + (x_{2} - \overset{x}{ˉ})^{2} p_{2} + \dots + (x_{n} - \overset{x}{ˉ})^{2} p_{n} = \sum_{i = 1}^{n} (x_{i} - \overset{x}{ˉ})^{2} p_{i}$

⚠️ 考场避坑与做题技巧

纵轴的含义

频率分布直方图的纵轴是 $\frac{频率}{组距}$ ，而不是频率本身。计算频率时务必用纵轴高度乘以组距，这是初学者最容易忽略的细节。

百分位数的快速定位

寻找中位数（第 50 百分位数）时，如果前两组面积和为 0.3，第三组面积为 0.4，那么中位数一定在第三组内，且位于该组的前一半（因为 $0.3 + 0.2 = 0.5$ ）。

估算值的局限性

直方图计算出的平均数、方差和百分位数均为估算值。因为在计算过程中，我们假设了组内数据是均匀分布或全部集中在中点，这与原始数据的真实值可能存在微小偏差。

Link to original

第 15 章概率

15.00 知识网络

Link to original

15.01 古典概型
🟦 古典概型 (Classical Probability Model)

核心心法

“有限等概，计数求比”。古典概型是概率论中最理想、最基础的模型。它的核心在于两个前提：一是可能的结果必须是有限的，二是每个结果发生的几率必须是完全公平的。解题的关键在于准确计数样本点的个数。

1. 古典概型的特点

一个随机试验若满足以下两个条件，则称为古典概型：

(1) 有限性：样本空间 $Ω$ 中的样本点只有有限个。

(2) 等可能性：每个样本点发生的可能性完全相等。

2. 古典概型事件 $A$ 的概率计算

在古典概型下，事件 $A$ 发生的概率 $P (A)$ 等于事件 $A$ 所包含的样本点个数与样本空间 $Ω$ 中样本点总数的比值：

$P (A) = \frac{n ( A )}{n ( Ω )} = \frac{事件 A 包含的样本点个数}{样本空间 Ω 的样本点总数}$

⚠️ 考场避坑与做题技巧

计数方法的选择

在古典概型中，计算样本点个数常用到以下方法：

列举法：适用于样本点较少的情况。

列表法：适用于涉及两个元素（如掷两枚骰子）的试验。

树状图法：适用于涉及多个步骤或分阶段抽取的试验。

“等可能性”的检查

并不是所有有限样本空间的试验都是古典概型。例如，“投篮命中或不命中”虽然只有两个结果，但命中率通常不等于不命中率，因此不能直接套用古典概型公式。

有序与无序的区别

在计数时，必须保持分子（事件 $A$ ）与分母（样本空间 $Ω$ ）在“是否有序”上的一致性。如果分母考虑了抽取的顺序，分子也必须考虑顺序，否则概率计算会出错。

Link to original

15.02 随机事件、关系与独立性
🟦 概率论基础：随机事件、关系与独立性 (Probability Theory)

核心心法

“样本驱动事件，逻辑决定计算”。概率论的研究始于对随机现象的观察。通过样本空间刻画所有可能结果，利用集合论语言（交、并、补）定义事件关系，并以“独立性”作为概率乘法公式的逻辑基石，从而实现从频率估算到理论概率的跃迁。

一、基本概念 (Basic Concepts)

1. 随机试验 (Random Experiment)

具备以下特点的试验称为随机试验：

① 相同条件下可重复。

② 可能结果不止一个，且事先明确所有可能结果。

③ 试验前不能确定哪一个结果会出现。

2. 样本空间与样本点

样本空间 ( $Ω$ )：所有可能结果组成的集合。

样本点 ( $ω_{i}$ )：样本空间的元素，即每个可能的基本结果。

3. 随机事件

事件：样本空间 $Ω$ 的子集，常用 $A, B, C$ 表示。

基本事件：由单个样本点组成的单点集。

必然事件 ( $Ω$ )：在每次试验中总是发生， $P (Ω) = 1$ 。

不可能事件 ( $\emptyset$ )：在每次试验中都不发生， $P (\emptyset) = 0$ 。

注意

概率为 1 的事件不一定是必然事件；概率为 0 的事件不一定是不可能事件。

二、事件的关系、性质及概率计算

1. 包含与相等

包含 ( $A \subseteq B$ )：若 $A$ 发生则 $B$ 必发生。性质： $P (A) \leq P (B)$ 。

相等 ( $A = B$ )： $A \subseteq B$ 且 $B \subseteq A$ 。性质： $P (A) = P (B)$ 。

2. 并、交、互斥与对立

并事件 (和事件 $A \cup B$ )： $A$ 与 $B$ 至少有一个发生。

通用公式： $P (A \cup B) = P (A) + P (B) - P (A \cap B)$

交事件 (积事件 $A \cap B$ )： $A$ 与 $B$ 同时发生。

互斥事件： $A$ 和 $B$ 不能同时发生（ $A \cap B = \emptyset$ ）。

性质： $P (A \cup B) = P (A) + P (B)$ 。

对立事件 ( $\overline{A}$ )：有且仅有一个发生。

性质： $P (A) + P (\overline{A}) = 1$ 。

三、事件的相互独立性 (Independence)

1. 定义

对于任意两个事件 $A$ 和 $B$ ，若满足： $P (A B) = P (A) P (B)$ 则称事件 $A$ 与 $B$ 相互独立。

2. 性质

(1) 特殊事件：必然事件 $Ω$ 和不可能事件 $\emptyset$ 与任意事件相互独立。

(2) 四组独立：若 $A$ 与 $B$ 独立，则 $A$ 与 $\overline{B}$ 、 $\overline{A}$ 与 $B$ 、 $\overline{A}$ 与 $\overline{B}$ 也相互独立。

🔍 证明（以 $A$ 与 $\overline{B}$ 为例）

$∵ A = A B \cup A \overline{B}$ ，且 $A B$ 与 $A \overline{B}$ 互斥： $P (A) = P (A B) + P (A \overline{B})$ $P (A) = P (A) P (B) + P (A \overline{B})$ $∴ P (A \overline{B}) = P (A) - P (A) P (B) = P (A) (1 - P (B)) = P (A) P (\overline{B})$ 证毕。

3. 三个事件的独立性

若三个事件 $A, B, C$ 两两相互独立，需满足三个交事件的积公式。

注意：两两独立不能推出 $P (A BC) = P (A) P (B) P (C)$ ，反之亦然。

四、频率与概率

频率的稳定性：随着试验次数 $n$ 的增大，频率 $f_{n} (A)$ 会逐渐稳定于概率 $P (A)$ 。

应用：实际应用中，可以用频率估计概率。

⚠️ 考场避坑与做题技巧

互斥与独立的区分 (高频错点)

互斥是指两个事件“能不能同时发生”（集合关系）。

独立是指一个事件发生与否“影不影响另一个发生的概率”（概率关系）。

若 $P (A) > 0, P (B) > 0$ ，互斥事件一定不独立，独立事件一定不互斥。

对立与互斥的区别

对立是互斥的加强版。互斥要求“不能同时发生”（可以都不发生），而对立要求“有且仅有一个发生”（必须发生一个）。

利用独立性简化计算

当题目出现“同时发生”、“相继发生”或“互不影响”等关键词时，优先考虑乘法公式 $P (A B) = P (A) P (B)$ 。对于复杂的并事件 $P (A \cup B \cup C)$ ，有时计算对立事件 $1 - P (\overline{A} \overline{B} \overline{C})$ 会更简单。

Link to original

🔹 随机变量及其分布 (第 22 章)

第 22 章概率

23.00 知识网络

Link to original

23.01 条件概率与乘法公式
🟦 条件概率与乘法公式专题

核心心法

“空间收缩，信息更新”。条件概率的本质是：当我们得知事件 $A$ 已经发生时，样本空间从全集 $Ω$ 缩小到了集合 $A$ 。此时研究 $B$ 的概率，实际上是在研究“ $A$ 发生的部分里有多少属于 $B$ ”。

一、条件概率 (Conditional Probability)

1. 定义

设 $A, B$ 为两个随机事件，且 $P (A) > 0$ ，则在事件 $A$ 发生的条件下，事件 $B$ 发生的条件概率定义为： $P (B ∣ A) = \frac{n ( A B )}{n ( A )} = \frac{P ( A B )}{P ( A )}$

$n (A B)$ ：积事件 $A B$ 包含的样本点个数。

$P (A B)$ ：事件 $A$ 和 $B$ 同时发生的概率。

二、概率的乘法公式 (Multiplication Rules)

1. 两个事件的乘法公式

若 $P (A) > 0$ ，则： $P (A B) = P (A) P (B ∣ A)$

独立性简化：若 $A$ 与 $B$ 相互独立，则 $P (B ∣ A) = P (B)$ ，公式变为 $P (A B) = P (A) P (B)$ 。

2. 三个事件的乘法公式

当 $P (A B) > 0$ 时： $P (A BC) = P (A) P (B ∣ A) P (C ∣ A B)$

3. $n$ 个事件的递推乘法公式

当 $P (A_{1} A_{2} \dots A_{n - 1}) > 0$ 时： $P (A_{1} A_{2} \dots A_{n}) = P (A_{1}) P (A_{2} ∣ A_{1}) P (A_{3} ∣ A_{1} A_{2}) \dots P (A_{n} ∣ A_{1} A_{2} \dots A_{n - 1})$

三、条件概率的性质

条件概率在已知 $A$ 发生的“新世界”里，依然服从概率公理化定义的所有基本性质：

规范性： $P (Ω∣ A) = 1$ 。

可列可加性：若 $B$ 与 $C$ 互斥，则 $P (B \cup C ∣ A) = P (B ∣ A) + P (C ∣ A)$ 。

对立性： $P (\overset{ˉ}{B} ∣ A) = 1 - P (B ∣ A)$ 。

⚠️ 考场避坑与做题技巧

“ $P (A B)$ ”与“ $P (B ∣ A)$ ”的区别

$P (A B)$ ：在全样本空间里，看 $A, B$ 同时发生的可能性（分母是 $n (Ω)$ ）。

$P (B ∣ A)$ ：已经站在 $A$ 的地盘上了，看 $B$ 发生的可能性（分母是 $n (A)$ ）。口诀：前者是“两件事都发生的概率”，后者是“已知一件事后另一件发生的概率”。

注意概率树的权重

在使用乘法公式解决连抽问题（如：不放回抽样）时，概率树的每一条路径都是通过乘法公式计算出来的。路径末端的概率等于沿途所有分支概率的乘积。

独立性的判定

很多同学容易混淆“互斥”与“独立”。

互斥：不能同时发生， $P (A B) = 0$ 。

独立：互不影响， $P (B ∣ A) = P (B)$ 。如果 $A, B$ 独立且 $P (A), P (B) > 0$ ，那么它们一定不互斥。

Link to original

23.02全概率、贝叶斯公式与马尔可夫游走模型
🟦 全概率、贝叶斯公式与马尔可夫游走模型

核心心法

“全概求果，贝叶斯溯因，游走定递推”。全概率公式是处理“多原因导致单一结果”的利器；贝叶斯公式则是在已知结果发生时，反推各原因可能性的概率罗盘；而在处理更高级的随机过程（如游走模型）时，全概率公式则化身为建立递推数列的数学工具。

一、全概率公式与贝叶斯公式

1. 全概率公式 (Law of Total Probability)

前提： $A_{1}, A_{2}, \dots, A_{n}$ 构成样本空间的一个划分（两两互斥且并集为 $Ω$ ）。

公式：对任意事件 $B$ ，有 $P (B) = \sum_{i = 1}^{n} P (A_{i} B) = \sum_{i = 1}^{n} P (A_{i}) P (B ∣ A_{i})$

几何直观：将事件 $B$ 的概率看作是在各个“原因” $A_{i}$ 下发生的概率加权平均。

2. 贝叶斯公式 (Bayes’ Theorem)

定义：已知事件 $B$ 已经发生，推测是由某个特定原因 $A_{i}$ 引起的概率。

公式： $P (A_{i} ∣ B) = \frac{P ( A _{i} ) P ( B ∣ A _{i} )}{P ( B )} = \frac{P ( A _{i} ) P ( B ∣ A _{i} )}{\sum _{k = 1}^{n} P ( A _{k} ) P ( B ∣ A _{k} )}$

意义：后延概率（执果索因）。

二、递推方法与一维马尔可夫过程

1. 简单随机游走模型 (Random Walk)

模型设定：点在整数点移动，向左概率为 $α$ ，向右概率为 $β$ ( $α + β = 1$ )。

递推式推导：记 $P_{i}$ 为从位置 $i$ 出发最终到达目标（如 $m$ 点）的概率。由全概率公式，考虑第一步的去向： $P_{i} = α \cdot P_{i - 1} + β \cdot P_{i + 1}$

边界条件 (吸收壁)：若 $x = 0$ 和 $x = m$ 是终点，则 $P_{0} = 0, P_{m} = 1$ 。

2. 含原地不动的随机游走模型

模型设定：向左（概率 $a$ ）、原地不动（概率 $b$ ）、向右（概率 $c$ ），且 $a + b + c = 1$ 。

递推方程： $P_{i} = a P_{i - 1} + b P_{i} + c P_{i + 1}$

处理技巧：通常将 $b P_{i}$ 项移至左侧，转化为 $(1 - b) P_{i} = a P_{i - 1} + c P_{i + 1}$ ，进而利用特征方程解递推数列。

⚠️ 考场避坑与做题技巧

全概率公式的“树状图”法

面对多阶段概率问题，画出概率树。第一层的分支即为 $P (A_{i})$ ，第二层的分支即为条件概率 $P (B ∣ A_{i})$ 。所有到达目标 $B$ 的路径末端乘积之和，即为 $P (B)$ 。

贝叶斯公式的“先验”与“后验”

先验概率 $P (A_{i})$ ：在实验前已知的原因概率。

后验概率 $P (A_{i} ∣ B)$ ：在得知结果 $B$ 后，修正后的原因概率。审题时若看到“已知…发生，求是…的概率”，必用贝叶斯。

递推式的“算术性”

在随机游走中，若 $α = β = 0.5$ ，则递推式 $P_{i} = \frac{1}{2} (P_{i - 1} + P_{i + 1})$ 表明 ${P_{i}}$ 是一个等差数列。结合边界条件可以极速求出各点概率。

Link to original

23.03 离散型随机变量及其数字特征
🟦 离散型随机变量及其数字特征

核心心法

“分布定全局，期望定中心，方差定波动”。离散型随机变量的分布列是其灵魂，它完整描述了所有可能结果及其发生的概率；而数学期望和方差则是描述这一随机现象的两大核心指标。掌握线性变换下的数字特征变化规律（ $a E (X) + b$ 与 $a^{2} D (X)$ ），是快速处理复杂统计问题的关键。

一、离散型随机变量及其分布列

1. 随机变量 (Random Variable)

概念：对样本空间 $Ω$ 中每个样本点 $ω$ ，都有唯一实数 $X (ω)$ 对应。

分类：

离散型：取值可以一一列举（如：投掷骰子的点数）。

连续型：取值无法列举，充满一个区间（如：摄入卡路里数值）。

2. 分布列 (Probability Distribution)

对于离散型随机变量 $X$ ，其取值 $x_{i}$ 对应的概率 $P (X = x_{i}) = p_{i}$ ：

$X$ $x_{1}$ $x_{2}$ $\dots$ $x_{i}$ $\dots$ $x_{n}$
$P$ $p_{1}$ $p_{2}$ $\dots$ $p_{i}$ $\dots$ $p_{n}$

性质：

非负性： $p_{i} \geq 0$ 。

规范性： $\sum_{i = 1}^{n} p_{i} = 1$ 。

二、离散型随机变量的数字特征

1. 数学期望 (Mathematical Expectation)

定义：反映 $X$ 取值的平均水平。 $E (X) = \sum_{i = 1}^{n} x_{i} p_{i} = x_{1} p_{1} + x_{2} p_{2} + \dots + x_{n} p_{n}$

线性变换：若 $Y = a X + b$ ，则： $E (a X + b) = a E (X) + b$

2. 方差与标准差 (Variance & Standard Deviation)

方差定义：反映 $X$ 偏离均值的波动程度。 $D (X) = \sum_{i = 1}^{n} (x_{i} - E (X))^{2} p_{i}$

标准差： $σ (X) = D (X)$ 。

线性变换： $D (a X + b) = a^{2} D (X)$

🚀 深度拓展：方差的简化计算公式

在实际计算中，直接使用定义式往往计算量巨大，通常使用简化公式： $D (X) = E (X^{2}) - [E (X)]^{2}$

🔍 公式证明：
$D(X) &= \sum_{i=1}^{n}(x_i-E(X))^2p_i \\ &= \sum_{i=1}^{n}[x_i^2 - 2x_iE(X) + E^2(X)]p_i \\ &= \sum_{i=1}^{n}x_i^2p_i - 2E(X)\sum_{i=1}^{n}x_ip_i + E^2(X)\sum_{i=1}^{n}p_i \\ &= E(X^2) - 2E(X) \cdot E(X) + E^2(X) \cdot 1 \\ &= E(X^2) - E^2(X) \end{align*}$$ --- ## ⚠️ 考场避坑与做题技巧 > [!TIP] **期望与算术平均值的区别** > > 算术平均值是实验后的样本统计量，而数学期望是实验前的理论预测值。但在实验次数 $n \to \infty$ 时，样本平均值会趋近于期望值。 > [!CAUTION] **方差计算中的“平移不变性”** > > 注意到 $D(aX+b) = a^2D(X)$。这意味着给随机变量加上一个常数 $b$，其方差**保持不变**。因为平移不会改变数据的波动结构，只有伸缩变换（乘 $a$）会改变波动。 > [!IMPORTANT] **$E(X^2)$ 的含义** > > 在简化公式中，$E(X^2)$ 是指取值的平方与其对应概率的乘积之和，即 $\sum x_i^2 p_i$。千万不要把它误认为是 $(E(X))^2$。$ Link to original

$X$	$x_{1}$	$x_{2}$	$\dots$	$x_{i}$	$\dots$	$x_{n}$
$P$	$p_{1}$	$p_{2}$	$\dots$	$p_{i}$	$\dots$	$p_{n}$

23.04 二项分布与超几何分布
🟦 二项分布与超几何分布核心考点专题

核心心法

“放回独立二项式，不放组合超几何”。判定模型的关键在于：每一轮抽样是否会改变下一轮的概率。若概率恒定且相互独立，则是二项分布；若样本总量有限且不放回，则是超几何分布。在计算期望时，二项分布的 $n p$ 与超几何分布的 $n \cdot \frac{M}{N}$ 在形式上具有高度的统一性（均是次数乘以单次成功的概率）。

一、两点分布 (Bernoulli Distribution)

作为所有复杂分布的基石，两点分布描述的是只有两个结果（成功/失败）的单次试验：

$X$ 0 1
$P$ $1 - p$ $p$

二、二项分布 (Binomial Distribution)

1. $n$ 重伯努利试验

定义：同一个伯努利试验独立地重复进行 $n$ 次。

特征：每次试验结果相互独立，且成功概率 $p$ 保持不变（通常对应“有放回”抽取）。

2. 概念与分布列

若 $X$ 表示事件 $A$ 发生的次数，则 $X \sim B (n, p)$ ： $P (X = k) = C_{n}^{k} p^{k} (1 - p)^{n - k}, k = 0, 1, \dots, n$

3. 期望与方差

期望： $E (X) = n p$

方差： $D (X) = n p (1 - p)$

期望公式的推导核心

利用组合数恒等式 $k C_{n}^{k} = n C_{n - 1}^{k - 1}$ ，将求和式转化为二项式展开的逆过程，最终得到 $n p (p + q)^{n - 1} = n p$ 。

三、超几何分布 (Hypergeometric Distribution)

1. 概念 (不放回抽取)

产品总量 $N$ ，次品量 $M$ ，不放回抽取 $n$ 件。 $X$ 为抽得的次品数： $P (X = k) = \frac{C _{M}^{k} C _{N - M}^{n - k}}{C _{N}^{n}}$ 其中 $k$ 的范围受限于 $max {0, n - N + M} \leq k \leq min {n, M}$ 。

2. 期望与方差

期望： $E (X) = \frac{n M}{N}$

方差： $D (X) = \frac{n M ( N - M ) ( N - n )}{N ^{2} ( N - 1 )}$ （注：解答题中不可直接使用）

四、深度拓展：类超几何分布 (顺序抽样)

当题目要求“一次一次抽取直到某条件停止”时，考虑顺序：

例题：9球（3红6白），不放回每次取1个，直到取出3个红球停止，求第4次停止的概率。解析：

意味着前3次中恰有2个红球，且第4次必取到红球。

计算式： $P = \frac{C _{3}^{2} C _{6}^{1} \cdot A _{3}^{3} \cdot C _{1}^{1}}{A _{9}^{4}}$ （或利用组合思想分步计算）。

通用策略：将相同球视为不同球，分子分母统一带顺序。

⚠️ 考场避坑与做题技巧

二项分布与超几何分布的“近似”转化

当产品总量 $N$ 非常大且抽取的样本 $n$ 相对很小时（如 $N > 100 n$ ），不放回抽样可以近似看作有放回抽样。此时超几何分布可以用二项分布来近似计算。

计算量的控制

超几何分布的计算涉及大量组合数，容易算错。建议先化简分母 $C_{N}^{n}$ ，利用对称性 $C_{n}^{k} = C_{n}^{n - k}$ 来减小运算压力。

期望的“直觉”检验

无论是 $n p$ 还是 $n \cdot \frac{M}{N}$ ，本质上都是“抽样次数 $\times$ 成功的胜率”。如果算出来的期望值超出了抽样总数 $n$ 或成功总数 $M$ ，那一定是公式记反了。

Link to original

$X$	0	1
$P$	$1 - p$	$p$

23.05 正态分布
🟦 正态分布性质与 $3 σ$ 原则专题

核心心法

“均值定位置，方差定形状，对称求概率”。正态分布 $N (μ, σ^{2})$ 的灵魂在于其对称轴 $x = μ$ 。无论曲线如何“矮胖”或“瘦高”，其总面积恒为 1。掌握标准正态化公式 $η = \frac{ξ - μ}{σ}$ ，是将一般正态分布转化为可查表的标准正态分布 $N (0, 1)$ 的万能钥匙。

正态分布的概念若连续型随机变量 $ξ$ 的概率密度函数为： $f (x) = \frac{1}{σ 2 π} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}, x \in (- \infty, + \infty)$ 其中 $σ, μ$ 为常数，且 $σ > 0$ ，则称 $x$ 服从正态分布，简记为 $X \sim N (μ, σ^{2})$ ， $f (x)$ 的图象称为正态曲线。

正态分布的期望与方差若 $ξ \sim N (μ, σ^{2})$ ，则： $E (ξ) = μ, D (ξ) = σ^{2}$

正态曲线的性质

① 曲线在 $x$ 轴的上方，与 $x$ 轴不相交；

② 曲线关于直线 $x = μ$ 对称；

③ 曲线在 $x = μ$ 时达到峰值 $\frac{1}{σ 2 π}$ ；

④ 曲线与 $x$ 轴之间的面积为 $1$ ；

⑤ 当 $x < μ$ 时，曲线上升；当 $x > μ$ 时，曲线下降。并且当曲线向左右两边无限延伸时，以 $x$ 轴为渐近线，向它无限靠近；

⑥ 曲线的形状由 $σ$ 确定： - $σ$ 越大，峰值 $\frac{1}{σ 2 π}$ 越小，曲线越“矮胖”，表示总体的分布越分散； - $σ$ 越小，峰值 $\frac{1}{σ 2 π}$ 越大，曲线越“瘦高”，表示总体的分布越集中。

正态分布的概率含义若 $X \sim N (μ, σ^{2})$ ，则： - $X$ 取值不超过 $x$ 的概率 $P (X \leq x)$ 为曲线下 $(- \infty, x]$ 区域的面积； - $P (a \leq X \leq b)$ 为曲线下 $[a, b]$ 区域的面积。

3σ原则假设 $X \sim N (μ, σ^{2})$ ，对于给定的 $k \in N^{*}$ ， $P (μ - kσ < x \leq μ + kσ)$ 是一个只与 $k$ 有关的定值。

特别地： $\begin{align*} P(\mu - \sigma < x \leq \mu + \sigma) &= 0.6827 \\ P(\mu - 2\sigma < x \leq \mu + 2\sigma) &= 0.9545 \\ P(\mu - 3\sigma < x \leq \mu + 3\sigma) &= 0.9973 \end{align*}$ 在实际应用中，通常认为服从于正态分布 $N (μ, σ^{2})$ 的随机变量只取 $(μ - 3 σ, μ + 3 σ)$ 之间的值，并简称之为 3σ 原则。 -

标准正态分布

① 在标准正态分布表中，相应于 $x_{0}$ 的值 $Φ (x_{0})$ 是指总体取值小于 $x_{0}$ 的概率，即 $Φ (x_{0}) = P (x < x_{0})$ 。 - $x_{0} \geq 0$ 时， $Φ (x_{0})$ 的值可在标准正态分布表中查到； - $x_{0} < 0$ 时，可利用其图象的对称性获得 $Φ (x_{0}) = 1 - Φ (- x_{0})$ 来求出。区间概率计算： $P (x_{1} < ξ < x_{2}) = P (ξ < x_{2}) - P (ξ < x_{1}) = Φ (x_{2}) - Φ (x_{1})$

② $N (μ, σ^{2})$ 与 $N (0, 1)$ 的关系：

(i) 若 $ξ \sim N (μ, σ^{2})$ ，则 $η = \frac{ξ - μ}{σ} \sim N (0, 1)$ ，有 $P (ξ < x_{0}) = F (x_{0}) = Φ (\frac{x _{0} - μ}{σ})$ ；

(ii) 若 $ξ \sim N (μ, σ^{2})$ ，则 $P (x_{1} < x < x_{2}) = Φ (\frac{x _{2} - μ}{σ}) - Φ (\frac{x _{1} - μ}{σ})$ 。

⚠️ 考场避坑与做题技巧

利用对称性解题的“黄金法则”

在填空选择题中，若已知 $P (X < a) = p$ ，求 $P (X > 2 μ - a)$ 或类似区间，务必画出草图。利用 $P (X < μ) = 0.5$ 以及关于 $μ$ 对称的等面积特性，可以快速得出结论。

参数是 $σ$ 还是 $σ^{2}$ ？

题目给出 $X \sim N (1, 4)$ 时，意味着 $μ = 1, σ = 2$ 。计算 $3 σ$ 区域时一定要先开方，很多同学会直接用 4 进行计算，导致结果偏差巨大。

“小概率事件”的判定

根据 $3 σ$ 原则，数值落在 $(μ - 3 σ, μ + 3 σ)$ 之外的概率仅为 $0.0027$ 。在质量检测等实际问题中，如果出现此类数值，通常认为发生了异常，即“小概率事件在一次实验中发生了”，从而判定生产过程失控。

Link to original

第 24 章统计

24.00 知识网络

Link to original

24.01回归分析与线性拟合
🟦 回归分析与线性拟合

核心心法

“散点定趋势，系数定强弱，方程定预测”。回归分析的本质是寻找一条“最优”直线，使得所有样本点到该直线的距离平方和最小。通过相关系数 $r$ 判定线性相关的紧密程度，通过决定系数 $R^{2}$ 评估模型的拟合优度，而回归方程 $\overset{y}{^} = b x + a$ 则是实现数据外推预测的数学载体。

一、变量间的相关关系

关系分类：

函数关系：确定性的关系（如 $y = 2 x$ ）。

相关关系：非确定性的关系（如身高与体重）。

散点图与正负相关：

正相关：点群从左下向右上延伸。

负相关：点群从左上向右下延伸。

二、相关系数 $r$ (Correlation Coefficient)

用于衡量两个变量 $x$ 与 $y$ 之间线性相关程度的量： $r = \frac{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ( y _{i} - y ˉ )}{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2} \sum _{i = 1}^{n} ( y _{i} - y ˉ ) ^{2}}$

1. $r$ 的性质

符号判定： $r > 0$ 为正相关， $r < 0$ 为负相关。

程度判定： $∣ r ∣$ 越接近 1，相关性越强； $∣ r ∣$ 越接近 0，相关性越弱。

强相关标准：通常 $∣ r ∣ > 0.75$ 即可认为具有很强的线性相关关系。

三、线性回归方程 $\overset{y}{^} = b x + a$

1. 最小二乘法系数公式

${b = \frac{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ( y _{i} - y ˉ )}{\sum _{i = 1}^{n} ( x _{i} - x ˉ ) ^{2}} = \frac{\sum _{i = 1}^{n} x _{i} y _{i} - n x ˉ y ˉ}{\sum _{i = 1}^{n} x _{i}^{2} - n x ˉ ^{2}} a = \overset{y}{ˉ} - b \overset{x}{ˉ}$

2. 核心性质

样本中心点

回归直线 $\overset{y}{^} = b x + a$ 一定经过样本点的中心 $(\overset{x}{ˉ}, \overset{y}{ˉ})$ 。这是求解截距 $a$ 的关键依据。

四、拟合效果的评估：残差与决定系数 $R^{2}$

残差 (Residual)： $\overset{e}{^}_{i} = y_{i} - \overset{y}{^}_{i}$ 。实际观测值与模型估计值的偏差。

残差平方和 $Q$ ： $\sum (y_{i} - \overset{y}{^}_{i})^{2}$ 。 $Q$ 越小，拟合效果越好。

决定系数 $R^{2}$ (Coefficient of Determination)： $R^{2} = 1 - \frac{\sum _{i = 1}^{n} ( y _{i} - y ^ _{i} ) ^{2}}{\sum _{i = 1}^{n} ( y _{i} - y ˉ ) ^{2}}$

物理意义： $x$ 对 $y$ 变化的贡献率。

判定： $R^{2}$ 越接近 1，模型拟合效果越好。

五、非线性回归的线性化转化

当散点图呈现曲线特征时，通过变量代换将其转化为线性回归：

原非线性方程变量代换方法转化后的线性形式
指数型 $y = c_{1} e^{c_{2} x}$ 两边取对数，令 $z = ln y$ $z = b x + a$ ( $a = ln c_{1}, b = c_{2}$ )
幂函数型 $y = c_{3} x^{2} + c_{4}$ 令 $t = x^{2}$ $y = c_{3} t + c_{4}$

⚠️ 考场避坑与做题技巧

公式选择的“偷懒”法则

如果题目给了一堆散点坐标，先算 $\overset{x}{ˉ}, \overset{y}{ˉ}$ ，用第一组减法公式。

如果题目给出了 $\sum x_{i} y_{i}$ 这种整体和，直接套用第二组乘法公式。

相关性不代表因果性

统计学上的相关关系只能说明两个变量在数值上有同步趋势，并不代表 $x$ 是 $y$ 的原因。在描述结论时，要用“相关”而非“因为”。

$R^{2}$ 与 $r$ 的联系

在简单线性回归中， $R^{2}$ 实际上等于相关系数 $r$ 的平方。所以如果 $∣ r ∣$ 很大， $R^{2}$ 自然也会接近 1。

Link to original

原非线性方程	变量代换方法	转化后的线性形式
指数型 $y = c_{1} e^{c_{2} x}$	两边取对数，令 $z = ln y$	$z = b x + a$ ( $a = ln c_{1}, b = c_{2}$ )
幂函数型 $y = c_{3} x^{2} + c_{4}$	令 $t = x^{2}$	$y = c_{3} t + c_{4}$

24.02 独立性检验与 2X2 列联表
🟦 独立性检验与 $2 \times 2$ 列联表

核心心法

“假设无关，卡方验证，查表定论”。独立性检验的本质是考察观测频数与理论频数的偏离程度。卡方值 $χ^{2}$ 越大，说明观测数据与“无关假设”的偏离越严重，我们就越有信心认为两个分类变量之间存在相关性。

一、核心流程与列联表结构

Step 1. 完善 $2 \times 2$ 列联表

首先将实验数据填入下表，并计算行列合计：

$y_{1}$ $y_{2}$ 总计
$x_{1}$ $a$ $b$ $a + b$
$x_{2}$ $c$ $d$ $c + d$
总计 $a + c$ $b + d$ $n = a + b + c + d$

二、假设与计算

Step 2. 提出零假设 $H_{0}$

假设内容： $H_{0}$ ：变量 $X$ 和 $Y$ 相互独立（或： $X$ 与 $Y$ 无关、无差异）。

Step 3. 计算卡方统计量 $χ^{2}$

利用公式计算偏离程度： $χ^{2} = \frac{n ( a d - b c ) ^{2}}{( a + b ) ( c + d ) ( a + c ) ( b + d )}$

其中 $n$ 为总样本容量。

三、查表与判定结论

Step 4. 查对临界值表 (Critical Values)

根据题目给定的小概率值 $α$ ，找到对应的临界值 $x_{α}$ ：

$α$ 0.10 0.05 0.025 0.010 0.001
$x_{α}$ 2.706 3.841 5.024 6.635 10.828

Step 5. 下结论

若 $χ^{2} > x_{α}$ ：在小概率值 $α$ 的独立性检验下，拒绝 $H_{0}$ 。即认为变量 $X$ 和 $Y$ 有关，且该判断犯错的概率不超过 $α$ 。

若 $χ^{2} \leq x_{α}$ ：没有充分证据证明 $H_{0}$ 不成立，可以认为 $H_{0}$ 成立。即认为变量 $X$ 和 $Y$ 无关。

🚀 深度拓展：卡方公式的结构逻辑

$(a d - b c)$ 的意义：若 $X$ 与 $Y$ 完全独立，则应满足比例相等 $a / b = c / d$ ，即 $a d = b c$ 。因此 $(a d - b c)$ 的差值越大，说明独立性越差，相关性越强。

分母的作用：分母是四个边际合计的乘积，起到了标准化的作用，使不同样本规模下的数据具有可比性。

⚠️ 考场避坑与做题技巧

结论描述的专业性

在书写大题结论时，必须带上前提：“根据小概率值 $α = \dots$ 的独立性检验…”。这体现了统计推断的严谨性，即结论是在概率意义下成立的，而非绝对确定。

计算精确度控制

计算 $χ^{2}$ 时，中间步骤尽量保留分数或多位小数。尤其是分母的四个数相乘通常很大，若提前四舍五入，最终得到的卡方值可能会由于跨过临界值而导致结论完全相反。

独立性不代表因果性

即使 $χ^{2}$ 很大，判定 $X$ 与 $Y$ 有关，也仅说明它们在统计上存在相关性，并不能直接推断出 $X$ 是导致 $Y$ 的根本原因。

Link to original

	$y_{1}$	$y_{2}$	总计
$x_{1}$	$a$	$b$	$a + b$
$x_{2}$	$c$	$d$	$c + d$
总计	$a + c$	$b + d$	$n = a + b + c + d$

$α$	0.10	0.05	0.025	0.010	0.001
$x_{α}$	2.706	3.841	5.024	6.635	10.828

备考逻辑

计数要严谨：排列组合题目务必检查是否“重”或“漏”，优先使用特殊元素/位置优先法。

模型要准确：区分放回抽样（二项分布）与不放回抽样（超几何分布）。

数据要客观：在统计大题中，计算回归方程时务必细心，关注 $\overset{a}{^}$ 和 $\hat{b}$ 的实际含义。

∑ ( Math )

Explorer

📊 概率与统计汇总专题

📊 概率与统计：数据分析与随机模型

🔹 计数原理与排列组合

第 22 章 计数原理

22.00 知识网络

22.01 计数原理、排列与组合

🟦 计数原理、排列与组合专题

一、 计数原理 (Counting Principles)

1. 分类加法计数原理

2. 分步乘法计数原理

二、 排列 (Permutation)

1. 定义与排列数

2. 排列数公式

3. 排列数的性质

三、 组合 (Combination)

1. 定义与组合数

2. 组合数公式

3. 组合数的性质

四、 排列数与组合数的关系

⚠️ 考场避坑与做题技巧

22.02 排列组合 16 种核心解题模型与策略

🟦 排列组合 16 种核心解题模型与策略

1. 特殊元素和特殊位置优先安排

2. 相邻元素捆绑法

3. 不相邻问题插空法

4. 定序问题整除法

5. 重排问题求幂法

6. 圆排列问题

7. 多排问题直排法

8. 排列组合混合问题先选后排

9. 小集团问题先整体后局部

10. 元素相同问题隔板法 (Star and Bars)

11. 正难则反总体淘汰法

12. 不同元素分组分配法

13. 合理分类与分步

14. 错位排列 (Derangement)

15. 分解与合成策略

16. 特殊模型

⚠️ 考场避坑与做题技巧

22.03 二项式定理全总结

🟦 二项式定理全总结 (Binomial Theorem)

一、 二项式定理及通项公式

1. 基本公式

2. 通项公式 (General Term)

3. 特殊形式

二、 二项式系数的性质

三、 赋值法求系数和 (The Assignment Method)

四、 系数最大（小）项的求法

五、 二项式定理的其他应用

⚠️ 考场避坑与做题技巧

🔹 概率初步与古典概型 (第 14，15 章)

第 14 章 统计

14.00 知识网络

14.01随机抽样、平均数与方差

🟦 统计学基础：随机抽样、平均数与方差 (Statistics)

一、 随机抽样 (Random Sampling)

1. 调查方式

2. 基本概念

3. 抽样方法

二、 平均数的计算 (Mean)

三、 方差与标准差 (Variance & Standard Deviation)

1. 基本计算

2. 分层抽样的方差公式

四、 数据的线性变换结论 (Linear Transformation)

⚠️ 考场避坑与做题技巧

14.02 百分位数与四分位数

🟦 百分位数与四分位数 (Percentiles & Quartiles)

一、 第 p 百分位数的概念

二、 计算步骤 (三步走法则)

三、 四分位数的概念 (Quartiles)

⚠️ 考场避坑与做题技巧

14.03 频率分布直方图中的数据计算

🟦 频率分布直方图中的数据计算 (Data Calculation in Histograms)

一、 频率分布直方图的含义

二、 样本平均数的估算

三、 百分位数的计算 (面积分割法)

1. 确定所在组

2. 精确值求解 (线性插值)

第 22 章计数原理

一、计数原理 (Counting Principles)

二、排列 (Permutation)

三、组合 (Combination)

四、排列数与组合数的关系

一、二项式定理及通项公式

二、二项式系数的性质

三、赋值法求系数和 (The Assignment Method)

四、系数最大（小）项的求法

五、二项式定理的其他应用

第 14 章统计

一、随机抽样 (Random Sampling)

二、平均数的计算 (Mean)

三、方差与标准差 (Variance & Standard Deviation)

四、数据的线性变换结论 (Linear Transformation)

一、第 $p$ 百分位数的概念

二、计算步骤 (三步走法则)

三、四分位数的概念 (Quartiles)

一、频率分布直方图的含义

二、样本平均数的估算

三、百分位数的计算 (面积分割法)

四、样本方差的估算

第 15 章概率

2. 古典概型事件 $A$ 的概率计算

一、基本概念 (Basic Concepts)

二、事件的关系、性质及概率计算

三、事件的相互独立性 (Independence)

🔍 证明（以 $A$ 与 $\overline{B}$ 为例）

四、频率与概率

第 22 章概率

一、条件概率 (Conditional Probability)

二、概率的乘法公式 (Multiplication Rules)

3. $n$ 个事件的递推乘法公式

三、条件概率的性质

一、全概率公式与贝叶斯公式

二、递推方法与一维马尔可夫过程

一、离散型随机变量及其分布列

二、离散型随机变量的数字特征

一、两点分布 (Bernoulli Distribution)

二、二项分布 (Binomial Distribution)

1. $n$ 重伯努利试验

三、超几何分布 (Hypergeometric Distribution)

四、深度拓展：类超几何分布 (顺序抽样)