🟦 独立性检验与 列联表
核心心法
“假设无关,卡方验证,查表定论”。独立性检验的本质是考察观测频数与理论频数的偏离程度。卡方值 越大,说明观测数据与“无关假设”的偏离越严重,我们就越有信心认为两个分类变量之间存在相关性。
一、 核心流程与列联表结构
Step 1. 完善 列联表
首先将实验数据填入下表,并计算行列合计:
| 总计 | |||
|---|---|---|---|
| 总计 |
二、 假设与计算
Step 2. 提出零假设
- 假设内容::变量 和 相互独立(或: 与 无关、无差异)。
Step 3. 计算卡方统计量
利用公式计算偏离程度:
- 其中 为总样本容量。
三、 查表与判定结论
Step 4. 查对临界值表 (Critical Values)
根据题目给定的小概率值 ,找到对应的临界值 :
| 0.10 | 0.05 | 0.025 | 0.010 | 0.001 | |
|---|---|---|---|---|---|
| 2.706 | 3.841 | 5.024 | 6.635 | 10.828 |
Step 5. 下结论
- 若 : 在小概率值 的独立性检验下,拒绝 。即认为变量 和 有关,且该判断犯错的概率不超过 。
- 若 : 没有充分证据证明 不成立,可以认为 成立。即认为变量 和 无关。
🚀 深度拓展:卡方公式的结构逻辑
- 的意义: 若 与 完全独立,则应满足比例相等 ,即 。因此 的差值越大,说明独立性越差,相关性越强。
- 分母的作用: 分母是四个边际合计的乘积,起到了标准化的作用,使不同样本规模下的数据具有可比性。
⚠️ 考场避坑与做题技巧
结论描述的专业性
在书写大题结论时,必须带上前提:“根据小概率值 的独立性检验…”。这体现了统计推断的严谨性,即结论是在概率意义下成立的,而非绝对确定。
计算精确度控制
计算 时,中间步骤尽量保留分数或多位小数。尤其是分母的四个数相乘通常很大,若提前四舍五入,最终得到的卡方值可能会由于跨过临界值而导致结论完全相反。
独立性不代表因果性
即使 很大,判定 与 有关,也仅说明它们在统计上存在相关性,并不能直接推断出 是导致 的根本原因。