🟦 独立性检验与 列联表

核心心法

“假设无关,卡方验证,查表定论”。独立性检验的本质是考察观测频数与理论频数的偏离程度。卡方值 越大,说明观测数据与“无关假设”的偏离越严重,我们就越有信心认为两个分类变量之间存在相关性。


一、 核心流程与列联表结构

Step 1. 完善 列联表

首先将实验数据填入下表,并计算行列合计:

总计
总计

二、 假设与计算

Step 2. 提出零假设

  • 假设内容:变量 相互独立(或: 无关、无差异)。

Step 3. 计算卡方统计量

利用公式计算偏离程度:

  • 其中 为总样本容量。

三、 查表与判定结论

Step 4. 查对临界值表 (Critical Values)

根据题目给定的小概率值 ,找到对应的临界值

0.100.050.0250.0100.001
2.7063.8415.0246.63510.828

Step 5. 下结论

  1. : 在小概率值 的独立性检验下,拒绝 。即认为变量 有关,且该判断犯错的概率不超过
  2. : 没有充分证据证明 不成立,可以认为 成立。即认为变量 无关

🚀 深度拓展:卡方公式的结构逻辑

  • 的意义: 若 完全独立,则应满足比例相等 ,即 。因此 的差值越大,说明独立性越差,相关性越强。
  • 分母的作用: 分母是四个边际合计的乘积,起到了标准化的作用,使不同样本规模下的数据具有可比性。

⚠️ 考场避坑与做题技巧

结论描述的专业性

在书写大题结论时,必须带上前提:“根据小概率值 的独立性检验…”。这体现了统计推断的严谨性,即结论是在概率意义下成立的,而非绝对确定。

计算精确度控制

计算 时,中间步骤尽量保留分数或多位小数。尤其是分母的四个数相乘通常很大,若提前四舍五入,最终得到的卡方值可能会由于跨过临界值而导致结论完全相反。

独立性不代表因果性

即使 很大,判定 有关,也仅说明它们在统计上存在相关性,并不能直接推断出 是导致 的根本原因。