🟦 统计学基础:随机抽样、平均数与方差 (Statistics)
核心心法
“样本推断总体,分层化繁为简”。统计学的核心是通过科学的抽样方法(如简单随机抽样、分层随机抽样)获取具有代表性的样本,并利用平均数(集中趋势)和方差(离散程度)来定量描述总体的特征。
一、 随机抽样 (Random Sampling)
1. 调查方式
- (1) 全面调查:对调查对象全体逐一调查(如人口普查)。
- (2) 抽样调查:从总体中抽取部分个体调查,以此推断总体情况。核心是样本需具有代表性。
2. 基本概念
- 总体:调查对象的全体。
- 个体:组成总体的每一个调查对象。
- 样本:从总体中抽取的部分个体。
- 样本容量:样本中包含的个体数量。
3. 抽样方法
- 简单随机抽样:
- 放回式:每次抽取后放回,个体概率始终相等。
- 不放回式(常用):每次抽取后不放回,个体概率始终相等。
- 分层随机抽样:
- 按变量将总体划分为互不重叠的层,各层独立抽样。
- 比例分配:每层的样本量与该层的大小成比例。
二、 平均数的计算 (Mean)
- 普通平均数:
- 加权平均数: ( 为频率)
- 分层抽样的总平均数 ():
- 两层:
- 三层:
三、 方差与标准差 (Variance & Standard Deviation)
1. 基本计算
- 普通方差:
- 加权方差:
- 标准差:。刻画数据的离散程度, 越大波动越大。
2. 分层抽样的方差公式
若两层样本分别为 和 ,总平均数为 :
🔍 证明简述: 利用方差定义式展开,通过添加项 进行平移,利用 的性质简化交叉项,最终合并为各层方差与各层均值偏离度的加权和。
- 三层情况:
四、 数据的线性变换结论 (Linear Transformation)
若新数据 ,原数据特征为 ,则新特征如下:
| 统计量 | 变换公式 | 备注 |
|---|---|---|
| 平均数 | 随 同步平移伸缩 | |
| 方差 | 与常数 无关 | |
| 百分位数 | 保持顺序关系 | |
| 众数 | 对应位置平移 | |
| 极差 | $R_y = | a |
⚠️ 考场避坑与做题技巧
分层方差的物理意义
分层方差公式由两部分组成:层内方差()和层间方差()。如果各层均值差异很大,即使各层内部很稳定,总方差也会非常大。
方差计算的捷径
在手动计算方差时,优先使用公式 (平方的平均减去平均的平方),这通常比直接用差值平方和计算量更小。
抽样概率的公平性
无论是不放回抽样还是分层抽样,在没有任何附加信息的情况下,总体中每个个体被抽到的概率都是 。这是判断抽样方法是否科学的核心标准。