🟦 统计学基础:随机抽样、平均数与方差 (Statistics)

核心心法

“样本推断总体,分层化繁为简”。统计学的核心是通过科学的抽样方法(如简单随机抽样、分层随机抽样)获取具有代表性的样本,并利用平均数(集中趋势)和方差(离散程度)来定量描述总体的特征。


一、 随机抽样 (Random Sampling)

1. 调查方式

  • (1) 全面调查:对调查对象全体逐一调查(如人口普查)。
  • (2) 抽样调查:从总体中抽取部分个体调查,以此推断总体情况。核心是样本需具有代表性

2. 基本概念

  • 总体:调查对象的全体。
  • 个体:组成总体的每一个调查对象。
  • 样本:从总体中抽取的部分个体。
  • 样本容量:样本中包含的个体数量。

3. 抽样方法

  • 简单随机抽样
    • 放回式:每次抽取后放回,个体概率始终相等。
    • 不放回式(常用):每次抽取后不放回,个体概率始终相等。
  • 分层随机抽样
    • 按变量将总体划分为互不重叠的,各层独立抽样。
    • 比例分配:每层的样本量与该层的大小成比例。

二、 平均数的计算 (Mean)

  • 普通平均数
  • 加权平均数 为频率)
  • 分层抽样的总平均数 ()
    • 两层
    • 三层

三、 方差与标准差 (Variance & Standard Deviation)

1. 基本计算

  • 普通方差
  • 加权方差
  • 标准差。刻画数据的离散程度, 越大波动越大

2. 分层抽样的方差公式

若两层样本分别为 ,总平均数为

🔍 证明简述: 利用方差定义式展开,通过添加项 进行平移,利用 的性质简化交叉项,最终合并为各层方差与各层均值偏离度的加权和。

  • 三层情况

四、 数据的线性变换结论 (Linear Transformation)

若新数据 ,原数据特征为 ,则新特征如下:

统计量变换公式备注
平均数 同步平移伸缩
方差与常数 无关
百分位数保持顺序关系
众数对应位置平移
极差$R_y =a

⚠️ 考场避坑与做题技巧

分层方差的物理意义

分层方差公式由两部分组成:层内方差)和层间方差)。如果各层均值差异很大,即使各层内部很稳定,总方差也会非常大。

方差计算的捷径

在手动计算方差时,优先使用公式 (平方的平均减去平均的平方),这通常比直接用差值平方和计算量更小。

抽样概率的公平性

无论是不放回抽样还是分层抽样,在没有任何附加信息的情况下,总体中每个个体被抽到的概率都是 。这是判断抽样方法是否科学的核心标准。