方差与标准差的定义及关系
- 方差(Variance)
- 定义:衡量一组数据离散程度的统计量,反映数据与均值的偏离程度。
- 计算公式:
- 总体方差(数据为总体全部元素):\(\sigma^2 = \frac{\sum_{i=1}^n (x_i – \mu)^2}{n}\) 其中\(\mu\)为总体均值,n为数据个数。
- 样本方差(数据为总体抽样样本):\(s^2 = \frac{\sum_{i=1}^n (x_i – \bar{x})^2}{n-1}\) 其中\(\bar{x}\)为样本均值,\(n-1\)为自由度(避免样本方差低估总体方差)。
- 标准差(Standard Deviation)
- 定义:方差的算术平方根,与原始数据单位一致,更直观反映数据离散程度。
- 计算公式:
- 总体标准差:\(\sigma = \sqrt{\frac{\sum_{i=1}^n (x_i – \mu)^2}{n}}\)
- 样本标准差:\(s = \sqrt{\frac{\sum_{i=1}^n (x_i – \bar{x})^2}{n-1}}\)
- 核心性质
- 方差和标准差均非负,值越大,数据离散程度越高(越分散);值为 0 时,所有数据相等。
- 标准差与数据单位相同(如数据为长度 “厘米”,标准差也为 “厘米”),方差单位为数据单位的平方(如 “平方厘米”),因此标准差更便于实际解释。
示例:数据\(1, 3, 5\),均值\(\bar{x}=3\),
- 方差:\(\frac{(1-3)^2 + (3-3)^2 + (5-3)^2}{3} = \frac{8}{3}\),
- 标准差:\(\sqrt{\frac{8}{3}} \approx 1.63\),反映数据围绕均值3的波动幅度。