Bài 10. Phương sai và độ lệch chuẩn
Tính phương sai s² và độ lệch chuẩn s để đánh giá mức độ phân tán quanh giá trị trung bình. Ứng dụng so sánh chất lượng, đánh giá sự đồng đều giữa các mẫu thực tế.
Lý thuyết
1. Giá trị đại diện và số trung bình
Với nhóm $[a_i;a_{i+1})$, giá trị đại diện: $x_i=\dfrac{a_i+a_{i+1}}{2}$ (trung điểm).
Số trung bình mẫu:
$$\bar{x}=\frac{\displaystyle\sum_{i=1}^k n_i x_i}{n}=\frac{n_1x_1+n_2x_2+\cdots+n_kx_k}{n}$$
2. Phương sai s²
Phương sai đo mức phân tán quanh $\bar{x}$:
$$s^2=\frac{1}{n}\sum_{i=1}^k n_i(x_i-\bar{x})^2$$
Công thức rút gọn (tính nhanh):
$$s^2=\frac{1}{n}\sum_{i=1}^k n_i x_i^2 - \bar{x}^2$$
| Tính chất | Giá trị |
|---|---|
| $s^2\geq0$ luôn luôn | Phương sai không âm |
| $s^2=0$ | Mọi giá trị bằng nhau (mẫu không phân tán) |
| $s^2$ lớn | Số liệu phân tán nhiều quanh $\bar{x}$ |
| Đơn vị $s^2$ | (đơn vị số liệu)² |
3. Độ lệch chuẩn s và ứng dụng
$$s=\sqrt{s^2}$$
$s$ có cùng đơn vị với số liệu → dễ diễn giải hơn $s^2$.
Ứng dụng thực tế
- So sánh chất lượng: Hai lớp cùng điểm trung bình, lớp nào $s$ nhỏ hơn thì kết quả đồng đều hơn.
- Kiểm soát chất lượng: Sản phẩm có $s$ nhỏ → quy trình sản xuất ổn định.
- Quy tắc 3-sigma: Trong phân phối chuẩn, khoảng $[\bar{x}-3s;\ \bar{x}+3s]$ chứa ~99,7% số liệu.
① Lập cột $x_i$ (giá trị đại diện).
② Lập cột $n_ix_i$ → tính $\bar{x}$.
③ Lập cột $(x_i-\bar{x})^2$.
④ Lập cột $n_i(x_i-\bar{x})^2$ → cộng hết chia $n$.
⑤ $s=\sqrt{s^2}$.
Các dạng bài tập
Dạng 1: Tính trung bình và phương sai
Phương pháp giải:
- Xác định $x_i$ = trung điểm nhóm $i$.
- $\bar{x}=\dfrac{\sum n_ix_i}{n}$.
- $s^2=\dfrac{\sum n_i(x_i-\bar{x})^2}{n}$ hoặc $\dfrac{\sum n_ix_i^2}{n}-\bar{x}^2$.
Ví dụ:
$x_1=5$, $x_2=15$. $n=2$. $\bar{x}=\frac{5+15}{2}=10$.
$s^2=\frac{1(5-10)^2+1(15-10)^2}{2}=\frac{25+25}{2}=25$. $s=5$.
$x_1=2$, $x_2=6$, $x_3=10$. $\bar{x}=\frac{5\cdot2+10\cdot6+5\cdot10}{20}=\frac{10+60+50}{20}=6$.
$\sum n_ix_i^2=5\cdot4+10\cdot36+5\cdot100=20+360+500=880$.
$s^2=\frac{880}{20}-6^2=44-36=8$. $s=\sqrt{8}=2\sqrt{2}\approx2{,}83$.
Dạng 2: Tính s và nhận xét
Phương pháp giải:
- Tính $\bar{x}$ và $s^2$ theo dạng 1.
- $s=\sqrt{s^2}$.
- Nhận xét: $s$ nhỏ → đồng đều; $s$ lớn → phân tán.
Ví dụ:
Hai lớp cùng điểm TB $=7$. Lớp A có $s=0{,}5<2=s_B$ → kết quả lớp A đồng đều hơn. Lớp B phân tán hơn.
Dạng 3: So sánh phân tán
Phương pháp giải:
- Tính $s^2$ hoặc $s$ cho từng mẫu.
- Mẫu nào $s$ nhỏ hơn → ổn định hơn / đồng đều hơn.
- Kết luận gắn với ngữ cảnh bài toán.
Ví dụ:
$s_I=0{,}7