🟡 Trung bình 90 phút

Bài 9. Các số đặc trưng đo xu thế trung tâm

Nâng cao khả năng phân tích dữ liệu thông qua các chỉ số: Trung bình, Trung vị, Tứ phân vị và Mốt đối với các mẫu dữ liệu đã được ghép nhóm.

Chương: Chương 3: Các số đặc trưng đo xu thế trung tâm của mẫu số liệu ghép nhóm

Lý thuyết số đặc trưng mẫu ghép nhóm

1. Số trung bình cộng

Số trung bình cộng của mẫu số liệu ghép nhóm được tính bằng tổng các tích của giá trị đại diện với tần số tương ứng, sau đó chia cho tổng số quan sát:

$$\bar{x} = \dfrac{n_1x_1 + n_2x_2 + \dots + n_kx_k}{n}$$

  • $n_i$: Tần số nhóm $i$.
  • $x_i$: Giá trị đại diện nhóm $i$.
  • $n$: Tổng số quan sát ($n = n_1 + n_2 + \dots + n_k$).

2. Trung vị và Tứ phân vị

Trung vị ($M_e$): Giá trị chia mẫu số liệu thành hai phần bằng nhau.

Công thức: $M_e = L + \left(\dfrac{\frac{n}{2} - cf_{m-1}}{n_m}\right) \cdot h$

  • $L$: Mút trái nhóm chứa trung vị.
  • $cf_{m-1}$: Tần số tích lũy của nhóm trước đó.
  • $n_m$: Tần số nhóm chứa trung vị.
  • $h$: Độ dài nhóm.

Tứ phân vị ($Q_1, Q_2, Q_3$): Tương tự trung vị nhưng chia làm 4 phần ($n/4$ cho $Q_1$, $3n/4$ cho $Q_3$). $Q_2 \equiv M_e$.

3. Mốt (Mode)

Mốt ($M_o$) là giá trị có khả năng xuất hiện cao nhất. Trong mẫu ghép nhóm, ta xác định nhóm có tần số lớn nhất.

Công thức: $M_o = L + \left(\dfrac{d_1}{d_1 + d_2}\right) \cdot h$

  • $d_1 = n_i - n_{i-1}$ (Hiệu tần số với nhóm trước).
  • $d_2 = n_i - n_{i+1}$ (Hiệu tần số với nhóm sau).

Các dạng bài tập

Dạng 1: Tính số trung bình cộng

Phương pháp giải:

Bước 1: Tính giá trị đại diện $x_i$ cho mỗi nhóm.
Bước 2: Nhân $n_i \cdot x_i$.
Bước 3: Tính tổng và chia cho $N$.

Ví dụ:

Cho bảng: $[0; 10)$ tần số 2; $[10; 20)$ tần số 8. Tính $\bar{x}$.
$x_1 = 5, x_2 = 15$. $\bar{x} = (2 \cdot 5 + 8 \cdot 15) / 10 = 130/10 = 13$.
Tìm trung bình cộng của: $[20, 30)$ n=10; $[30, 40)$ n=10.
Giá trị đại diện lần lượt là $25$ và $35$. Do tần số bằng nhau nên trung bình là $30$.
Dùng giá trị trung bình để so sánh hai lớp học có bảng tần số khác nhau.
Tính $\bar{x}_A$ và $\bar{x}_B$. Lớp nào có trung bình lớn hơn thì kết quả cao hơn.

Dạng 2: Tìm trung vị và tứ phân vị

Phương pháp giải:

Xác định vị trí $n/2$ rơi vào nhóm nào dựa trên cột tần số tích lũy $cf$.

Ví dụ:

Cho $n=40$. Tần số tích lũy: Nhóm 1 (5), Nhóm 2 (25). Tìm nhóm chứa trung vị.
$n/2 = 20$. Vì $5 < 20 \le 25$ nên trung vị nằm ở nhóm 2.
Tính cụ thể $M_e$ nếu nhóm chứa tr.vị là $[10, 20), n_2=20, cf_1=5, n=40$.
$M_e = 10 + [(20 - 5)/20] \cdot 10 = 10 + 7,5 = 17,5$.
Tìm $Q_1$ biết $n=100$.
Xác định nhóm chứa vị trí thứ $100/4 = 25$ rồi dùng công thức tương tự trung vị.

Dạng 3: Tìm mốt của mẫu số liệu

Phương pháp giải:

Tìm $n_i$ lớn nhất làm nhóm gốc, sau đó áp dụng hiệu tần số lân cận.

Ví dụ:

Bảng tần số: $[0, 4)$ n=2; $[4, 8)$ n=10; $[8, 12)$ n=3. Tìm nhóm chứa mốt.
Tần số lớn nhất là $10$, vậy nhóm chứa mốt là $[4; 8)$.
Tính $M_o$ cho ví dụ trên.
$d_1 = 10-2=8, d_2 = 10-3=7. M_o = 4 + [8/(8+7)] \cdot 4 = 4 + 32/15 \approx 6,13$.
Một mẫu có thể có 2 mốt không?
Có, nếu có 2 nhóm cùng đạt tần số cực đại bằng nhau.

Bài tập (25)

Làm bài tập ngay

Các bài học trong chương: Chương 3: Các số đặc trưng đo xu thế trung tâm của mẫu số liệu ghép nhóm