🟡 Trung bình 90 phút

Bài 9. Khoảng biến thiên và khoảng tứ phân vị

Tính khoảng biến thiên R và khoảng tứ phân vị ΔQ để đánh giá mức độ phân tán của mẫu số liệu ghép nhóm. So sánh ý nghĩa của hai đại lượng và ứng dụng vào bài toán thực tế.

Chương: Chương 3: Các số đặc trưng đo mức độ phân tán của mẫu số liệu ghép nhóm

Lý thuyết

1. Khoảng biến thiên R

Khoảng biến thiên của mẫu ghép nhóm $[a_1;a_2),\ [a_2;a_3),\ \ldots,\ [a_k;a_{k+1})$ là:

$$R = a_{k+1} - a_1$$

$R$ càng lớn → mẫu càng phân tán. $R$ chỉ phụ thuộc đầu mút hai đầu, không phản ánh phân tán bên trong. Nhược điểm: rất nhạy với giá trị ngoại lai.

💡 Chú ý 1: Với mẫu ghép nhóm, $R$ chỉ cần đọc bảng là tính được ngay (đầu mút phải cuối – đầu mút trái đầu). Không cần tính toán gì thêm.

2. Tứ phân vị Q₁, Q₂, Q₃ và khoảng tứ phân vị ΔQ

Tứ phân vị chia mẫu thành 4 phần bằng nhau:

  • $Q_1$: tứ phân vị thứ nhất – 25% số liệu dưới $Q_1$.
  • $Q_2$: trung vị – 50% số liệu dưới $Q_2$.
  • $Q_3$: tứ phân vị thứ ba – 75% số liệu dưới $Q_3$.

Khoảng tứ phân vị: $\Delta_Q = Q_3 - Q_1$.

$\Delta_Q$ đo mức phân tán của 50% số liệu ở giữa, ít nhạy với giá trị ngoại lai.

📝 Chú ý 2 – So sánh R và ΔQ:
R: đo toàn bộ độ trải dữ liệu, nhạy với ngoại lai.
ΔQ: đo phần trung tâm (50%), bền vững với ngoại lai.
→ Khi số liệu có ngoại lai hoặc phân phối lệch, ưu tiên dùng $\Delta_Q$.

3. Công thức nội suy tính Q₁ và Q₃

Với mẫu ghép nhóm cỡ $n$:

Đại lượngVị trí cần đạtCông thức nội suy
$Q_1$$\dfrac{n}{4}$$Q_1 = a_p + \dfrac{\frac{n}{4} - F_{p-1}}{n_p}\cdot h_p$
$Q_2$ (trung vị)$\dfrac{n}{2}$$Q_2 = a_m + \dfrac{\frac{n}{2} - F_{m-1}}{n_m}\cdot h_m$
$Q_3$$\dfrac{3n}{4}$$Q_3 = a_q + \dfrac{\frac{3n}{4} - F_{q-1}}{n_q}\cdot h_q$

Trong đó: $F_{p-1}$ = tần số tích lũy trước nhóm chứa $Q$; $n_p$ = tần số nhóm chứa $Q$; $h_p$ = độ dài nhóm.

⚠️ Chú ý 3 – Cách xác định nhóm chứa Q₁: Tính tần số tích lũy cộng dồn. Nhóm chứa $Q_1$ là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng $\dfrac{n}{4}$.

Các dạng bài tập

Dạng 1: Tính khoảng biến thiên

Phương pháp giải:

  1. Xác định nhóm đầu: đầu mút trái $a_1$.
  2. Xác định nhóm cuối: đầu mút phải $a_{k+1}$.
  3. $R = a_{k+1} - a_1$.

Ví dụ:

Ví dụ: Bảng tần số thời gian tự học (giờ): $[0;2)$: 5 HS; $[2;4)$: 10 HS; $[4;6)$: 8 HS. Tính $R$.

Đầu mút trái nhóm đầu: $a_1=0$. Đầu mút phải nhóm cuối: $a_{k+1}=6$.

$R=6-0=\mathbf{6}$ (giờ).

Dạng 2: Tính tứ phân vị và khoảng tứ phân vị

Phương pháp giải:

  1. Tính tần số tích lũy $F_i$.
  2. Tìm nhóm chứa $Q_1$ (nhóm đầu có $F\geq n/4$) và nhóm chứa $Q_3$ ($F\geq 3n/4$).
  3. Nội suy theo công thức.
  4. $\Delta_Q = Q_3 - Q_1$.

Ví dụ:

Ví dụ: Bảng điểm: $[40;50)$ f=2; $[50;60)$ f=8; $[60;70)$ f=15; $[70;80)$ f=10; $[80;90)$ f=5. $n=40$. Tính $Q_1, Q_3, \Delta_Q$.

Tần số tích lũy: 2, 10, 25, 35, 40.

Q₁: vị trí $n/4=10$. Nhóm chứa $Q_1$: $[50;60)$ (F tích lũy đạt 10 tại đây). $F_{p-1}=2$, $n_p=8$, $h=10$.

$Q_1=50+\dfrac{10-2}{8}\cdot10=50+10=60$.

Q₃: vị trí $3n/4=30$. $F$ tích lũy: 25<30≤35 → nhóm $[70;80)$. $F_{q-1}=25$, $n_q=10$, $h=10$.

$Q_3=70+\dfrac{30-25}{10}\cdot10=70+5=75$.

$\Delta_Q=75-60=\mathbf{15}$ điểm.

Dạng 3: So sánh mức độ phân tán

Phương pháp giải:

  1. Tính $R$ và $\Delta_Q$ cho từng mẫu.
  2. Mẫu có $R$ lớn hơn → phân tán toàn bộ nhiều hơn.
  3. Mẫu có $\Delta_Q$ lớn hơn → phần trung tâm phân tán nhiều hơn.
  4. Nếu kết quả mâu thuẫn → mẫu có ngoại lai → ưu tiên $\Delta_Q$.

Ví dụ:

Ví dụ: Mẫu A: $R=20$, $\Delta_Q=5$. Mẫu B: $R=15$, $\Delta_Q=12$. Nhận xét?

Mẫu A: $R$ lớn hơn (tổng thể trải rộng hơn) nhưng $\Delta_Q$ nhỏ (phần trung tâm tập trung hơn). Có thể mẫu A có ngoại lai.

Mẫu B: $\Delta_Q$ lớn hơn → dữ liệu trung tâm phân tán hơn.

→ Kết luận phụ thuộc mục tiêu phân tích.

Bài tập (25)

Làm bài tập ngay

Các bài học trong chương: Chương 3: Các số đặc trưng đo mức độ phân tán của mẫu số liệu ghép nhóm