Bài 19. Công thức xác suất toàn phần và Bayes
Nắm vững hai công thức quan trọng nhất của lý thuyết xác suất hiện đại: Xác suất toàn phần để tính xác suất hệ quả và công thức Bayes để cập nhật niềm tin dựa trên bằng chứng.
Lý thuyết xác suất toàn phần và Bayes
1. Công thức xác suất toàn phần
Cho biến cố $B$ và một nhóm các biến cố $A_1, A_2, \dots, A_n$ lập thành một hệ đầy đủ (nghĩa là chúng rời nhau và tổng các kết quả bằng không gian mẫu $\Omega$).
Sơ đồ thực hiện: Chia vấn đề cần tính xác suất ($B$) thành các trường hợp nhỏ ($A_i$). Tích lũy xác suất từ tất cả các kịch bản có thể xảy ra.
2. Công thức Bayes
Hầu hết các bài toán thực tế yêu cầu tính xác suất của nguyên nhân khi đã biết kết quả (xác suất ngược). Đây là nội dung của công thức Bayes:
Ý nghĩa: $P(A_i)$ là xác suất tiền nghiệm (trước khi có dữ liệu $B$), $P(A_i|B)$ là xác suất hậu nghiệm (sau khi quan sát thấy $B$).
3. Quy trình giải bài toán
- Xác định hệ đầy đủ (các nguyên nhân/nhóm đối tượng): $A_1, A_2, \dots$.
- Xác định biến cố mục tiêu (kết quả quan sát): $B$.
- Liệt kê các xác suất đã cho ($P(A_i)$ và $P(B|A_i)$).
- Áp dụng công thức toàn phần để tìm mẫu số $P(B)$, sau đó dùng Bayes để tìm xác suất hậu nghiệm yêu cầu.
Các dạng bài tập
Dạng 1: Sử dụng công thức xác suất toàn phần
Phương pháp giải:
Dùng để tính xác suất của một sự kiện xảy ra qua nhiều kịch bản khác nhau.
Ví dụ:
$A_1, A_2$: Sp do máy 1, máy 2. $L$: Sp bị lỗi.
$P(L) = P(A_1)P(L|A_1) + P(A_2)P(L|A_2) = 0.6 \cdot 0.02 + 0.4 \cdot 0.03 = 0.012 + 0.012 = 0.024$.
$P(M) = 0.5 \cdot 0.1 + 0.3 \cdot 0.2 + 0.2 \cdot 0.4 = 0.05 + 0.06 + 0.08 = 0.19$.
$D_1$: Lần 1 lấy đen (4/6), $T_1$: Lần 1 trắng (2/6).
$P(D_2) = P(D_1)P(D_2|D_1) + P(T_1)P(D_2|T_1) = \dfrac{4}{6} \cdot \dfrac{4}{9} + \dfrac{2}{6} \cdot \dfrac{3}{9} = \dfrac{16 + 6}{54} = \dfrac{11}{27}$.
Dạng 2: Sử dụng công thức Bayes
Phương pháp giải:
Dùng để tính ngược lại xác suất của nguyên nhân khi biết kết quả đã xảy ra.
Ví dụ:
$P(A_1|L) = \dfrac{P(A_1)P(L|A_1)}{P(L)} = \dfrac{0.012}{0.024} = 0.5$.
$P(K) = 0.7 \cdot 0.01 + 0.3 \cdot 0.05 = 0.007 + 0.015 = 0.022$.
$P(Y|K) = \dfrac{0.3 \cdot 0.05}{0.022} = \dfrac{0.015}{0.022} \approx 0.6818$.
$P(T) = (0.4 + 0.5 + 0.7)/3 = 1.6/3 \approx 0.533$.
$P(S_3|T) = \dfrac{(1/3) \cdot 0.7}{1.6/3} = \dfrac{0.7}{1.6} = 0.4375$.
Dạng 3: Ứng dụng trong y tế, kinh tế và kiểm định
Phương pháp giải:
Phân tích bài toán thông qua các chỉ số như Độ nhạy (Sensitivity) và Độ đặc hiệu (Specificity).
Ví dụ:
$P(+) = 0.005 \cdot 0.99 + 0.995 \cdot (1 - 0.95) = 0.00495 + 0.04975 = 0.0547$.
$P(B|+) = \dfrac{0.00495}{0.0547} \approx 0.0905$. (Mặc dù xét nghiệm có độ chính xác cao nhưng do bệnh hiếm nên xác suất thật sự mắc vẫn thấp).
$P(VN) = 0.75 \cdot 0.01 + 0.25 \cdot 0.2 = 0.0075 + 0.05 = 0.0575$.
$P(Tốt|VN) = 0.0075 / 0.0575 \approx 0.1304$.
$P(Chuẩn) = 0.3 \cdot 0.9 + 0.7 \cdot 0.8 = 0.27 + 0.56 = 0.83$.
$P(B|Chuẩn) = 0.56 / 0.83 \approx 0.6747$.