Bài 19. Công thức xác suất toàn phần và Bayes
Nắm vững hai công thức quan trọng nhất của lý thuyết xác suất hiện đại: Xác suất toàn phần để tính xác suất hệ quả và công thức Bayes để cập nhật niềm tin dựa trên bằng chứng.
Lý thuyết xác suất toàn phần và Bayes
1 1. Công thức xác suất toàn phần
Cho biến cố $B$ và một nhóm các biến cố $A_1, A_2, \dots, A_n$ lập thành một hệ đầy đủ (nghĩa là chúng rời nhau và tổng các kết quả bằng không gian mẫu $\Omega$).
Sơ đồ thực hiện: Chia vấn đề cần tính xác suất ($B$) thành các trường hợp nhỏ ($A_i$). Tích lũy xác suất từ tất cả các kịch bản có thể xảy ra.
2 2. Công thức Bayes
Hầu hết các bài toán thực tế yêu cầu tính xác suất của nguyên nhân khi đã biết kết quả (xác suất ngược). Đây là nội dung của công thức Bayes:
Ý nghĩa: $P(A_i)$ là xác suất tiền nghiệm (trước khi có dữ liệu $B$), $P(A_i|B)$ là xác suất hậu nghiệm (sau khi quan sát thấy $B$).
3 3. Quy trình giải bài toán
- Xác định hệ đầy đủ (các nguyên nhân/nhóm đối tượng): $A_1, A_2, \dots$.
- Xác định biến cố mục tiêu (kết quả quan sát): $B$.
- Liệt kê các xác suất đã cho ($P(A_i)$ và $P(B|A_i)$).
- Áp dụng công thức toàn phần để tìm mẫu số $P(B)$, sau đó dùng Bayes để tìm xác suất hậu nghiệm yêu cầu.
Các dạng bài tập
1 Sử dụng công thức xác suất toàn phần
Dùng để tính xác suất của một sự kiện xảy ra qua nhiều kịch bản khác nhau.
Ví dụ minh họa
$A_1, A_2$: Sp do máy 1, máy 2. $L$: Sp bị lỗi.
$P(L) = P(A_1)P(L|A_1) + P(A_2)P(L|A_2) = 0.6 \cdot 0.02 + 0.4 \cdot 0.03 = 0.012 + 0.012 = 0.024$.
$P(M) = 0.5 \cdot 0.1 + 0.3 \cdot 0.2 + 0.2 \cdot 0.4 = 0.05 + 0.06 + 0.08 = 0.19$.
$D_1$: Lần 1 lấy đen (4/6), $T_1$: Lần 1 trắng (2/6).
$P(D_2) = P(D_1)P(D_2|D_1) + P(T_1)P(D_2|T_1) = \dfrac{4}{6} \cdot \dfrac{4}{9} + \dfrac{2}{6} \cdot \dfrac{3}{9} = \dfrac{16 + 6}{54} = \dfrac{11}{27}$.
2 Sử dụng công thức Bayes
Dùng để tính ngược lại xác suất của nguyên nhân khi biết kết quả đã xảy ra.
Ví dụ minh họa
$P(A_1|L) = \dfrac{P(A_1)P(L|A_1)}{P(L)} = \dfrac{0.012}{0.024} = 0.5$.
$P(K) = 0.7 \cdot 0.01 + 0.3 \cdot 0.05 = 0.007 + 0.015 = 0.022$.
$P(Y|K) = \dfrac{0.3 \cdot 0.05}{0.022} = \dfrac{0.015}{0.022} \approx 0.6818$.
$P(T) = (0.4 + 0.5 + 0.7)/3 = 1.6/3 \approx 0.533$.
$P(S_3|T) = \dfrac{(1/3) \cdot 0.7}{1.6/3} = \dfrac{0.7}{1.6} = 0.4375$.
3 Ứng dụng trong y tế, kinh tế và kiểm định
Phân tích bài toán thông qua các chỉ số như Độ nhạy (Sensitivity) và Độ đặc hiệu (Specificity).
Ví dụ minh họa
$P(+) = 0.005 \cdot 0.99 + 0.995 \cdot (1 - 0.95) = 0.00495 + 0.04975 = 0.0547$.
$P(B|+) = \dfrac{0.00495}{0.0547} \approx 0.0905$. (Mặc dù xét nghiệm có độ chính xác cao nhưng do bệnh hiếm nên xác suất thật sự mắc vẫn thấp).
$P(VN) = 0.75 \cdot 0.01 + 0.25 \cdot 0.2 = 0.0075 + 0.05 = 0.0575$.
$P(Tốt|VN) = 0.0075 / 0.0575 \approx 0.1304$.
$P(Chuẩn) = 0.3 \cdot 0.9 + 0.7 \cdot 0.8 = 0.27 + 0.56 = 0.83$.
$P(B|Chuẩn) = 0.56 / 0.83 \approx 0.6747$.
Sẵn sàng thử thách bản thân?
Hoàn thành 25 câu hỏi để củng cố kiến thức và kiểm tra mức độ hiểu bài
Làm bài tập ngay