🔴 Khó 90 phút

Bài 19. Công thức xác suất toàn phần và Bayes

Nắm vững hai công thức quan trọng nhất của lý thuyết xác suất hiện đại: Xác suất toàn phần để tính xác suất hệ quả và công thức Bayes để cập nhật niềm tin dựa trên bằng chứng.

Chương: Chương 6: Xác suất có điều kiện và công thức Bayes

Lý thuyết xác suất toàn phần và Bayes

1. Công thức xác suất toàn phần

Cho biến cố $B$ và một nhóm các biến cố $A_1, A_2, \dots, A_n$ lập thành một hệ đầy đủ (nghĩa là chúng rời nhau và tổng các kết quả bằng không gian mẫu $\Omega$).

Công thức: $$P(B) = \sum_{i=1}^n P(A_i) \cdot P(B|A_i)$$

Sơ đồ thực hiện: Chia vấn đề cần tính xác suất ($B$) thành các trường hợp nhỏ ($A_i$). Tích lũy xác suất từ tất cả các kịch bản có thể xảy ra.

2. Công thức Bayes

Hầu hết các bài toán thực tế yêu cầu tính xác suất của nguyên nhân khi đã biết kết quả (xác suất ngược). Đây là nội dung của công thức Bayes:

Công thức Bayes: $$P(A_i|B) = \dfrac{P(A_i) \cdot P(B|A_i)}{P(B)}$$ (Trong đó $P(B)$ được tính bằng công thức xác suất toàn phần).

Ý nghĩa: $P(A_i)$ là xác suất tiền nghiệm (trước khi có dữ liệu $B$), $P(A_i|B)$ là xác suất hậu nghiệm (sau khi quan sát thấy $B$).

3. Quy trình giải bài toán

  1. Xác định hệ đầy đủ (các nguyên nhân/nhóm đối tượng): $A_1, A_2, \dots$.
  2. Xác định biến cố mục tiêu (kết quả quan sát): $B$.
  3. Liệt kê các xác suất đã cho ($P(A_i)$ và $P(B|A_i)$).
  4. Áp dụng công thức toàn phần để tìm mẫu số $P(B)$, sau đó dùng Bayes để tìm xác suất hậu nghiệm yêu cầu.

Các dạng bài tập

Dạng 1: Sử dụng công thức xác suất toàn phần

Phương pháp giải:

Dùng để tính xác suất của một sự kiện xảy ra qua nhiều kịch bản khác nhau.

Ví dụ:

Dây chuyền sản xuất có 2 máy: Máy 1 sản xuất 60% sản phẩm, tỉ lệ lỗi 2%. Máy 2 sản xuất 40%, lỗi 3%. Lấy ngẫu nhiên 1 sản phẩm, tính xác suất sản phẩm đó bị lỗi.

$A_1, A_2$: Sp do máy 1, máy 2. $L$: Sp bị lỗi.

$P(L) = P(A_1)P(L|A_1) + P(A_2)P(L|A_2) = 0.6 \cdot 0.02 + 0.4 \cdot 0.03 = 0.012 + 0.012 = 0.024$.

Một người đi làm có 3 con đường: Đường A (xác suất chọn 0.5, xác suất muộn 0.1), Đường B (chọn 0.3, muộn 0.2), Đường C (chọn 0.2, muộn 0.4). Tính xác suất người đó đi làm muộn.

$P(M) = 0.5 \cdot 0.1 + 0.3 \cdot 0.2 + 0.2 \cdot 0.4 = 0.05 + 0.06 + 0.08 = 0.19$.

Hộp 1 có 4 đen, 2 trắng. Hộp 2 có 3 đen, 5 trắng. Lấy ngẫu nhiên 1 bi từ hộp 1 sang hộp 2, rồi lấy 1 bi từ hộp 2. Tính xác suất bi lấy từ hộp 2 là màu đen.

$D_1$: Lần 1 lấy đen (4/6), $T_1$: Lần 1 trắng (2/6).

$P(D_2) = P(D_1)P(D_2|D_1) + P(T_1)P(D_2|T_1) = \dfrac{4}{6} \cdot \dfrac{4}{9} + \dfrac{2}{6} \cdot \dfrac{3}{9} = \dfrac{16 + 6}{54} = \dfrac{11}{27}$.

Dạng 2: Sử dụng công thức Bayes

Phương pháp giải:

Dùng để tính ngược lại xác suất của nguyên nhân khi biết kết quả đã xảy ra.

Ví dụ:

Tiếp tục bài toán dây chuyền sản xuất: Nếu lấy 1 sản phẩm thấy bị lỗi, hãy tính xác suất sản phẩm đó do máy 1 sản xuất.

$P(A_1|L) = \dfrac{P(A_1)P(L|A_1)}{P(L)} = \dfrac{0.012}{0.024} = 0.5$.

Ở một địa phương, 70% người dân thuộc nhóm X, 30% thuộc nhóm Y. Tỉ lệ mắc bệnh K ở người nhóm X là 1%, nhóm Y là 5%. Biết một người mắc bệnh K, tính xác suất người đó thuộc nhóm Y.

$P(K) = 0.7 \cdot 0.01 + 0.3 \cdot 0.05 = 0.007 + 0.015 = 0.022$.

$P(Y|K) = \dfrac{0.3 \cdot 0.05}{0.022} = \dfrac{0.015}{0.022} \approx 0.6818$.

Ba xạ thủ $S_1, S_2, S_3$ cùng bắn vào bia với xác suất trúng là 0.4; 0.5; 0.7. Chọn ngẫu nhiên 1 xạ thủ bắn, thấy bia bị trúng. Tính xác suất bia do $S_3$ bắn trúng.

$P(T) = (0.4 + 0.5 + 0.7)/3 = 1.6/3 \approx 0.533$.

$P(S_3|T) = \dfrac{(1/3) \cdot 0.7}{1.6/3} = \dfrac{0.7}{1.6} = 0.4375$.

Dạng 3: Ứng dụng trong y tế, kinh tế và kiểm định

Phương pháp giải:

Phân tích bài toán thông qua các chỉ số như Độ nhạy (Sensitivity) và Độ đặc hiệu (Specificity).

Ví dụ:

Xét nghiệm truyền nhiễm có độ nhạy 99%, độ đặc hiệu 95%. Tỉ lệ mắc bệnh là 0.5%. Một người xét nghiệm dương tính, tính xác suất người đó thật sự có bệnh.

$P(+) = 0.005 \cdot 0.99 + 0.995 \cdot (1 - 0.95) = 0.00495 + 0.04975 = 0.0547$.

$P(B|+) = \dfrac{0.00495}{0.0547} \approx 0.0905$. (Mặc dù xét nghiệm có độ chính xác cao nhưng do bệnh hiếm nên xác suất thật sự mắc vẫn thấp).

Một ngân hàng đánh giá khách hàng (75% tốt, 25% xấu). Tỉ lệ khách hàng tốt vỡ nợ là 0.01, khách hàng xấu vỡ nợ là 0.2. Nếu một khách hàng mới vỡ nợ, tính xác suất họ là khách hàng tốt.

$P(VN) = 0.75 \cdot 0.01 + 0.25 \cdot 0.2 = 0.0075 + 0.05 = 0.0575$.

$P(Tốt|VN) = 0.0075 / 0.0575 \approx 0.1304$.

Tại một kho hàng, 30% hàng từ nhà cung cấp A, 70% từ B. Tỉ lệ hàng đạt chuẩn của A là 90%, của B là 80%. Chọn ngẫu nhiên 1 sản phẩm thấy đạt chuẩn. Tính xác suất sản phẩm đó từ nhà cung cấp B.

$P(Chuẩn) = 0.3 \cdot 0.9 + 0.7 \cdot 0.8 = 0.27 + 0.56 = 0.83$.

$P(B|Chuẩn) = 0.56 / 0.83 \approx 0.6747$.

Bài tập (25)

Làm bài tập ngay

Các bài học trong chương: Chương 6: Xác suất có điều kiện và công thức Bayes