Định lý Bayes là một công thức toán học quan trọng trong lý thuyết xác suất, mô tả cách cập nhật hoặc điều chỉnh xác suất của một giả thuyết dựa trên bằng chứng mới. Nó liên kết xác suất tiên nghiệm (prior probability) của một biến cố với xác suất hậu nghiệm (posterior probability) sau khi xem xét một số dữ liệu hoặc bằng chứng.
Công thức của Định lý Bayes:
Cho hai biến cố và
, định lý Bayes được phát biểu như sau:
Trong đó:
: Xác suất có điều kiện của biến cố
xảy ra khi biết rằng biến cố
đã xảy ra (xác suất hậu nghiệm).
: Xác suất có điều kiện của biến cố
xảy ra khi biết rằng biến cố
đã xảy ra (likelihood).
: Xác suất tiên nghiệm của biến cố
xảy ra trước khi có bằng chứng
.
: Xác suất toàn phần của biến cố
xảy ra (evidence hoặc normalizing constant).




Mở rộng cho nhiều giả thuyết:
Nếu chúng ta có một tập hợp các giả thuyết loại trừ lẫn nhau mà phủ hết không gian mẫu (tức là một trong các giả thuyết phải đúng), và chúng ta có một số dữ liệu
, thì định lý Bayes có thể được mở rộng để tính xác suất hậu nghiệm của mỗi giả thuyết
khi biết dữ liệu
:
Trong đó:
: Xác suất hậu nghiệm của giả thuyết
khi biết dữ liệu
.
: Xác suất của dữ liệu
nếu giả thuyết
là đúng (likelihood).
: Xác suất tiên nghiệm của giả thuyết
.
: Xác suất toàn phần của dữ liệu
, có thể được tính bằng công thức:
Ví dụ minh họa:
Bài toán về xét nghiệm y tế:
Một bệnh hiếm gặp ảnh hưởng đến 1% dân số. Có một xét nghiệm để phát hiện bệnh này, với độ chính xác 95% (nếu người bệnh dương tính thì kết quả xét nghiệm dương tính với xác suất 0.95, và nếu người không bệnh âm tính thì kết quả xét nghiệm âm tính với xác suất 0.95). Một người được xét nghiệm và cho kết quả dương tính. Hỏi xác suất người đó thực sự mắc bệnh là bao nhiêu?
Giải:
- Gọi
là biến cố “người đó mắc bệnh”.
(xác suất tiên nghiệm).
- Gọi
là biến cố “người đó không mắc bệnh”.
.
- Gọi
là biến cố “kết quả xét nghiệm là dương tính”.
(độ chính xác của xét nghiệm khi người bệnh).
(xác suất dương tính giả khi người không bệnh).
Chúng ta muốn tính , xác suất mắc bệnh khi biết kết quả xét nghiệm dương tính. Áp dụng định lý Bayes:
Để tính , ta sử dụng công thức xác suất toàn phần:
Bây giờ, ta có thể tính :
Kết luận: Mặc dù xét nghiệm có độ chính xác 95% và kết quả là dương tính, xác suất người đó thực sự mắc bệnh chỉ khoảng 16.1%. Điều này là do tỷ lệ mắc bệnh trong dân số rất thấp (xác suất tiên nghiệm thấp).
Ứng dụng của Định lý Bayes:
Định lý Bayes có vô số ứng dụng trong nhiều lĩnh vực, bao gồm:
- Y học: Chẩn đoán bệnh dựa trên triệu chứng và kết quả xét nghiệm.
- Trí tuệ nhân tạo và học máy: Phát triển các thuật toán phân loại, lọc thư rác, nhận dạng giọng nói và hình ảnh.
- Thống kê: Suy diễn Bayes, cập nhật niềm tin dựa trên dữ liệu.
- Tài chính: Đánh giá rủi ro và dự đoán thị trường.
- Khoa học: Phân tích dữ liệu thực nghiệm và cập nhật các giả thuyết khoa học.
Định lý Bayes là một công cụ mạnh mẽ để suy luận xác suất trong điều kiện có thông tin mới, giúp chúng ta đưa ra quyết định sáng suốt hơn dựa trên bằng chứng.
Discover more from Science Comics
Subscribe to get the latest posts sent to your email.