Hi, I am

Ngô Tôn

I am a programmer.

Home / HCMUS / Probability and Statistics / Xác suất có điều kiện – Kì vọng phương sai – Độ lệch chuẩn

Xác suất có điều kiện – Kì vọng phương sai – Độ lệch chuẩn

I. Xác suất có điều kiện
1. Định nghĩa
Giả sử A là biến cố ngẫu nhiên có xác suất dương. Xác suất của biến cố B tính trong điều kiện A đã xảy ra được gọi là xác suất của B với điều kiện A đã xảy ra, kí hiệu là P(B/A), được tính theo công thức:

2. Công thức nhân xác suất
Từ công thức (1) ta suy ra:
P(A ∩ B) = P(A) . P(B/A)     (2)
Với A, B, V là ba biến cố bất kì sao cho P(A ∩ B) ≠ 0 thì (2) được mở rộng thành:
P(A ∩ B ∩ C) = P(A).P(B/A).P(C/A ∩ B)           (3)
Các công thức (2) và (3) được gọi là các công thức nhân xác suất.

3. Các biến cố độc lập
Hai biến cố A và B được gọi là độc lập nếu P(A ∩ B) = P(A).P(B)
Từ định nghĩa suy ra: Nếu 0 < P(A) < 1, A và B độc lập thì: P(B/A) = P(B/ ) = P(B)

II. Phân bố xác suất của biển ngẫu nhiên rời rạc
Biến ngẫu nhiên X nhận các giá trị x1, x2, … xn với các xác suất tương ứng p1 = P(X = x1), p2 = P(X = x2), … , pn = P(X = xn) thỏa mãn: p1 + p2 + … + pn = 1 trình bày dưới dạng bảng:

X x1 x2 xk xn
P p1 p2 pk pn

Được gọi là bảng phân bố xác suất của biến ngẫu nhiên rời rạc X.

III. Kì vọng phương sai – Độ lệch chuẩn

X là một biến ngẫu nhiên có bảng phân phối xác suất:

X x1 x2 x3 xn-1 xn
P p1 p2 p3 pn-1 pn

1. Kì vọng của X (còn gọi là giá trị trung bình của X)

E(X) = p1x1 + p2x2 + p3x3 + … + pn-1xn-1 + pnxn

2. Phương sai của X (đặt a = E(X))  

3. Độ lệch chuẩn của X

• Tính chất của E(X):

+ E(kX) = k.E(X) với k là hằng số

+ E(X + Y) = E(X) + E(Y).

Công thức cho Định lý Bayes

Có nhiều cách khác nhau để viết công thức cho định lý Bayes’. Các hình thức phổ biến nhất là:

P (A | B) = P (B | A) P (A) / P (B)

trong đó A và B là hai sự kiện và P (B) ≠ 0

P (A | B) là xác suất có điều kiện của sự kiện A xảy ra cho rằng B là đúng.

P (B | A) là xác suất có điều kiện của sự kiện B xảy ra cho rằng A là đúng.

P (A) và P (B) là xác suất của A và B xảy ra độc lập với nhau (xác suất cận biên).

Bạn có thể muốn tìm xác xuất của một người có viêm khớp dạng thấp nếu họ có sốt cỏ khô. Trong ví dụ này, “có bệnh sốt mùa hè” là thử nghiệm cho viêm khớp dạng thấp (sự kiện).

  • Dữ liệu chỉ ra 10 % bệnh nhân ở một bệnh viện có loại viêm khớp. P (A) = 0.10
  • Dữ liệu chỉ ra 5 % bệnh nhân ở một bệnh viện có sốt cỏ khô. P (B) = 0.05
  • Hồ sơ của bệnh viện cũng cho thấy rằng những bệnh nhân bị viêm khớp dạng thấp, 7 % bị sốt cỏ khô. Nói cách khác, xác suất mà một bệnh nhân bị sốt cỏ khô, cho họ có viêm khớp dạng thấp, là 7 %. B | A = 0.07

Gán các giá trị vào định lý: P (A | B) = (0.07 * 0.10) / (0.05) = 0.14

Vì vậy, nếu bệnh nhân có sốt mùa hè, cơ hội của họ có viêm khớp dạng thấp là 14 %. Nó không giống một bệnh nhân ngẫu nhiên với bệnh sốt mùa hè đã Viêm khớp dạng thấp.

Định lý Bayes’ thể hiện sự ảnh hưởng của dương tính giả và âm tính giả trong xét nghiệm y tế.

  • Độ nhạy là tỷ lệ dương tính thật. Nó là thước đo tỷ lệ dương tính được xác định một cách chính xác. Ví dụ, trong một thử nghiệm mang thai , nó sẽ là tỷ lệ phụ nữ với một que thử thai dương tính, người có thai. Một thử nghiệm nhạy cảm hiếm khi bỏ lỡ một “tích cực”.
  • Đặc hiệu là tỷ lệ tiêu cực đúng. Nó đo tỷ trọng âm được xác định một cách chính xác. Ví dụ, trong một thử nghiệm mang thai, nó sẽ là phần trăm phụ nữ với một que thử thai âm tính những người không mang thai. Một thử nghiệm cụ thể hiếm khi đăng ký một dương tính giả.

Một thử nghiệm hoàn hảo sẽ là nhạy cảm 100 % và cụ thể. Trên thực tế, kiểm tra có tối thiểu lỗi được gọi là tỷ lệ lỗi Bayes.

Ví dụ, hãy xem xét một thử nghiệm ma túy đó là nhạy cảm 99 phần trăm và 99 phần trăm cụ thể. Nếu một nửa phần trăm (0,5 phần trăm) của người sử dụng một loại thuốc, khả năng là những gì một người ngẫu nhiên với một xét nghiệm dương tính thực sự là một người sử dụng?

P (A | B) = P (B | A) P (A) / P (B)

có lẽ viết lại như sau:

P (người dùng | +) = P (+ | người dùng) P (người sử dụng) / P (+)

P (người dùng | +) = P (+ | người dùng) P (người sử dụng) / [P (+ | người dùng) P (người sử dụng) + P (+ | phi người dùng) P (không dùng)]

P (người dùng | +) = (0,99 * 0,005) / (0,99 * 0,005 + 0,01 * 0,995)

P (người dùng | +) ≈ 33,2%

Chỉ có khoảng 33 phần trăm thời gian sẽ là một người ngẫu nhiên với một xét nghiệm dương tính thực sự là một người sử dụng ma túy. Kết luận là thậm chí nếu một người thử nghiệm dương tính với một loại thuốc, nó có nhiều khả năng họ không sử dụng thuốc hơn mà họ làm. Nói cách khác, số dương tính giả là lớn hơn số dương tính thật.

Trong những tình huống thực tế, một trade-off thường được thực hiện giữa độ nhạy và độ đặc hiệu, tùy thuộc vào việc nó quan trọng hơn để không bỏ lỡ một kết quả tích cực hay cho dù đó là tốt hơn để không nhãn một kết quả tiêu cực như một tích cực.

About ngoton

Ngô Tôn is a programmer with passion for tailored software solutions. Comes with 7+ years of IT experience, to execute beautiful front-end experiences with secure and robust back-end solutions.

Leave a Reply

avatar
  Subscribe  
Notify of