데이터분석/통계
2. 확률과 확률분포_조건부확률
Q_jihe
2023. 7. 1. 12:51
개요
어떤 사건이 일어나는 경우 다른 사건이 일어날 확률
P(A ∣ B) = 사건 B가 일어나는 경우에 사건 A가 일어날 확률
예시
한 집단에 10대부터 50대까지의 연령이 존재하고, 안경을 쓴 사람과 그렇지 않은 사람이 있다.
이 중 40대(A)는 30%, 안경을 쓴 사람(B)은 20%, 40대이면서 안경을 쓴 사람(AB)은 6%이다.
해당 집단에서 안경을 쓴 어떤 한 사람을 뽑았을 때 그 사람이 40대일 확률은
P(AB) / P(B) = 0.06 / 0.2 = 0.3
독립성
사건 A와 B가 독립이라는 것은, P(A ∣ B) = P(A) (= P(B ∣ A) = P(B))
통계의 함정
- A : 운전자가 안전띠를 매는 사건
- B : 운전자가 자동차 사고로 사망하는 사건
- 자동차 사고로 사망한 사람의 40%는 안전띠를 매지 않았음
그럼 사망한 사람의 60%는 안전띠를 매고도 죽었다는 것이므로 안전띠가 위험하다는 뜻?
이는 두 조건부확률 P(A | B)와 P(B | A)가 서로 다르다는 것을 전제로 하지 않아 발생
- P(A) = 운전자 중 안전띠를 맨 사람의 비율 : 0.95
- P(B) = 운전자 중 자동차 사고 사망 비율 : 0.0001
- P(A ∣ B) = 자동차 사고로 사망했을 때 안전띠를 매는 사건 : 0.6
- P(Ac ∣ B) = 자동차 사고로 사망했을 때 안전띠를 매지 않는 사건 : 0.4
- P(B ∣ A) = 안전띠를 맸을 때 자동차 사고로 사망할 확률 = P(AB) / P(A)
- P(AB)= P(A ∣ B) * P(B) =0.6*0.0001 = 0.0006
- P(AB) / P(A) = 0.0006/0.95 = 0.000063
- P(B | Ac) = 안전띠를 매지 않았을 때 자동차 사고로 사망할 확률 = P(AcB) / P(Ac)
- P(AcB) = P(Ac ∣ B) * P(B) = 0.4*0.0001 = 0.0004
- P(AcB) / P(Ac) = 0.0004/0.05 = 0.0008
→ 안전띠를 맸을 때 자동차 사고로 사망할 확률이 그렇지 않을 때보다 훨씬 낮음 즉, 안전띠를 매야 안전하다라는 결론이 남