데이터분석/통계

2. 확률과 확률분포_베이즈 정리 / 확률변수 및 확률분포

Q_jihe 2023. 7. 2. 17:09

베이즈 정리

어떤 사건이 일어난 후 앞으로 일어날 다른 사건의 가능성을 구하는 것

즉, 기존 사건들의 확률(사전 확률)을 알고 있다면, 각 원인들의 조건부 확률(사후 확률)을 구할 수 있음

기존 사건들의 데이터가 쌓이면 쌓일 수록 조건부 확률의 정확성이 높아짐

확률변수와 확률분포

  • 확률변수 Random Variable : 시행의 결과에 따라 값이 결정되는 변수
  • 확률분포 Probability Distribution : 확률변수가 특정한 값을 가질 확률을 나타내는 함수
  • 확률 변수가 어떤 종류의 값을 가지는가에 따라 이산 확률 분표와 연속 확률 분포로 나뉨

이산확률분포 discrete probability distribution

확률 질량 함수로 표현 가능하며 대표적 예시는 하기와 같음

  • 푸아송 분포 : 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현
  • 베르누이 분포 : 임의의 결과가 '성공' 또는 '실패'의 두 가지 중 하나인 실험

연속확률분포 continuous probability distribution

확률 밀도 함수로 표현 가능하며 대표적 예시는 하기와 같음

  • 정규 분포 (= 가우스 분포)
  • 카이제곱 분포