표본분포 모집단으로부터 무작위 반복 추출한 표본 통계량에 대한 분포로, 크게 2가지의 과제로 나뉨 정규모집단의 평균과 분산 측정이 중요한 분포(카이제곱, T, F) n이 클 때의 표본분포의 성질에 대한 정리(대수의 법칙, 중심극한정리) 2.1 정규모집단의 평균과 분산 측정이 중요한 분포 표본을 통해 모집단 통계량(평균, 분산) 추론이 중요한 분포 2.1.1 카이제곱분포 (chi-squared distribution) [ 정의 ] n개의 서로 독립적인 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포 주요 용도 : 표본분산을 통한 모분산 추측(모분산에 대한 가설검정이나 신뢰구간 도출) 그룹들의 비율을 비교하며, 독립변수 종속변수가 모두 범주형 자료(Categorical data)인 분석에 유용 예시) 여성..
모집단의 특성을 나타내는 대표적인 수치로는 기대치와 분산이 있음. 기대치(Expectation) 어떤 확률 과정을 무한히 반복했을 때 얻을 수 있는 값들의 평균으로 기대하는 값으로 결괏값과 그것의 확률들의 곱들의 합으로도 나타낼 수 있음 보통은 표본평균을 의미하나 시행횟수 n → ∞ 로 갈 수록 표본평균은 모평균에 수렴함 예) 주사위를 던졌을 때의 기대치 = 3.5 주사위를 던졌을 때 나올 수 있는 값들은 1부터 6까지의 숫자이고 각각의 확률은 1/6 분산(Variance) 각 측정치가 평균으로부터 얼마나 떨어져있는지 (편차) 를 제곱한 것들의 평균 이를 기대치로 나타내면 아래와 같음
평균, 분산, 표준편차 히스토그램은 시각적인 표현에 적합하지만 분포의 특징을 ‘수치’로 나타내기에는 적합하지 않음 따라서 평균, 분산, 표준편차와 같은 대표적인 지표를 활용 평균 산술평균 : 우리가 일반적으로 부르는 평균 기하평균 : 산술 평균의 역수, 상대적인 비를 갖는 단위 평균을 계산하는 데 유용 (ex. 속력) 분산 : 각 측정치가 평균으로부터 얼마나 떨어져있는지 (편차) 를 제곱한 것들의 평균 표준편차: 분산 값에 제곱근을 취한 것 표준화 점수 (Z score) 공식 : (원점수 - 평균) / 표준편차 통계학적으로 정규분포를 만들어, 각 관측치가 표준편차 상 어떤 위치를 차지하는 지 보여줌 변동계수 (CV, Coefficient of Variation) 공식 : 표준 편차 / 평균 측정 단위가 ..
- Total
- Today
- Yesterday
- 사분위수
- 쿠싱증후군
- 파이썬
- 확률
- SQL
- hash
- 쿠싱
- 군고구마
- 중앙값
- 상관관계
- 프로그래머스
- TensorFlow
- 평균
- programmers
- 뇌하수체선종
- 분당서울대병원
- random forest
- neural network
- Python
- leatcode
- 분산
- 코딩테스트
- 힙
- 통계
- 확률분포
- 조건부확률
- Lambda
- 상대도수
- 뇌하수체
- counter
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |