※데이터 전처리는 이전 포스팅에 개재 2019/05/06 - [데이터분석/분석 연습] - Kaggle 캐글 연습#1_Titanic 타이타닉 생존자 예측_1/2 데이터 전처리 데이터 준비 데이터 변수(feature)확인 탐색적 데이터 분석(EDA) Feature Engineering 예측 모델 구축 및 적용 모델 평가 이번 포스팅에서는 예측 모델 적용과 평가를 진행하도록 하겠습니다. 2. 예측 모델 구축 및 적용 타이타닉 데이터 분석의 목적은 "승객들의 생존 여부 예측"으로, 1. Classification(분류) : 생존 or 사망 2. Regression(회귀) : 변수 간 선형 인과관계를 조사하여, 종속 변수(생존)의 관측치를 예측 이렇게 2가지 분석으로 좁혀집니다. 이는 머신러닝 중 지도학습(Sup..
분석연습에 사용된 프로그램은 "Jupyter Notebook" 입니다. 캐글 커널 중, "Titanic Data Science Solutions - by Manav Sehgal" 의 상당 부분을 참고하였습니다. 그 외에도, 다수의 블로거분들의 분석을 참고하였습니다. 링크는 아래에 기재하였습니다. 데이터셋은 캐글 링크를 참고해주세요. 분석 과제 타이타닉 호 침몰 사건 당시의 사망자와 생존자를 구분하는 요인 분석을 통해, "승객들의 생존 여부를 예측하는 모델 구축" 분석에 들어가기 앞서.. 특히 모델과 알고리즘을 구축하는 경우, 분석의 과정은 크게 2가지로 나뉩니다. 1. 데이터 전처리: 주어진 데이터를 파악 후, 모델에 최적화된 형태로 변형합니다. 2. 모델링: 최적화된 데이터에 모델을 적용 및 perfo..
- Total
- Today
- Yesterday
- 조건부확률
- 군고구마
- counter
- neural network
- hash
- 통계
- 뇌하수체선종
- 쿠싱증후군
- 쿠싱
- 상관관계
- 파이썬
- TensorFlow
- 프로그래머스
- 확률분포
- 중앙값
- Lambda
- random forest
- 상대도수
- leatcode
- 힙
- 평균
- 분산
- Python
- 분당서울대병원
- 사분위수
- 확률
- programmers
- 뇌하수체
- 코딩테스트
- SQL
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |