Lesson
타이타닉 모델 분석
역사 속 가장 유명한 해양사고인 타이타닉 침몰 사건을 데이터 분석을 통해 살펴봅니다. 머신러닝 모델을 활용하여 승객의 생존 확률을 예측하는 방법을 배웁니다.
학습 목표
- 데이터 수집 및 전처리 기술 습득
- 탐색적 데이터 분석(EDA) 실습
- 분류 모델 개발 및 성능 평가
- 실제 데이터 기반 인사이트 도출
주요 내용
- 타이타닉 탑승객 데이터셋 분석
- 성별, 연령, 객실 등급에 따른 생존율 분석
- 로지스틱 회귀 모델을 이용한 생존 예측
- 모델 성능 평가 및 해석
데이터 수집
아래 영역에 파일을 업로드하면, 분석 단계에서 사용할 데이터를 불러옵니다.
titanic.csv 업로드
아래 점선 영역에 파일을 끌어다 놓거나, 업로드 버튼을 눌러 파일을 선택할 수 있습니다.
이 영역으로 CSV를 드래그해서 놓아 주세요권장 파일 이름: titanic.csv
승객 목록
업로드한 타이타닉 데이터를 바탕으로 성별, 연령, 객실 등급, 탑승 요금 등이 생존 여부와 어떤 관계가 있는지 살펴봅니다.
먼저 1. 데이터 수집에서 CSV를 업로드하면 승객 명단이 표시됩니다.
모델 예측
전처리한 데이터를 사용해 머신러닝 분류 모델을 만들고, 승객별 생존 가능성을 예측한 뒤 정확도와 해석 결과를 확인합니다.