캐글 ML 30 Days - 모델링 기초

2021. 8. 25. 16:25캐리의 데이터 세상/Kaggle

반응형

캐글의 30일 Machine Learning 챌린지를 등록해 놓고 초반 1주일만 매일 주어지는 assignment를 하다가 많이 밀렸는데요, 초심으로 돌아가서 몰아서 조금씩 해보고 있는 터라 캐글 안에서도 코드 실행해보고 Colab으로 직접 가져와서 다시 한번 실행, 이걸 GitHub Gist에 연동해서 그대로 티스토리에 끌어와서 남겨 보겠습니다. 

확실히 이전에 코드블록으로만 붙여 넣기 할 때와는 가독성에 차이가 나네요. 

 

 

 

 

 

1. 캐글 - 주택가격 데이터로 첫 번째 모델 만들기

아래 코드는 캐글의 Introduction to Machine Learning의 3번째 챕터에 나오는 Your First Machine Learning Model의 아주 기본 내용이지만 주석 처리된 부분을 염두해서 ML 모델링이 어떻게 흘러 가는지 틀을 잡아주니 꼼꼼하게 살펴보세요!

 

 

 

 

2. 모델링 4단계

  • Step 1: Specify Prediction Target
  • Step 2: Create X
  • Review Data
  • Step 3: Specify and Fit Model
  • Step 4: Make Predictions
  • Think About Your Results

 

 

 

 

3. 사용한 데이터 출처

Colab에서 raw 데이터로 사용된 train.csv 파일은 캐글(링크)에서 가져와서 content 폴더에 담아두고 불러왔습니다. 

Kaggle ML 30일 챌린지는 15일 동안은 https://www.kaggle.com/learn 캐글 courses에 이미 올라와 있는 무료 강의들을 매일 일정양 소화하도록 독려 이메일이 날아왔는데요, 마지막 2주는 Competition에 직접 참여해서 매일 한 번 이상 submit 횟수를 늘려가면서 모델 성능을 개선하도록 짜여 있습니다. 

며칠 전에 챌린지 참여자에게 소개된 캐글 그랜드마스터의 유튜브 동영상도 참고하세요. 

 

▼ 참고글

캐글 30 Days of ML 챌린지 - 기본 세팅

 

반응형