데이콘 대회 참여하기

2020. 8. 26. 19:51캐리의 데이터 세상/캐리의 데이터 공부 기록

반응형

전세계 집단 지성의 대표적 커뮤니티로 꼽히는 캐글(Kaggle)을 알게 된 지도 얼마 안되었는데, 한국에도 비슷한 커뮤니티가 있다. 바로 데이콘!

머신러닝 실습을 위해선 가장 기본이 충분한 데이터를 확보하는 것인데 실제 기업에 다니거나 관련 업종에 발을 담그고 있지 않는 이상 연습용으로 활용할 만한 제대로된 데이터를 찾기는 힘든게 사실. (공공데이터나 UCI 자료 통해서도 오래된 데이터들 연습할 수 있겠지만 책에서 다루지 않은 내용들 직접 도전해보기 위한 로데이터를 구하기란 힘들다)

스파르타긴 했지만 분류, 회귀, 군집화 등 모델링 및 예측까지 이론을 배우고 실습해 봤으니 본격적으로 데이터를 스스로 다룰 수 있는 능력을 길러야 할 터.

조금은 정제된 데이터 및 한글로 설명이 곁들여져있는 데이콘의 교육용 프로젝트부터 참가 시작했다! 

이틀 동안 끙끙 대면서 모델링 및 예측까지 일단 전 과정을 스스로 해보고 제출까지 완료!

참고) 1일 제출 횟수는 10회로 제한된다. 

완성을 목표로 했기에 별다른 클리닝 작업은 안하고 모델도 두 개만 써봤는데, 일단 무작정 해보니 어떻게 돌아가는지 감이 잡힌다. But 세상사 문제가 다양할터인데 여러 방식으로 모델을 만들어 보고 또 분석 능력을 기르기 위해서는 많이 보고 해봐야 할 듯. 

+ 수학 및 통계학 공부는 속도는 안나지만 꾸준히. 기술적인 코드는 찾으면 찾을 수 있겠으나 실력 차이는 분석력과 모델링이 아닐까. 뽐내는 전세계 사람들이 올려 놓은 캐글 자료들도 틈틈히 보면서.

+ 캐글도 일단 시작해 보는거.

인공지능 머신러닝 실습 데이콘
데이콘

데이콘 홈페이지 바로가기

  

캐글 시작
캐글

캐글 홈페이지 바로가기

반응형