빅데이터 분석기사 실기 준비

2021. 6. 6. 23:56캐리의 도전/시험

반응형

6월 19일(토)에 예정된 빅분기 실기 시험 접수는 했으나 다른 일들을 하느라 전혀 준비는 못하고 미루다 보니 어느덧 2주 앞으로 다가옴. 아무래도 직전 시험 정보가 없는 첫 번째 회차다 보니 필기시험 전에 커뮤니티에서 활발하게 의견 나누던 분위기와는 정반대. 아무래도 비전공자의 경우 실기 첫 회차 분위기 보고 다음 회차를 준비하는 사람들이 많아 보임.

 

빅데이터 분석기사 실기시험 개요 및 합격기준

실기 시험 출제 기준과 시험 시간, 주요 과목명 및 배점은 아래와 같습니다.

 

 

  • 빅분기 실기시험 출제 기준 : 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업무를 수행한다.
  • 실기 검정 방법 : 통합형(필답형, 작업형)
  • 빅분기 시험시간 : 180분
  • 과목별 주요 항목 : 데이터 수집 작업, 데이터 전처리 작업, 데이터 모형 구축 작업, 데이터 모형 평가 작업
  • 문제 유형(14개 문항 100점)
    - 단답형 (10문항, 문항당 3점 = 30점)
    - 작업형 제1유형 (3문항, 문항당 10점 = 30점)
    - 작업형 제2유형 (1문항, 40점 = 40점)

 

  • 빅분기 실기 합격 기준 : 60점 이상
  • 실기 제공 언어 : R(3.6), Python(3.6)
  • 실기 환경 : 클라우드 기반 코딩 플랫폼(구름, 온코더, 프로그래머스 등)
  • 답안 제출 방법
    - 단답형 : 정답 입력 후 제출
    - 작업 1 유형 : 단답형 답을 가진 변수를 print 명령어로 출력하는 코드 제출
    - 작업 2 유형 : write.csv, to_csv 명령어 이용, 답안 csv로 생성하는 코드 제출
  • 필기시험 면제 기간 : 필기합격자 발표일로부터 2년 동안 유효하며 다만, 발표일부터 2년동안 검정이 2회 미만으로 시행된 경우에는 그다음 회차 필기시험 1회를 면제. 

 

빅데이터 분석기사 실기 문제 예시

첫 시험이라 시험 데이터가 없는 상태이지만 주최 측에서 공지사항에 올려놓은 예시 문제 및 작업환경을 통해 문제 유형을 가늠해 볼 수 있습니다.

단답형 예시

여러 명의 사용자들이 컴퓨터에 저장된 많은 자료들을 쉽고 빠르게 조회, 추가, 수정, 삭제할 수 있도록 해주는 소프트웨어는 무엇인가?
작업 1 유형 예시
mtcars 데이터셋(mtcars.csv)의 qsec 칼럼을 최소 최대 척도(Min-Max Scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오.

# 출력을 원하실 경우 print() 활용
# 예) print(df.head())
# 답안 제출 예시
# print(레코드 수)
작업 2 유형 예시
(문제 생략. 공지사항 링크 및 공지사항 첨부된 pdf 참조)

유의사항
- 성능이 우수한 예측모형을 구축하기 위해서는 적절한 데이터 전처리, Feature Engineering, 분류 알고리즘 사용, 초매개변수 최적화, 모형 앙상블 등이 수반되어야 한다.
- 수험번호.csv(예:0000.csv) 파일이 만들어지도록 코드 제출
- 제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점
-dataset은 'data/y_train.csv'의 형태로 읽어 들인다.

# 출력을 원하실 경우 print() 활용
# 예) print(df.head())
# 답안 제출 예시
# 수험번호.csv 생성
# DataFrame.to_csv("0000.csv", index=False)

 

 

개인적인 빅분기 실기 2주 준비

일단 4만 원 실기 시험 접수비를 낸 상태니 무조건 붙는다는 생각으로 준비 전략.  실기만 생각했을 때는 전처리 잘해서 데이콘이나 캐글에 제출하듯 csv 파일 하나만 낸다고 생각하다가 단답형 10문제가 30점을 차지하니 이론 공부를 안 하면 실기 합격 60점 커트라인에 아주 큰 걸림돌일 것 같아서 묵혀둔 이론서를 끄집어냄. 

  • 데이터 전문가 포럼(네이버 카페) 빅분기 실기 코너에 예시 데이터를 토대로 미리 연습해본 분들이 올려놓은 코드 및 댓글들 확인하면서 감잡기. 댓글들을 살펴보면서 고수분들이 내놓는 나름의 시험 출제 방향을 캐치
  • Colab 환경에서 연습하되 명령어 자동완성 기능이나 전처리 때 반복적으로 쓰는 명령어들을 어디에다 적어두고 활용하는 게 아니라 맨땅에 처음부터 끝까지 구현해야 하니 반복학습이 필요
  • 공지사항에 올라온 제공 파이썬 패키지 확인
  • 묵혀둔 이론서 <머신러닝 교과서 with 파이썬, 사이킷런, 텐서 플로>와 <파이썬 머신러닝 완벽 가이드>에 나온 캐글 예제들 살펴보고 캐글에 연습 삼아 제출해보기 + 단답형 대비 주요 개념 정리

 

필기시험에서 충분히 개념에 대한 질문을 한 것 같은데 왜 실기에 단답형 문제가 있는지 이해되지는 않는데 10문제나 되니 넘어갈 수는 없고 이론서 빠르게 살펴보면서 평가 지표 등 큼직한 개념 위주로 눈에 익히는 수준으로 준비해야 할 듯. stackoverflow와 구글신을 벗 삼아 검색해보면서 찾아가는 그런 건 시험에서 할 수 없으니 일단 첫 시험 쳐보고 안되면 12월 실기를 다시 노리는 걸로 맘 편하게 임하기로.

 

▼ 참고글

빅데이터 분석기사 필기 합격 및 실기 준비

반응형