코세라 - case study (딥러닝-Bird recognition 문제 중)

2020. 11. 11. 07:19캐리의 데이터 세상/캐리의 데이터 공부 기록

반응형

실습 오답 정리:)

가상의 Peacetopia라는 지역에 새를 싫어하는 주민들을 위한 Bird Detection 과정을 순서대로 15문제로 구성.. 1차 시도 71점이라 다시 시도 중(80점 커트라인..) 10mil 데이터셋으로 일단 시작, 중간에 추가 데이터가 들어왔을 때(다른 distribution) 적용여부 및 베이즈 에러, human performance, train/dev error 가상 결과에 따른 다음 프로세스 등에 대한 질문들이 주를 이룸.

* distribution만 생각하고 true라고 했는데 training, dev set 역할을 좀더 구분해서 봐야할 듯. 

 

-> 마지막 4번도 추가로 선택해 줬어야 함. 중간에 백만건이나 test 셋에만 집어 넣으면 앞서 25만건 test set로 분류해서 놓은 기존의 데이터셋에 영향을 미친다. distribution이 고려되지 않은 추가 데이터의 영향에 대해 확인!

 

-> avoidable bias랑 variance 격차 비교했을 때 낮은 variance쪽을 더 향상시켜야한다고 착각했음.. avoidable bias를 줄이기 위한 성능 향상 방법으로 나머지 2개를 택해야.

 

밑에는 복수 정답들 다시 풀어서 맞춘 문제들 참고로.

 

 

 

반응형