전체 글(409)
-
코세라 강의노트 - Structuring Machine Learning Projects : dev/test 사이즈
현재 수강중인 코세라 딥러닝 특화과정 강의 내용 정리. Andrew Ng 교수의 딥러닝 Specializations 강의는 총 5개 강좌로 이뤄져 있는데 현재 2개는 수료 후 Certificate를 받았고 나머지 3개를 한달 안에 완료하는 것이 목표. 인공지능 교육과정 6개월동안 머신러닝 - 딥러닝 기본 개념들은 훑었고, 직접 프로젝트도 진행하고는 있으나 짧은 기간 내에 개념과 코드까지 익숙해 지는건 솔직히 불가능이라 10월부터 코세라 강의를 병행하면서 진도에 맞춰 논문도 찾아보고 관련 영상도 쓱 보고 있는중. www.coursera.org/specializations/deep-learning 심층 학습 Learn Deep Learning from deeplearning.ai. If you want to..
2020.11.06 -
11월, 다이어리 구입으로 2021년 준비
문구 덕후인 나에게 한국은 천국. 다이어리를 써온 건 10년이 훌쩍 넘었지만 아직도 매년 이맘때면 내년엔 어떤 다이어리를 쓸까 고민하며 온오프를 오가며 고심하다가 선택, 1년 내내 꾸준히 썼던 건 절반은 되려나. 양지 다이어리, 몰스킨, 근영사 방안 노트로 불렛 저널도 시도했다가 스벅 다이어리, 아이코닉, 프랭클린 다이어리 등등 십수 년간 내손을 거쳐간 다이어리 종류만 엄청난데 격변의 시기를 보내고 있는 지금, 다이어리 & 플래너 & 불렛 저널을 동시에 써보고자 새로운 디자인으로 정했다. 표지에 덕지덕지 붙여놓은 스티커는 세트로 들어있는데 다꾸하는 손재주가 없는 터라 그냥 밋밋하게 둘걸 그랬다. 아무튼 파스텔톤의 베이비 핑크와 라벤더 컬러로 다이어리 & 불렛 저널! 처음 택한 리훈 디자인의 다이어리! 세..
2020.11.05 -
코세라 - 딥러닝 테스트 기록 : Optimization algorithms
코세라 - 딥러닝 Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization 2주차 테스트 문제 기록 80%를 넘겨야 통과되는데 틀려도 계속 시도할 수 있음. 영어라... 이렇게라도 써놔야 나중에 다시 볼듯하여 문제 및 정답을 긁어서 기록용으로 남김. Q. Which of these statements about mini-batch gradient descent do you agree with? One iteration of mini-batch gradient descent (computing on a single mini-batch) is faster than one iteration of batch gra..
2020.11.04 -
10/29 공부기록
오늘도 역시나 다양한 오류들을 마주하며... 파라미터들의 쓰임새를 다시 한번 체크한다. roi_bbox_specific shape: (1000, 4) min: -2.11556 max: 2.82945 float32 refined_proposals shape: (1000, 4) min: -7.00000 max: 594.00000 int32 ValueErrorTraceback (most recent call last) in 12 # ids = np.arange(roi_boxes.shape[0]) # Display all 13 limit = 5 ---> 14 ids = np.random.randint(0, len(roi_positive_ixs), limit) # Display random sample 15 ca..
2020.10.29 -
10/23 공부 기록 - 하이퍼파라미터
파라미터 튜닝과 에러를 하루종일 상대하며... 디폴트 값들을 이것저것 건드려 보다가 튀어나오는 새로운 에러들 상대하다 다시 백투 코세라 강의로. 역시 이론은 중요하다. 잠시 멈춰있던 코세라 딥러닝 강의를 다시 몰아 들음. 지금 진행중인 딥러닝 2과목이 온통 하이퍼파라미터에 관한 강의들이라 듣고 다시 코드에 적용해보고 돌려놓고 다시 공부. Panda approach와 Caviar approach 로 재밌게 표현하던데 리소스가 부족한 현 상태니 베이비시터와 같은 판다 방식으로 매뉴얼로 이것저것 고쳐보다가 크게 결과값이 변화하지 않으니 건드려볼 엄두가 안났던 config 각종 값들을 바꿔보는 중. Configurations: BACKBONE resnet101 BACKBONE_STRIDES [4, 8, 16, ..
2020.10.23 -
10/16 공부 기록
코세라 딥러닝 문제 풀다가 틀린 내용들 관련 포스팅 모음 최적의 train / dev / test set split 관련 (스탠포드 CS230 블로그) Splitting into train, dev and test sets Splitting into train, dev and test sets Splitting your data into training, dev and test sets can be disastrous if not done correctly. In this short tutorial, we will explain the best practices when splitting your dataset. This post follows part 3 of the class on “Structuri..
2020.10.16 -
다이어트 4개월 정체기
1. 다이어트 4개월, -7kg but 2달 정체기 6월 중순, 다이어트 시작 당시의 계획대로라면 9월 말에 100일 후기를 올렸어야 하나 세상사 마음대로 안된다는 걸 다이어트 여정에서 뼈저리 느끼는 중이다. 초반 2달만에 6킬로는 빠졌으니 두 달 동안 거의 정체기. 7kg면 선방한 거라고 할 수 있겠지만 코로나로 확찐자가 된 몸에다가 체지방률이 너무 높아서 건강을 위해서라도 목표치를 좀 더 높게 잡았기에 다이어트 여정은 12월 말까지 계속할 것. 여리여리한 가을 옷으로 스스로에게 다이어트 선물을 주고 싶었으나 겨울옷으로 수정. 정체기의 원인을 짚어 본다면, 2달 동안 저염에 닭가슴살에 물릴 정도로 쌀X, 밀가루X를 철저하게 지키면서 샐러드 위주의 식단을 가져가면서 운동 안 하던 몸이었으니 식단+데일리 ..
2020.10.15 -
공부 기록 - django ~
현재 진행하는 프로젝트가 웹기반 인공지능 구현이라 지난주까진 모델 돌려보고 이번주부턴 웹 시작. 처음 사용하는 파이썬기반 프레임워크인 django 전체 흐름도를 파악하기 위해 일단 위키독스 보면서 따라해보는 중. 나처럼 초심자를 정말 배려했다고 느껴질만큼 아주 자세하게 차근차근 설명해준다 바로가기 장고 MVT 패턴 (django flow link) 장고 속성(Field) 타입 확인 (django docs 참고) Django REST framework : Tutorial Quick Start - 가상환경에서 심플한 API 따라 만들어 볼 수 있음 오류 모음들 (매일 오류와의 싸움이라 업뎃 ing) (mysite) (base) C:\projects\mysite>python manage.py runserver..
2020.10.14 -
GitHub 신규 계정 Permission 오류
- 1일 1커밋을 목표로 깃허브 계정 다시 파고 시작. 초록잔디를 촘촘하게 채워봐야지^^ 실습용으로 몇 달 전에 쓰던 계정 말고 다른 이메일 계정으로 사용했더니 Push에서 계속 오류가 뜨던데 삽질하다 검색을 이리저리 해보니 해결방법이 아주 간단했음. Permission 오류창 remote : Permission to (신규username)/repository.git denied to (이전 username) fatal : unable to access 'https://github.com/username/repository.git/' : The requested URL returned error: 403 최초에 abc라는 아이디로 글로벌 유저 등록했는데, 오늘 다른 계정의 efg 라는 아이디로 글로벌 유..
2020.10.12 -
공개 데이터셋 리스트(참고자료)
실습 위한 데이터셋 리스트 유명 공개 데이터 저장소 - UC Irvine 머신러닝 저장소 - Kaggle 데이터셋 - 아마존 AWS 데이터셋 메타 포털(공개 데이터 저장소 나열됨) - 데이터 포털 - 오픈 데이터 모니터 - 퀀들 인기 있는 공개 데이터 저장소가 나열되어 있는 다른 페이지 - 위키백과 머신러닝 데이터셋 목록 - Quora.com - 데이터셋 서브레딧 Reference : Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition 외국 데이터 관련 영상들에서 많이 추천하던 오렐리의 핸즈온 머신러닝 2판 번역서 찬찬히 보는 중이라 참고할 만한 자료 꾸준히 업데이트 해보겠습니다:) 952p 분량의 압박이 있는 2..
2020.10.04 -
Coursera - Deep Learning 수료증 / 코세라 실습 파일 다운받기
앤드류 응 교수의 Deep Learning 특화과정의 5개 중 1단계 complete! 청강 모드로 듣는 다면 certificate가 안 나오고 연습문제들도 풀어보기 애매하니 49 usd/month 구독료를 주고 시작했는데 한 달 안에 완료 못하면 또 돈이 추가되니 쫄리는 마음으로 추석 연휴에 몰아서 오늘 완료. 각 단계별로도 course certificate가 나오지만 5단계 전체를 완료하면 Specialization 써티가 나온다. 청강 모드로 이것저것 건드려 보긴 했지만 돈내고는 처음 시도하는 터라 특화 과정에 대한 구독료 개념 이해가 부족했나 보다. 5개 과정 전체를 천천히 한 달에 하나씩 끝내야지 생각하고 여유 부리고 있었는데 2단계 강좌 구독 또한 별도 비용 지불 단계 없이 이어짐 고로 내가 ..
2020.10.03 -
9/25 공부 기록
며칠 동안 삽질 끝에 custom 데이터로 mask rcnn 구동ㅠㅠ 서버컴이 오기 전이라 랩탑 가상 환경에서 돌리느라 최대한 train 데이터 적게 잡고 시도 끝에 log폴더에 내가 라벨링 한 데이터로 학습한 weight가 생성되었다. 오류 하나를 수정하면 또 다른 오류들의 등장으로 며칠 멘붕이었지만 일단 모델이 잘 작동하는걸 확인했으니 이제 작업 데이터 양을 늘려서 라벨링을 내일 하루 동안 또 해야 할 듯. 등장했던 오류들 몇 가지 converting sparse indexedSlices to a dense Tensor of unknown shape could not find a format to read the specified file in %s mde % moename Input image dt..
2020.09.25 -
Mask R-CNN - 가상환경에서 Demo 돌려보기
윈도우 10, Anaconda, 가상환경으로 Mask R CNN 모델 돌려봄. CUDA 오류 때문에 버전을 이리저리 바꿔봐도 오류가 계속 났기에 가상 환경으로 시도! 오늘도 블로그와 유튜브 스승님들의 도움으로 한 발짝씩 나아갑니다ㅠㅠ 특히 아래 블로그에서 Tensorflow와 Keras 버전을 각각 아래와 같이 낮추라고 코멘트 해준 덕분에 한 번에 완료되었다! tensorflow==1.5.0 keras==2.1.6 Mask RCNN 셋업 관련 블로그 링크 Mask RCNN 셋업 유튜브 링크 ※ Mask R-CNN 관련 참고 개요 : github.com/matterport/Mask_RCNN 논문 : arxiv.org/pdf/1703.06870.pdf PR12 논문 읽기의 Mask R-CNN 편(유튜브) :..
2020.09.18 -
9/16 공부 기록
이론 수업은 거의 끝나가는데 워낙 방대한 분량을 빠르게 훑는 수준으로 끝내다 보니 기초가 아주 많이 부족하다. 특히 속도가 안 나는 건 이론이 이해되어야만 다음 단계 넘어가서 적용하는 게 오랜 습관으로 배어있는 것 같은데 이건 이렇게 하는 거야 라는 주입에는 잘 안 맞는 것 같아서 서치 신공으로 따로 자료를 계속 보는 중. 진도 나갈수록 아... 결국 수학이 중요하구나를 하루하루 느낀다. 이미 진도는 나갔지만 기억에서 가물가물해 진 것들, 헷갈리는 것들 체크리스트 - Numpy, Vector, 행렬 구조 - JSON - Flask - DB, 쿼리문 - 이미지 벡터화, 전처리 이렇게 알려주는 사람이 있다면 진짜 한 번에 이해됐을 것 같은 손뼉 치며 봤던 유튜브 영상 링크로. 신경망을 설명하기 전에 Neur..
2020.09.16 -
9/12 인공지능 공부기록
마지막 팀 프로젝트를 준비하면서 주제가 자주 엎어지고 있긴 하지만 일단 개인 관심사로 찾아본 것들 기록. 확실히 머신러닝-딥러닝 과정의 특정 알고리즘 바탕의 프로젝트 사례들을 찾아보면 한국 자료는 수적으로 일단 부족하다. 물론 지금은 어떻게 돌아가는지 알아가는 과정이라 한국어 자료가 소중하긴 하지만 영문 자료 찾아 볼수록 내가 직접 분석하고 구현해 보고 싶은 주제들 아이디어들이 계속 떠오른다. Fake news detection 가짜 뉴스 탐지 나름 언론학도로서 그리고 한때 기자 지망생으로 가장 먼저 해보고 싶었던 것이 가짜 뉴스 걸러내기. 논문들 찾아보다가 딱 링크의 연구 같은 모델을 해보면 좋겠다 생각했는데 변수가 너무 많고 현재 캐파로는 힘들지 않을까 해서 NLP 전반적인 모델링 처리과정을 다 볼 ..
2020.09.12 -
Coursera 코세라 딥러닝 강의 듣기
전 세계 유명 강의를 온라인으로 들을 수 있는 이제는 너무나 유명해진 코세라 강의 www.coursera.org/ 코세라 강의 청강 간간히 커리큘럼 눈팅하면서 해당 교수진들의 강의를 유튜브로 찾아서 듣곤 하다가 현재 듣고 있는 수업으로 채워지지 않는 부분을 해소코자 일단 관심 강의 2개 청강 신청! 당연히 수료증 취득을 목표로 하지만 한 달 안에 온전히 강의를 끝마치지 못하면 수료증 취득을 위해 월별 요금이 부과되는 형태라 일주일 동안 청강모드로 최대한 들어보고 업그레이드할 예정. 수료증을 위한 요금 또한 과정별로 차이가 있으니 참고! Neural Networks and Deep Learning (Andrew Ng /deeplearning.ai) People Analytics (UNIVERSITY OF ..
2020.09.07 -
2020년 9월, 한국 생활 안정기
2020년도 3분의 2가 흘렀다. 코로나 시국의 peak를 함께 했던 베트남에서의 3분의 1, 귀국 후 맨땅에 헤딩 인공지능 교육과정 돌입으로 또 3분의 1, 이제 남은 9월부터의 마지막 3분의 1은 수업 마무리 & 새로운 시작으로 올해를 마무리해야 할 터. 한동안 매일 글 쓰다가 8월 초 구글 애드센스 심사 1차 탈락 후 급 방치된 티스토리를 다시 살려보고자 한다. 하반기는 물론이거니와 적어도 내년 초까지는 이 코로나로 바뀐 세상 패턴이 계속되겠지. 경제활동을 몇 달 동안 안 하고 새로운 공부를 하면서 잠시 떨어져 있으니 지난 세월들을 계속 돌아본다. 20살 대학생활을 위해 서울로 상경한 후 지금까지 쭉 십수 년 타지 생활 중에 이제는 서울에서 보낸 시간이 대학 4년 + 직장생활 3년밖에 안된다는 거...
2020.09.06 -
데이콘 대회 참여하기
전세계 집단 지성의 대표적 커뮤니티로 꼽히는 캐글(Kaggle)을 알게 된 지도 얼마 안되었는데, 한국에도 비슷한 커뮤니티가 있다. 바로 데이콘! 머신러닝 실습을 위해선 가장 기본이 충분한 데이터를 확보하는 것인데 실제 기업에 다니거나 관련 업종에 발을 담그고 있지 않는 이상 연습용으로 활용할 만한 제대로된 데이터를 찾기는 힘든게 사실. (공공데이터나 UCI 자료 통해서도 오래된 데이터들 연습할 수 있겠지만 책에서 다루지 않은 내용들 직접 도전해보기 위한 로데이터를 구하기란 힘들다) 스파르타긴 했지만 분류, 회귀, 군집화 등 모델링 및 예측까지 이론을 배우고 실습해 봤으니 본격적으로 데이터를 스스로 다룰 수 있는 능력을 길러야 할 터. 조금은 정제된 데이터 및 한글로 설명이 곁들여져있는 데이콘의 교육용 ..
2020.08.26 -
판다스 get_dummies
두 시간째 자료형 오류로 멘탈이 나가는 중. ValueError: could not convert string to float: 모델 만들고 학습 시키는 중인데.................... 회귀분석을 위해 범주형 문자열 값을 숫자형으로 변환하려고 get_dummies()를 사용했건만 자꾸 오류 등장에 다시 뜯어보는 중...더 코드 길어지기 전에 다시 하는것도 방법이겠거니. pandas.get_dummies pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) Convert categorical variable into dum..
2020.08.25 -
군집화 (Clustering)
군집화와 분류 차이점을 이미지로 비교하고, 군집화의 활용 사례와 유의 사항, 문제점, 알고리즘에 대해 알아보겠습니다. 1. 군집화(Clustering)과 분류(Classification) 차이 분류 : y값이 있고, Supervised, 사전에 정의된 범주가 있으며(labeled), 그 데이터로부터 예측 모델 학습 군집화 : y값 없고, Unsupervised, 범주 없으며(unlabeled), 데이터에서 최적 그룹을 찾아가는 문제 2. Clustering 활용 사례 : market segmentation social network analysis search result grouping medical imaging image segmentation anomaly detection 3. Clusterin..
2020.08.25