2021. 11. 1. 20:13ㆍ캐리의 데이터 세상/캐리의 데이터 공부 기록
진작에 시작했어야 했는데 초심으로 돌아가 AI 클론 프로젝트를 인프런 강의 들으면서 시작. 내가 자주 썼던 사이트에 적용된 인공지능 프로젝트를 직접 따라 해 보면서 혹은 응용하면서 전체 프로세스를 구현해 보는 것. Airbnb의 Object Detection 프로젝트로 시작. 하나씩 따라 하다 보니 1년 전에 팀플로 Mask-RCNN을 활용한 detection 프로젝트가 그려지면서 이렇게 정리해야 하는구나 또 스쳐 지나갔던 내용들이 떠오른다. 활용 가능한 소스들과 어떻게 접근하면 좋을지 사이트 몇 가지 정리.
AI 알고리즘이 주로 응용되는 분야
내가 가장 관심있는 분야는 바로 자연어 처리(NLP)인데 개인 입장에서 제대로 배울 곳이 마땅찮아 오렐리의 <파이토치로 배우는 자연어 처리> 기본 책 하나 구입하고 코세라의 앤드류 응 교수님 팀인 Deeplearning.ai의 NLP 강의도 조금씩 들어 보는 중. But 강의만 들으면 뭐하나. 실제 어떻게 서비스화 되는지 데이터를 다루고 프로젝트를 경험할 기회를 찾기는 힘들어 AI 클론 강의를 선택. 일단 그래도 팀플 하면서 경험해 봤던 객체 감지 프로젝트로 시작하고 어떻게 깃헙에 정리하는지 하나 해보고 나서 스스로 논문 구현도 해보고 관심 있는 프로젝트들 회사의 영문 포스팅들을 살펴보면서 깃헙에 채워나갈 예정.
주요 AI 도메인 분야는 다음과 같다.
- 컴퓨터 비전 (Computer Vision)
- 자연어 처리 (NLP)
- 음성 인식 (Speech Recognition)
- 추천 시스템 (Recommendation System)
AI 클론 프로젝트 - TensorFlow 활용 우수사례에서 찾기
구글 텐서플로 사이트에서 우수사례 페이지를 살펴보면 각 도메인별 대표 글로벌 기업들의 사례가 소개되어 있으며, 기업별 페이지로 들어가면 medium이나 자사 페이지에 각종 프로젝트들의 도입 배경부터 활용 데이터셋, 전처리, 사용 모델 및 성능 평가, 시사점까지 정리되어 있다. 물론 영어!
포스팅 시점이 지금보다 몇 년 전인 것들은 그새 새롭게 업그레이드된 모델을 응용해서 사용해 보면서 논문도 찾아보고 평가 지표도 비교해보면 좋을 듯하다.
https://www.tensorflow.org/about/case-studies
객체 감지 주요 데이터셋
2021년 top 10 오픈소스 object detection 데이터셋 (링크) 포스팅에 주요 데이터셋들이 정리되어 있습니다.
- MS COCO 데이터셋
- PASCAL Visual Object Calsses (VOC) 데이터셋
- Exclusively Dark (ExDark) Image 데이터셋
- Open Images 데이터셋
- ImageNet 데이터셋
'캐리의 데이터 세상 > 캐리의 데이터 공부 기록' 카테고리의 다른 글
코세라 ML 강의 듣기 (0) | 2022.07.31 |
---|---|
Udemy 강의 할인받기 (2) | 2022.02.08 |
자연어 처리 공부자료 업데이트 (0) | 2021.12.22 |
AWS 클라우드 실습 기록 - 서버생성 및 글로벌 인프라 (0) | 2021.09.07 |
무료로 인공지능 교육과정 이어가기 (0) | 2021.09.03 |
구글 코랩 마크다운(Markdown) 텍스트 편집 (1) | 2021.07.31 |
IPython 매직 명령어 모음 (0) | 2021.06.30 |