나는 고작 컴퓨터 공학 학사과정을 다 마친 주니어 개발자이다.
AI, 머신 러닝... 학부 때부터 줄기차게 들어는 봤지만, 사실 제대로 배우지는 못했던 것 같다.
공부를 시작하려고 Google선생님께 여쭤봐도...
정보의 홍수가 어떤 의미인지 바로 체감이 될 정도로 너무 많은 정보들이 쏟아져 나와서
결국 어떤 책, 어떤 강의, 어떤 방법으로 공부해야 할지는 엄두가 안 난다.
뿐만 아니라 그냥 프로젝트 몇 개 해보자는 식의 온라인 강의들이 판치기 때문에..
정말로 머신러닝 공부를 하고자 하면 그중에 진짜를 가려내기는 쉽지 않다.
그래서 '공부해야지!' 하고 다짐만 하고 미루기를 n년..
이제는 정말 업계에 종사하는 사람으로서, 몰라서는 안 되겠다는 생각이 들기 시작했다.
그렇게 돌고 돌아 결국 찾아낸 결론은..!
"프로젝트를 하나 해보자!"
사실, 프로그래밍 스킬을 가장 빠르게 습득할 수 있는 방법은 프로젝트를 진행하고,
그것을 바탕으로 output을 내보는 경험일 거다..
이게 내가 4년 동안 컴공과에서 내린 결론이다. 컴퓨터 언어도 결국 언어이기 때문에 많이 써봐야 는다.
다행히도 Python이 주 언어이기때문에 기본적인 문법에는 익숙하고,
data를 다루는 것도 어느 정도 할 줄 안다.
그래서 이왕 프로젝트로 진행하는 거,
한 달만에 논문 쓰기에 도전해 보기로 했다.
논문을 그렇게 쉽게 쓸 수 있냐고 묻는다면...
나의 경우에는 몇 가지 모델을 비교해보고 - 이 과정에서 머신러닝에 익숙해지길 바라며..-
그중 가장 좋은 결과 값을 내는 모델을 선택해 결론짓는 식의 소논문을 작성할 거다.
내가 쓰려고 마음먹은 논문은 사실 논문 축에도 못 낀다.
사실은 Kaggle에서 아주 재미있는 데이터 셋을 발견했는데, HR 분석 : 임직원 승진 데이터 이다.
과연 내가 회사에서 승진할 수 있을지도 이 친구가 예측해 줬으면 좋겠다는 마음에서 시작하게 되었다.
해당 데이터셋을 바탕으로 임직원 승진 예측 모델을 만들어 볼 거다.
의사결정 나무 - 랜덤 포레스트 - 신경망 - 로지스틱 회귀분석 - SVM에서 가능하면 군집분석까지.. 를 한번 모델링해보고,
최종적으로는 스태킹 모델로 7~8가지 실험을 거쳐 결론을 지어볼 예정이다.
무슨 이야기인지 하나도 이해 안 되는 게 당연하다.
사실 나도 뭐가 뭔지 하나도 모른다.
그러니까 배우는 거지!
기본적인 개념을 간단하게 정리하고, 실습하는 것을 위주로 아마 블로그 글도 쓰게 될 것 같다.
머리가 비어서 그런가... 왠지 모를 자신감이 차오른다.
대단해 나 자신..!
함 해보자!
'Study > AI' 카테고리의 다른 글
03. 기계학습(머신러닝) 기초2 (0) | 2022.02.07 |
---|---|
02. 기계학습(머신러닝) 기초1 (0) | 2022.02.05 |
01. 데이터 처리 (Numpy, Pandas 기초) (0) | 2022.02.05 |
M1 Mac(Apple Silicon)에서 머신러닝 개발환경 구축하기 (0) | 2022.01.29 |
머신러닝 공부에 유용한 사이트 및 유튜브 추천 (0) | 2022.01.27 |
댓글