해당 post는 계속해서 이상철교수님의 유튜브강의를 바탕으로 작성되고 있다.
02. 기계학습(머신러닝) 기초 - 이론
기계학습이란
- 인공지능의 한 분야
- 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 의미함
- representation(표현) : 데이터의 평가(규칙)
- generalization(일반화) : 아직 알 수 없는 데이터에 대한 처리 (예측)
기존에는 데이터를 입력하여 정해진 규칙을 따라 해답을 찾을 수 있도록 프로그래밍했지만,
머신러닝은 데이터와 해답을 입력하여 기계가 스스로 학습한 결과에 따라 규칙을 찾을 수 있도록 프로그래밍 하는 것이다.
조금 더 쉽게 이야기하자면, 이미 routine이 정해져 있는 규칙에 따라 input이 들어오면 output을 내는 것이 기존의 방식이었다면,
머신러닝은 규칙이 존재하지 않는다는 의미이다.
그저 data에 따라 컴퓨터가 스스로 학습하여 규칙을 찾아낼 뿐이다.
빅 데이터 시대가 도래하면서 학습할 수 있는 data의 양이 늘어나 이와 같이 컴퓨터가 스스로 학습할 수 있도록 설계가 가능해진 것이다.
어려운 것은 쉽고, 쉬운 것은 어렵다. (모라벡의 역설)
컴퓨터에게 쉬운 것과 사람에게 쉬운 것이 다르다는 의미이다.
컴퓨터가 사람보다 뛰어난 능력은 저장과 계산이다.
이 외의 인지, 지각 등의 분야는 사람이 월등히 뛰어나왔으나, AI가 발전하면서 컴퓨터도 점차적으로 지각하고, 인지할 수 있게 되었다.
때문에 현재의 인공지능, 머신러닝, 딥러닝의 분야는 사람조차 어려운 인지나 지각의 영역에서도 인공지능이 더욱 좋은 성능을 보여주기를 기대하면서 계속해서 발전하고 있는 것이다.
여기서 한 가지 짚고 넘어가자.
- Artificial Intelligence
- 인공지능은 말 그대로 기계를 지능적으로 만드는 것을 의미한다.
- Machine Learnig
- 프로그래밍하지 않고 컴퓨터에게 스스로 학습할 수 있는 능력을 주는 것을 의미하며, 인공지능에 속한 개념이다.
- Deep Learning
- 컴퓨터가 스스로 학습할 수 있게 하기 위해서 심층 신경망(DNN)으로 이루어진 기계학습을 의미하며, 기계학습(머신러닝)에 속한 개념이다.
기계학습이 어떻게 하면 더 잘 분석하고, 정확하게 예측할 수 있는지에 목적이 맞춰져 있었다면, 딥러닝은 인지나 지각의 영역을 넓히는 데에 목적이 있다.
- 컴퓨터가 스스로 학습할 수 있게 하기 위해서 심층 신경망(DNN)으로 이루어진 기계학습을 의미하며, 기계학습(머신러닝)에 속한 개념이다.
분석 방법
머신 러닝의 분석 방법은 3가지로 분류할 수 있다.
- 지도 학습(Supervised Learning)
- 정답을 알 수 있어서 곧바로 피드백을 받으며 학습하는 방법을 의미한다.
- 이미 레이블 된 데이터가 있고, 직접적인 피드백을 줄 수 있으며, 결과가 예측 가능한 경우에 많이 사용하는 방법이다.
- 비지도 학습(Unsupervised Learnig)
- 정답이 없는 '분류'와 같은 문제를 해결하는 학습 방법이다.
- 레이블이나 정확한 타깃이 없고, 피드백도 존재하지 않는다. 컴퓨터가 스스로 데이터에서 숨겨진 구조(규칙)를 찾도록 하는 방법이다.
- 강화 학습(Reinforcement Learning)
- 정답은 모르지만, 해당 행동에 대한 "보상"을 알 수 있어서 이를 기반으로 학습하는 방법이다.
- 보상 시스템을 이용해 연속된 행동에서 학습할 수 있도록 한다.
- 주로 딥러닝에서 많이 사용하는 방식 중 하나로 알파고가 가장 대표적인 예라고 할 수 있다.
data의 특성에 따라 각각의 분류 분석 방법이 더 정확할 지는 알 수 없다.
때문에 다양한 모델을 사용해보며, 가장 정확도가 높은 모델을 선택하는 것이 일반적이다.
또는, 그 중 정확도가 높은 모델들을 앙상블해서 사용한다.
나는 기본적인 분석 모델들을 data에 적용해보고, 이를 앙상블한 모델들로 최종적인 실험을 해 볼 예정이다.
기계 학습 분석 절차
대표적인 기계학습의 분석 절차로는 SAS의 SEMMA가 있다.
- Sampling : 표본 추출
- Exploration : 데이터 탐색
- Modification : 데이터 변환 및 변수 선정
- Modeling : 데이터 모델링
- Assessment : 모형 평가
Python의 기계학습 데이터 분석 절차
각각의 내용을 이상철 교수님께서 다시 세분화 한 내용은 다음과 같다.
'Study > AI' 카테고리의 다른 글
04. 데이터 분석 절차 (0) | 2022.02.07 |
---|---|
03. 기계학습(머신러닝) 기초2 (0) | 2022.02.07 |
01. 데이터 처리 (Numpy, Pandas 기초) (0) | 2022.02.05 |
M1 Mac(Apple Silicon)에서 머신러닝 개발환경 구축하기 (0) | 2022.01.29 |
머신러닝 공부에 유용한 사이트 및 유튜브 추천 (0) | 2022.01.27 |
댓글