Study/AI

02. 기계학습(머신러닝) 기초1

Dream Amal 2022. 2. 5.

해당 post는 계속해서 이상철교수님의 유튜브강의를 바탕으로 작성되고 있다.


02. 기계학습(머신러닝) 기초 - 이론

기계학습이란

  • 인공지능의 한 분야
  • 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 의미함
  • representation(표현) : 데이터의 평가(규칙)
  • generalization(일반화) : 아직 알 수 없는 데이터에 대한 처리 (예측)

기존에는 데이터를 입력하여 정해진 규칙을 따라 해답을 찾을 수 있도록 프로그래밍했지만,
머신러닝은 데이터와 해답을 입력하여 기계가 스스로 학습한 결과에 따라 규칙을 찾을 수 있도록 프로그래밍 하는 것이다.

조금 더 쉽게 이야기하자면, 이미 routine이 정해져 있는 규칙에 따라 input이 들어오면 output을 내는 것이 기존의 방식이었다면,
머신러닝은 규칙이 존재하지 않는다는 의미이다.
그저 data에 따라 컴퓨터가 스스로 학습하여 규칙을 찾아낼 뿐이다.
빅 데이터 시대가 도래하면서 학습할 수 있는 data의 양이 늘어나 이와 같이 컴퓨터가 스스로 학습할 수 있도록 설계가 가능해진 것이다.

어려운 것은 쉽고, 쉬운 것은 어렵다. (모라벡의 역설)

컴퓨터에게 쉬운 것과 사람에게 쉬운 것이 다르다는 의미이다.
컴퓨터가 사람보다 뛰어난 능력은 저장계산이다.
이 외의 인지, 지각 등의 분야는 사람이 월등히 뛰어나왔으나, AI가 발전하면서 컴퓨터도 점차적으로 지각하고, 인지할 수 있게 되었다.
때문에 현재의 인공지능, 머신러닝, 딥러닝의 분야는 사람조차 어려운 인지나 지각의 영역에서도 인공지능이 더욱 좋은 성능을 보여주기를 기대하면서 계속해서 발전하고 있는 것이다.

여기서 한 가지 짚고 넘어가자.

기계학습이란

  • Artificial Intelligence
    • 인공지능은 말 그대로 기계를 지능적으로 만드는 것을 의미한다.
  • Machine Learnig
    • 프로그래밍하지 않고 컴퓨터에게 스스로 학습할 수 있는 능력을 주는 것을 의미하며, 인공지능에 속한 개념이다.
  • Deep Learning
    • 컴퓨터가 스스로 학습할 수 있게 하기 위해서 심층 신경망(DNN)으로 이루어진 기계학습을 의미하며, 기계학습(머신러닝)에 속한 개념이다.
      기계학습이 어떻게 하면 더 잘 분석하고, 정확하게 예측할 수 있는지에 목적이 맞춰져 있었다면, 딥러닝은 인지나 지각의 영역을 넓히는 데에 목적이 있다.

분석 방법

머신 러닝의 분석 방법은 3가지로 분류할 수 있다.

  1. 지도 학습(Supervised Learning)
    • 정답을 알 수 있어서 곧바로 피드백을 받으며 학습하는 방법을 의미한다.
    • 이미 레이블 된 데이터가 있고, 직접적인 피드백을 줄 수 있으며, 결과가 예측 가능한 경우에 많이 사용하는 방법이다.
  2. 비지도 학습(Unsupervised Learnig)
    • 정답이 없는 '분류'와 같은 문제를 해결하는 학습 방법이다.
    • 레이블이나 정확한 타깃이 없고, 피드백도 존재하지 않는다. 컴퓨터가 스스로 데이터에서 숨겨진 구조(규칙)를 찾도록 하는 방법이다.
  3. 강화 학습(Reinforcement Learning)
    • 정답은 모르지만, 해당 행동에 대한 "보상"을 알 수 있어서 이를 기반으로 학습하는 방법이다.
    • 보상 시스템을 이용해 연속된 행동에서 학습할 수 있도록 한다.
    • 주로 딥러닝에서 많이 사용하는 방식 중 하나로 알파고가 가장 대표적인 예라고 할 수 있다.

data의 특성에 따라 각각의 분류 분석 방법이 더 정확할 지는 알 수 없다.
때문에 다양한 모델을 사용해보며, 가장 정확도가 높은 모델을 선택하는 것이 일반적이다.
또는, 그 중 정확도가 높은 모델들을 앙상블해서 사용한다.

나는 기본적인 분석 모델들을 data에 적용해보고, 이를 앙상블한 모델들로 최종적인 실험을 해 볼 예정이다.

기계 학습 분석 절차

대표적인 기계학습의 분석 절차로는 SAS의 SEMMA가 있다.

  1. Sampling : 표본 추출
  2. Exploration : 데이터 탐색
  3. Modification : 데이터 변환 및 변수 선정
  4. Modeling : 데이터 모델링
  5. Assessment : 모형 평가

Python의 기계학습 데이터 분석 절차

python의 데이터 분석 절차

각각의 내용을 이상철 교수님께서 다시 세분화 한 내용은 다음과 같다.

세분화

 

728x90

댓글