머신러닝 학습방법에는 크게 3개의 지도학습, 비지도학습, 강화학습이 있습니다.
지도학습
지도 학습은 입력에 대한 정답이 있는 것을 활용하여 학습 하는 방법이다.
ex) 5+8= 13, 10+10= 20 등을 학습하고, 1+2 ?의 문제를 해결하는 학습 방법이다.
5+8은 데이터(입력값)이며, 13은 라벨(결과값)이라고 부른다.
지도학습에는 분류(Classification)와 회기(Regression)로 또 나뉜다.
분류(Classification)
분류는 데이터를 정해진 카테고리로 분류한다.
분류 중 이진분류와 다중분류가 있습니다.
이진분류 예시
- 스펨 메일인지 일반 메일인지 yes/no로 구분가능한 것
다중분류 예시
- 호랑이인지 고양이인지 강아지인지 2가지 이상으로 구분가능한 것
회귀(Regression)
데이터들의 특징을 기준으로, 그래프를 예측하는 문제를 의미하며, 트렌드나 경향을 예측할 때 사용
ex) A대학교의 1학년의 평균 토익점수, 4학년의 평균 토익점수, B대학교의 1학년의 평균 토익점수, 4학년의 평균 토익점수 등의 데이터와 결과를 주고, C대학교의 4학년의 평균 토익점수를 예측할 수 있습니다.
비지도학습
비지도학습은 정답(라벨)이 없는 입력값(데이터)들을 군집화하여 예측하는 학습하는 방법이다.
정답이 없기에 데이터로부터 패턴 및 특징을 찾아야 하기때문에 난이도가 있다.
대표적으로 클러스터링이 있습니다. 예를 들어 동물들의 사진들을 나열하고, 어떤동물인지에 대해서는 알려주지 않았기에, 다리가 4개인 동물, 2개인 동물 이런씩으로 분류를 하여 학습을 하는 것이다.
강화학습
강화학습은 자신이 한 행동에 대해 보상을 받으며 학습하는 방법이다.
강화학습은 에이전트, 환경, 상태, 행동, 보상의 개념을 사용한다.
예를 들면, 자율주행에 강화학습을 시키면 다양한 방법으로 목적지로 가는 연습을 해서 상황에 맞게 최적의 경로로 가게 될 것이다.
그리고 강화학습은 디지털 트윈에서 적용을 해야하기에 주목할 필요가 있다.