머신러닝을 크게 3가지로 나눌 수 있다고 하였는데요, 첫째로 설명드렸던 지도학습 기억나시나요?
지도학습이란, 주로 과거 데이터 기반으로 미래를 예측하는 것입니다.

이때, 대표적으로 가장 많이 사용되는 방법이 선형 회귀, 영어로는 lInear regression이라고 합니다.


선형회귀란, 변수 사이의 관계를 선으로 모델링 하는 것입니다.

선형(linear)이라는 말에 알 수 있듯이, 직선적이라는 말입니다.

 

예로 들어, 우리는 온도 변화에 따른, 에어컨 판매량을 다음과 같다고 가정해봅시다. 그렇다면 우리는 이러한 데이터들을 2차원 평면 그래프로 나타낼 수 있습니다.

 

오른쪽 그래프처럼 2차원의 형태로 나타낼 수 있는데요!

그래프에 하나의 선을 그려서, 저 점들을 대표하는 선을 그을 수 있을 것입니다.

 

 

실제로 컴퓨터가 (점들을 대표하는) 하나의 직선을 찾는 과정을 살펴 보도록 하겠습니다.

먼저 컴퓨터는 임의로 선을(하늘색 선) 그린 후, 선을 수정해(해당점들에 가깝게 이동) 가면서...

최종적으로, 해당점들을 대표할 수 있는 선(빨간색 선)을 그렸습니다.

 

2차원 평면에서는 무한한 선을 그을 수 있겠지만, 이 선들 중에서 해당 데이터들을 대표하는 선은 하나일 것입니다.

 

이처럼 데이터들을 대표하는 선을 찾는 과정을 선형 회귀라고 합니다.

 

대표하는 선을 그을 수 있다면, 우리는 온도가 36도일 때, 판매량을 유추 가능하겠죠?!

 

결국, 선형 회귀를 이용한다면, 과거 데이터 기반으로 미래를 예측할 수 있습니다.


그럼 머신러닝과 선형 회귀와 어떻게 연결할 수 있을까요?


그것은 바로, 직선 그리는 방법을 머신(컴퓨터)에게 알려 주어 (데이터들을 대표하는) 합리적인 직선을 찾도록 하는 것입니다.

그렇다면, 컴퓨터는 선을 어떻게 그리며(1) 또한, 그 선이 얼마나 합리적인지(2)를 판단할 수 있는 방법에 대해서 알아보도록 하겠습니다.

 

* (1). 머신러닝에서 선을 그리는 방법가설이라고 표현을 하며,

   (2). 얼마나 합리적인지 판단하는 것을 비용이라고 표현 합니다.

반응형

+ Recent posts