머신러닝에서 선을 그리는 방법을 가설(Hypothesis)이라고 표현한다 하였는데요..

선형 회귀와 머신러닝을 어떻게 결합하는지... 즉, 컴퓨터가 하나의 선을 어떻게 그릴 수 있는지 알아보도록 하겠습니다.

 

먼저, 우리가 직선을 그리는 방법을 떠올려 보겠습니다.

 

중학교 때, 배우는 수학에서 1차 방정식(y =ax + b) 은 직선을 그리는 선형 방정식입니다.

여기서, a는 기울기이고, b는 y축을 통과하는(=직선을 이동하는) y절편입니다.

 

만약, 기울기 a를 2, y절편 b에 2를 대입한다면 (y=2x + 2), 다음과 같은 직선을 그릴 수 있을 것입니다.

 

 

만약 양수 a의 값을 큰 값으로 선택하게 된다면 어떻게 될까요?

그러면 직선은 가파르게(빨강선 y=4x+2) 상승할 것이고, 반대로 작아지면 완만하게(파랑선 y=1x+2) 상승할 것입니다.

음수 값을 선택하면 직선은 하향할(초록선 y=-1x+2) 것입니다.

 

이처럼, a 값에 따라 직선이 갖는 상대적 비중을 알 수 있기 때문에...

이를 weight(가중치)라고 표현할 수 있습니다.

 

또한, a의 값은 같고 b의 값만 달라진다면 그래프는 다음과 같이 대칭 이동이 될 것입니다.

 

즉, b의 값이 달라진다면 어느 쪽으로 치우쳐져 있는지 알 수 있기 때문에...

이를 bias(편향)이라고 표현할 수 있습니다.

 

위에 내용들로, 1차 방정식 기반으로 새로운 가설식을 만들어 보도록 하겠습니다.

 

정답을 뜻하는 y는 → Hypothesis(가설) 약자를 따서 H,

           기울기 a→ weight(가중치)의 w,

            y절편 b→ bias(편향)의 b

 

y = ax + b

h = wx + b

 

우리는 컴퓨터에게 1차 방정식을 정의해주고, 컴퓨터가 w와 b에 임의의 숫자를 고르게 한다면..

이것은 다시 말해, 컴퓨터가 하나의 선을 그리는 것으로 해석할 수 있습니다.

 

이제는, 컴퓨터가 선을 그리는 방법을 알았으니...

컴퓨터가 스스로 w와 b 변수에 여러 가지 숫자를 넣고 변경하여 가장 합리적인 식을 만들게 하면 됩니다.

 

다음 포스팅에서, 컴퓨터가 어떠한 식이 가장 합리적인 식인가? 를 판단할 수 있는 비용에 대해서 알아보겠습니다.

반응형

+ Recent posts