머신러닝에서 선을 그리는 방법을 가설(Hypothesis)이라고 표현한다 하였는데요..
선형 회귀와 머신러닝을 어떻게 결합하는지... 즉, 컴퓨터가 하나의 선을 어떻게 그릴 수 있는지 알아보도록 하겠습니다.
먼저, 우리가 직선을 그리는 방법을 떠올려 보겠습니다.
중학교 때, 배우는 수학에서 1차 방정식(y =ax + b) 은 직선을 그리는 선형 방정식입니다.
여기서, a는 기울기이고, b는 y축을 통과하는(=직선을 이동하는) y절편입니다.
만약, 기울기 a를 2, y절편 b에 2를 대입한다면 (y=2x + 2), 다음과 같은 직선을 그릴 수 있을 것입니다.
만약 양수 a의 값을 큰 값으로 선택하게 된다면 어떻게 될까요?
그러면 직선은 가파르게(빨강선 y=4x+2) 상승할 것이고, 반대로 작아지면 완만하게(파랑선 y=1x+2) 상승할 것입니다.
음수 값을 선택하면 직선은 하향할(초록선 y=-1x+2) 것입니다.
이처럼, a 값에 따라 직선이 갖는 상대적 비중을 알 수 있기 때문에...
이를 weight(가중치)라고 표현할 수 있습니다.
또한, a의 값은 같고 b의 값만 달라진다면 그래프는 다음과 같이 대칭 이동이 될 것입니다.
즉, b의 값이 달라진다면 어느 쪽으로 치우쳐져 있는지 알 수 있기 때문에...
이를 bias(편향)이라고 표현할 수 있습니다.
위에 내용들로, 1차 방정식 기반으로 새로운 가설식을 만들어 보도록 하겠습니다.
정답을 뜻하는 y는 → Hypothesis(가설) 약자를 따서 H,
기울기 a는 → weight(가중치)의 w,
y절편 b는 → bias(편향)의 b
y = ax + b
h = wx + b
우리는 컴퓨터에게 1차 방정식을 정의해주고, 컴퓨터가 w와 b에 임의의 숫자를 고르게 한다면..
이것은 다시 말해, 컴퓨터가 하나의 선을 그리는 것으로 해석할 수 있습니다.
이제는, 컴퓨터가 선을 그리는 방법을 알았으니...
컴퓨터가 스스로 w와 b 변수에 여러 가지 숫자를 넣고 변경하여 가장 합리적인 식을 만들게 하면 됩니다.
다음 포스팅에서, 컴퓨터가 어떠한 식이 가장 합리적인 식인가? 를 판단할 수 있는 비용에 대해서 알아보겠습니다.
'AI > Machine Learning' 카테고리의 다른 글
머신 러닝 - 다중 선형 회귀(Multi Variable Linear Regression) (0) | 2021.01.02 |
---|---|
머신 러닝 - 선형 회귀(4)_학습률(Learning Rate) (0) | 2021.01.02 |
머신 러닝 - 선형 회귀(3)_경사하강(Gradient Descent) (0) | 2021.01.02 |
머신 러닝 - 선형 회귀(2)_비용(cost / loss) (0) | 2021.01.02 |
머신 러닝 - 선형 회귀(Linear Regression) (0) | 2021.01.02 |