지금까지 머신러닝에 가장 기본이 되는 선형회귀에 대해서 알아보았습니다.

 

선형 회귀를 설명할 때, 온도에 따른 에어컨 판매량을 예로 들었지만....

사실 에어컨의 판매량은 온도만의 영향만을 받지는 않았을 것입니다.

 

온도뿐만 아니라 습도, 할인율, 프로모션 진행 여부 등...

하나의 변수가 아닌 여러 가지 변수가 있을 수 있습니다.

 

이처럼, 하나의 변수가 아닌 두 개 이상의 변수들을 선형 모델링하는 것을 다중 선형 회귀라고 합니다.

 

기존의 선형 회귀 (기온/에어컨) 예시 데이터에..

하나의 변수 "프로모션 여부" 데이터를 추가하여 판매량을 확인해보도록 하겠습니다.

 

그렇다면, 우리는 기존의 선형 회귀의 가설식(Hypothesis) 및 비용(cost) 함수도 달라져야 할 것입니다.

 

기존의 선형 회귀의 가설식을 살펴보면...

하나의 변수 x와 가중치 w만이 존재하였는데, 여기에 새로운 변수 x와 가중치 w를 추가해보도록 하겠습니다.

 

이처럼, 변수 x와 그 변수에 따른 가중치 w들을 새로 추가해주면 됩니다.

그렇다면, 변수가 n개가 생긴다고 가정하여 새로운 정규식으로 표현한다면,

이렇게 표현할 수 있습니다.

 

가설식에 바뀜에 따라 우리는 cost를 구하는 공식도 바뀌게 될 것입니다.

 

기존 선형 회귀의 cost를 구하는 식은,

이렇게 구할 수 있었습니다.

 

그럼 변수가 두 개 일 땐...

이렇게 표현할 수 있고, 이것도 정규식으로 표현하면, 

다음과 같습니다.

반응형

+ Recent posts