2020. 8. 4. 22:08ㆍ머신러닝
OSAM 강의에서 이 강의로 넘어오게 된 이유는 아래 글에..
2020/08/03 - [AI] - [OSAM] 2. Training set과 Test set, Overfitting과 Underfitting
Regression
Regression 은 정확하게 "Regression toward the mean" - Sir Francis Galton (1822~1911) : 어떤 데이타들이 크거나 작거나 하는 값들이 나와도 전체의 평균으로 회귀하려는 특징이 있다는 의미로 통계적 원리를 의미한다.
Linear Regression
한 마디로 데이타를 가장 잘 대변하는 직선의 방정식을 찾는 것.
대표적인 예시로는 Predicting exam score : regression. 공부한 시간과 점수의 상관관계가 있겠다. 현실에서는 안 통하는 경우가..
x | y |
1 | 1 |
2 | 2 |
3 | 3 |
이러한 데이터가 있다고 하자. 이 데이터를 가장 잘 대변하는 직선의 방정식을 가정해보자. H(x) = Wx + b (W는 Weight, b는 bias)
우리의 가설이 데이터들을 잘 대변할 수 있도록 하기위해 선(가설,H(x))과 점(데이터)의 차이(H(x)-y)를 Cost 또는 loss, error 라고 한다.
그런데 이러한 cost는 부분에 따라 양수 또는 음수로 나타나기 때문에 이 값들을 제곱하여 사용한다. 따라서 비용함수는 아래와 같은 오차 제곱의 평균 형태가 될 것이다.
우리의 목표는 이 cost를 최소화 시키는 것이다. Goal : minimize cost(W,b)