[텐서플로우로 시작하는 딥러닝 기초] Lec 02: Simple Linear Regression

2020. 8. 4. 22:08머신러닝

OSAM 강의에서 이 강의로 넘어오게 된 이유는 아래 글에..

2020/08/03 - [AI] - [OSAM] 2. Training set과 Test set, Overfitting과 Underfitting


 

Regression

Regression 은 정확하게 "Regression toward the mean" - Sir Francis Galton (1822~1911) : 어떤 데이타들이 크거나 작거나 하는 값들이 나와도 전체의 평균으로 회귀하려는 특징이 있다는 의미로 통계적 원리를 의미한다.

 

Linear Regression

한 마디로 데이타를 가장 잘 대변하는 직선의 방정식을 찾는 것.

대표적인 예시로는 Predicting exam score : regression. 공부한 시간과 점수의 상관관계가 있겠다. 현실에서는 안 통하는 경우가..

 

x y
1 1
2 2
3 3

이러한 데이터가 있다고 하자. 이 데이터를 가장 잘 대변하는 직선의 방정식을 가정해보자. H(x) = Wx + b (W는 Weight, b는 bias)

우리의 가설이 데이터들을 잘 대변할 수 있도록 하기위해 선(가설,H(x))과 점(데이터)의 차이(H(x)-y)를 Cost 또는 loss, error 라고 한다.

그런데 이러한 cost는 부분에 따라 양수 또는 음수로 나타나기 때문에 이 값들을 제곱하여 사용한다. 따라서 비용함수는 아래와 같은 오차 제곱의 평균 형태가 될 것이다.

우리의 목표는 이 cost를 최소화 시키는 것이다. Goal : minimize cost(W,b)

 

출처 : https://www.edwith.org/boostcourse-dl-tensorflow/