[OSAM] 2. Training set과 Test set, Overfitting과 Underfitting

2020. 8. 3. 21:40머신러닝

Supervised learning : 입력값에 대한 정답을 가지고 연관관계를 찾도록 학습시킨다. 

Supervised learning

학습 데이터를 Training set과 Test set으로 나누어 이용함에 따라 Training set에서의 overfitting을 방지한다. 학습을 계속 시킬수록 Training set의 정확도는 계속해서 증가할 것이다. 그러나 필요 이상으로 학습되어 Overfitting 될 경우 Test set에서의 정확도는 점점 떨어진다. 대개 Training set : Test set = 8:2 또는 9:1 정도로 한다.

데이터를 Training set과 Test set으로 나눠 사용하면 Test set에 과적합(overfitting) 될 수 있기 때문에 Validation set을 또 나누어 이용하여 모델들의 적정 수준을 결정하는데 이용할 수 있다. Test set은 Training set과 Validation set에서 완전히 분리해 놓아야 한다. 

 

이 강의는 구글의 Colab을 이용하여 진행하는데... 구글에 로그인 하려면 핸드폰인증이 필요하다.. 연등할 때는 못한다는 뜻.. 그래서 edwith의

[부스트코스] 텐서플로우로 시작하는 딥러닝 기초

 

[부스트코스] 텐서플로우로 시작하는 딥러닝 기초 강좌소개 : edwith

- 부스트코스

www.edwith.org

이 강의로 넘어가려고 한다. 구름 IDE를 이용해 tensorflow를 해보려 한다.