[OSAM] 2. Training set과 Test set, Overfitting과 Underfitting
Supervised learning : 입력값에 대한 정답을 가지고 연관관계를 찾도록 학습시킨다. 학습 데이터를 Training set과 Test set으로 나누어 이용함에 따라 Training set에서의 overfitting을 방지한다. 학습을 계속 시킬수록 Training set의 정확도는 계속해서 증가할 것이다. 그러나 필요 이상으로 학습되어 Overfitting 될 경우 Test set에서의 정확도는 점점 떨어진다. 대개 Training set : Test set = 8:2 또는 9:1 정도로 한다. 데이터를 Training set과 Test set으로 나눠 사용하면 Test set에 과적합(overfitting) 될 수 있기 때문에 Validation set을 또 나누어 이용하여 모델들의 적정..
2020.08.03