분류 전체보기14 Train set - Validation set - Test set 머신러닝에서는 일반적으로 전체 데이터를 training set와 test set으로 나누는 과정을 거칩니다. 전체 데이터를 학습하지 않고 데이터를 나눠 학습하는 이유는 무엇일까요? 이유는 간단합니다. 모델이 overfitting(과적합)되는 것을 막고 머신러닝 알고리즘의 성능을 평가하기 위해서입니다. train set와 달리 test set은 모델 학습에 사용하지 않습니다. 대신 새로운 데이터에 대한 결과를 예측하기 위한 용도로 사용합니다. overfitting은 쉽게 말해 모델이 train data를 과도하게 학습한 것을 의미합니다. 위 그림을 보면 epoch이 증가하면서 training data의 손실 함수(loss function)는 계속해서 떨어지지만 validation data의 손실 함수는 어.. 2022. 7. 16. 머신러닝(Machine Learning)이란? 머신러닝은 인공지능(AI)의 하위 분야로 데이터를 통해 컴퓨터가 스스로 규칙을 찾아내도록 하는 방법입니다. 이러한 규칙을 이용한 머신러닝 기술은 인공지능 관련 제품이나 서비스에 적용되고 있습니다. 인공지능의 대가 Tom Mitchell 교수는 그의 저서 「 Machine Learning 」에서 다음과 같이 정의했습니다. A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, imporves with experience E. '컴퓨터가 어떤 작업(T)을 하는 데 있어서 경험(E)으로부.. 2022. 7. 16. 이전 1 2 3 4 다음