본문 바로가기

AI10

Generalization, Normalization, Standardization https Eng https Geralization(일반화): 지도학습에서 generalizaion(일반화)란, 훈련된 모델이 unseen data에 대해 정확하게 분류 또는 예측하도록 하는 것입니다. 즉, train data로 학습한 모델에 새로운 데이터를 넣었을 때 좋은 성능을 내도록 하는 것이 일반화라고 할 수 있겠네요. 결국 '일반화된 모델을 만든다'는 것은 '성능이 좋은 모델을 만든다'는 것과 같은 말입니다. 아래 그림에서 Balanced에 해당하는 그림이 일반화가 잘 된 모델입니다. 우리는 undefitting과 overfitting을 피하고 hyper parameter 튜닝 등을 통해 모델의 성능을 높여 모델의 일반화에 도달할 수 있습니다. Feature Scaling : feature sc.. 2022. 8. 12.
binary & multinomial 분류는 지도학습의 일종으로 데이터의 카테고리 관계를 파악하고, 새로운 데이터의 카테고리를 스스로 판별합니다. 따라서 분류 문제에서는 categorical variables(범주형 변수)이 사용됩니다. 분류는 다시 이진 분류(Binary Classification)와 다중 분류 문제로 나눌 수 있습니다. 먼저 이진분류는 정답 레이블이 정확히 두 클래스 중 하나에 할당되는 task를 말합니다. 예를 들어, 고양이 사진이 입력으로 주어졌을 때 고양이가 맞다면 1, 고양이가 아니라면 0으로 분류하는 것을 예로 들 수 있습니다. 이진 분류모델을 간단한 신경망으로 표현한 그림입니다. 보다시피 출력층이 1개입니다. 이진 분류를 위한 출력은 0-1 사이의 실수값이고, 활성함수로 Sigmoid function을 사용합니.. 2022. 8. 8.
분류(classification), 군집화(clustering), 회귀(regression) # 분류(Classification) 분류(Classification)는 지도 학습의 일종으로 기존에 존재하는 데이터의 관계를 학습하여 새롭게 관측된 데이터에 대한 결과를 스스로 판별하는 과정입니다. 분류는 범주형 변수에 대해 예측할 때 사용합니다. 스팸 문자를 판별하여 스팸 보관함으로 분류하는 것을 예로 들수 있습니다. 이처럼 분류는 "스팸" 또는 "스팸 아님"과 같이 하나 이상의 관측된 데이터를 통해 하나 이상의 값을 예측합니다. # 군집화(clustering) 군집화(clustering)는 주어진 데이터들의 특성을 고려해 같은 그룹(Cluster)을 정의하고, 그룹화하여 그룹의 대표성을 찾아내는 방법입니다. 군집화(clustering)는 구분하려고 하는 각 class에 대한 아무런 정보가 없는 상태.. 2022. 7. 17.
Machine Learning 알고리즘의 분류(지도학습, 비지도학습, 강화학습) 머신러닝 알고리즘은 지도 학습, 비지도 학습, 강화 학습 등으로 분류됩니다. 이들을 분류하는 기준은 학습 데이터의 특징과 사용방법입니다. # 지도 학습 먼저 지도 학습은 인풋과 아웃풋의 정답(label)이 모두 주어진 상태에서 학습하는 방법입니다. 컴퓨터가 입력과 출력과의 관계를 학습하여 새로운 입력에 대한 결과를 예측합니다. 지도 학습으로는 분류와 회귀분석 문제를 다룰 수 있습니다. 분류의 대표적인 예시로 개와 고양이 사진을 구분하는 문제가 있습니다. 정확하게 개, 또는 고양이 레이블이 주어진 사진 데이터셋이 훈련에 사용됩니다. 이 데이터셋으로 개와 고양이를 분류하는 알고리즘을 만드는 것이 머신러닝 학습의 목적입니다. 지도 학습을 완료한 모델은 처음 보는 사진을 입력해도 개와 고양이를 구분해낼 수 있습.. 2022. 7. 17.