본문 바로가기
AI

머신러닝(Machine Learning)이란?

by HYEBINess 2022. 7. 16.

머신러닝은 인공지능(AI)의 하위 분야로 데이터를 통해 컴퓨터가 스스로 규칙을 찾아내도록 하는 방법입니다.

이러한 규칙을 이용한 머신러닝 기술은 인공지능 관련 제품이나 서비스에 적용되고 있습니다.

 

인공지능의 대가 Tom Mitchell 교수는 그의 저서 「 Machine Learning 」에서 다음과 같이 정의했습니다.

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, imporves with experience E.

'컴퓨터가 어떤 작업(T)을 하는 데 있어서 경험(E)으로부터 학습하여 성능에 대한 측정(P)을 향상하는 것'이라고 요약할 수 있습니다.

 

개와 고양이를 사진을 학습시켜 분류하는 프로그램을 예로 들어보겠습니다.

 

* Task(T): 개와 고양이를 분류하는 작업

* Performance(P): 정답을 맞힌 확률

* Experience(E): 정답을 맞힌 경험

 

개와 고양이를 분류하는 프로그램을 개발하여 컴퓨터가 여러 장의 개와 고양이 사진을 학습하도록 합니다. 학습을 완료한 컴퓨터는 이제 학습한 사진이 아닌 새로운 사진을 보고 개인지 고양이인지 알아맞혀야 합니다. 컴퓨터는 35%의 확률로 정답을 맞혔습니다. 성능이 만족스럽지 않아 더 많은 개와 고양이 사진을 가져와 학습합니다. 그리고 다시 테스트를 해본 결과 정답을 맞힌 확률이 80%로 증가했습니다. 

즉, 컴퓨터가 개와 고양이를 분류하는 작업(T)을 하는 데 있어서 정답을 맞힌 경험(E)으로부터 학습하여 정답을 맞힌 확률(P)을 향상시키는 일련의 과정을 머신러닝이라고 할 수 있습니다.

 

"Using data to answer questions"
 

이 프로세스의 핵심 구성 요소는 데이터입니다. 기계 학습이 데이터에 숨겨진 통찰력을 여는 열쇠인 것처럼 데이터는 기계 학습을 여는 열쇠입니다.

데이터가 잘 준비되었고 학습도 제대로 되었는데 모델의 성능이 잘 나오지 않을 경우 성능을 개선할 방법은 무엇일까요?

머신러닝의 성능을 좌우하는 요소 중 하나는 Optimizer입니다. 실제 정답과 모델이 도출한 예측값 사이의 오차를 줄이는 것을 최적화(Optimization)라고 하는데, 최적화를 하기 위한 알고리즘이  Optimizer입니다. 

Optimizer의 종류는 가장 기본적인 경사 하강법(Gradient Descent), 확률적 경사 하강법(Stochastic Gradient Descent) 등 여러 종류가 있습니다. 어떤 최적화 알고리즘을 사용할지는 해결해야 할 문제의 성격과 데이터의 특성 등에 따라 달라집니다.  Optimizer의 종류와 각각의 특징에 대해서는 차근차근 공부하며 포스팅해보도록 하겠습니다:D

 
 
 
 
 
 
 
 
 
 

댓글