machine learning
04 May 2018Machine learning
데이터를 분석해서 모델이나 패턴을 찾는 과정으로, 기계가 학습하여 스스로 동작할 수 있도록 한다. Target class와 traing data의 유무에 따라 Supervised learning과 Unsupervised learning으로 나뉜다.
Supervised learning
주어진 입력 변수(input)에 대해 출력변수(target)의 값을 예측하는 모델을 생성한다. 모델을 생성하는 방식에 따라 parametric과 nonprarmetric으로 나뉜다. parametric은 linear, polynomial model과 같이 모델의 structure만 주어지고 모델의 변수는 데이터에 따라 결정되는 방식을 말한다. nonparametric 모델은 structure가 주어지지 않고, 데이터에 따라 모델이 결정되는 방식으로 decision tree나 knn 등이 있다.
- Classification - 카테고리 분류
- Prediction - 결과값 (수치) 예측
Unsupervised learning
입력 변수 간의 관계를 탐색적으로 분석해서 의미 있는 정보를 추출한다.
- Clustering - 비슷한 애들끼리 묶는다.