
Suport Vector Machine(SVM, 서포트 벡터 머신), 최대 마진 분류
·
머신러닝
SVM는 Binanry Classiciation(이진분류) 상황에서 사용한다. 서포트 벡터 머신은 결정 경계와 가장 가까운 샘플(서포트 벡터)까지의 거리(마진)을 구해서 샘플을 분류하는 모델이다. 마진(결정경계와 데이터까지의 거리)을 최대화하는 결정경계를 찾는 것이 목적이다. 하지만 마진이 무작정 크다고 해서 좋은 결정경계를 얻는 것은 아니다. 마진이 크면 일반화 오차가 작아지고 마진이 작으면 과대적합 가능성이 높아진다. 초평면 : 벡터 공간에서 샘플을 나누는 평면 위 그림에서는 서포트 벡터 주위를 지나가는 굵은 선 양성 쪽 초평면과 음성 쪽 초평면 사이의 거리가 마진이다. 그림의 왼쪽의 두 식을 빼고 w의 길이로 나눠주면 마진의 크기를 얻을 수 있는데 (오른쪽 식) 마진의 크기를 최대화 하는게 목적이다..