
로지스틱 회귀, 이진 분류(Binary Classification)
·
머신러닝
로지스틱 회귀를 이용해서 이진 분류하는 모델을 만들 수 있다. 선형회귀와 이진분류 모델의 다른 점은 Output y에 있다. 선형 회귀에서 y는 실수 값이다. 즉 무수히 많은데, 이진 분류에서는 y = { 0 ,1 } 이다. 따라서 선형 회귀에서 모델에 input X를 넣어서 y가 output으로 나올 기댓값을 구한다. 하지만 이진 분류에서는 모델에 input X를 넣을 때 y가 발생할 확률을 구한다. 이러한 확률을 바탕으로 y가 0인지, 1인지를 판단하는 것이 이진분류이다. 만약 확률이 50%이상이라면 그것을 1로 판단하고 50%미만이라면 그것을 0으로 판단한다. x가 2차원 벡터일 때 파란색, 빨간색으로 데이터를 표현할 수 있다면 이진분류를 통해 데이터들을 분류할 수 있다. 그림으로 표현하면 초록색으..