반응형
위 그림에서 빨간색 X가 데이터라고 할 때 데이터를 가장 잘 설명하는 정규분포는 세 가지 중에 파란색(2번) 정규분포이다. 이처럼 데이터를 가장 잘 설명하는 확률을 가진 정규분포를 찾아가면서 적절한 모델을 찾는 것이 최대가능도 방법이다.
선형적인 모델일 때 타겟 함수 Yn은 다음과 같이 쓸 수 있다. 여기에서 En을 가우시안 노이즈라고 한다.
likelihood = 가능도 = Parametrized distribution = P(Yn|Xn) = X(입력)이 주어졌을 때 Y(타겟)이 일어날 확률의 최댓값
즉 가능도를 최대로 높이는 가중치W를 찾는 것이 목적이다.
가중치는 일어날 확률을 모두 곱한 것이기 때문에 쉽게 계산하기 위해 로그를 붙여서 합으로 나타낸다. 계산하면 최소제곱법에서 나온 비용함수 J를 찾을 수 있는데 가능도(likelihood)를 최대화하는 가중치를 찾기위해서는 J가 최소가 되어야한다.
따라서 최대가능도방법은 최소제곱법(Least square)과 같은 방법임을 알 수 있다.
반응형
'머신러닝' 카테고리의 다른 글
Ridge regression, 교차검증(cross validation) (1) | 2023.01.18 |
---|---|
규제(Regularization), 과대적합(Overfitting)의 의미 (0) | 2023.01.17 |
선형회귀 - Linear Regression (3) | 2023.01.13 |
커널 SVM으로 비선형적 데이터 분류 (0) | 2022.11.20 |
로지스틱 회귀 Logistic Regression (0) | 2022.11.17 |