• 로지스틱 회귀 logistic regression

    2022. 6. 14.

    by. haong_

    이진 분류 시 사용하는 회귀 알고리즘.
    각 피쳐들의 계수 log-odds 를 수한 후 시그모이드 함수를 적용하여 확률을 0~1 값으로 나타내서 분류 작업을 한다. 

    시그모이드 함수

    출력결과가 항상 0에서 1사이 값이 되는 s 커브 함수
    $$ y=\cfrac{1}{1+e^{-x}} $$

    승산(Odds)

    사건 A가 발생하지 않을 확률 대비 일어날 확률의 비율
    Odds = P(A) / 1 - P(A)
    P(A)가 1에 가까울수록 odds비는 양의 무한대로 발산, P(A)가 0이라면 0 (지수함수 그래프 같은 형태)

    이항 로지스틱 회귀

    분류문제를 풀기위해 연속형 변수인 y를 확률로 두고 식을 세워보기

    • 확률은 0~1 범위이나 회귀식은 음의 무한대에서 양의 무한대 범위를 가지기 때문에 식이 성립하지 않음
    • 확률을 승산(odds)으로 설정 후 로그를 취함 (로그 오즈 = logit(p))
    • 음의 무한대에서 양의 무한대로 범위가 변경되서 식 성립 > 시그모이드 함수!
    • 직선을 시그모이드 함수로 곡선으로 변형 후 다시 logit으로 직선으로 변형

    x 값 입력시 범주 1에 속할 확률을 반환 해주므로 이진 분류에 사용

    '머신러닝' 카테고리의 다른 글

    랜덤 포레스트 Random forest  (0) 2022.06.14
    결정 트리 Decision Tree  (0) 2022.06.14
    L1, L2 Regularization  (0) 2022.06.14
    회귀 Regression  (0) 2022.06.14
    분류 Classification  (0) 2022.06.14

    댓글