본문 바로가기

혼자 공부하는 머신러닝+딥러닝

[혼공 학습단 10기] 혼자 공부하는 머신러닝 + 딥러닝 3주차

 

진도 : Chapter 04

기본 미션: Ch.04(04-1) 2번 문제 풀고, 풀이 과정 설명하기

선택 미션: Ch.04(04-2) 과대적합/과소적합 손코딩 코랩 화면 캡처하기

 


기본 미션

 

 

로지스틱 회귀가 이진 분류에서 확률을 출력하기 위해 사용하는 함수는 무엇인가요?

 

- 시그모이드 함수


 

로지스틱 회귀 (Logistic Regression)

 

로지스틱 회귀는 이름은 회귀이지만 분류 모델이다.

 

선형 회귀는 한 개 이상의 독립 변수 x와 종속변수 y의 선형 관계를 모델링한다. 선형 회귀는 비용함수를 최소화하는 w(가중치, 계수) 와 b(편향, y절편)를 찾고 새로운 데이터 값(연속적인 값)을  예측한다. 

 

선형 회귀

 

 

로지스틱 회귀는 선형회귀와 동일하게 선형 방정식을 학습하지만, 몇 가지 차이점을 지닌다.

로지스틱 함수는  종속 변수에 대한 확률을 추정한 다음,  분류를 실행하기 위해  기본 선형회귀와는 달리 시그모이드 함수를 사용해야 한다.

 

 

로지스틱 회귀

 

 

확률이 되려면 0~1 (0~100%)사이의 값이 되어야 하는데 , 시그모이드 함수의 반환값(y축)은 0과 1사이의 값을 가진다.

이 때 확률이 특정 수준 이상이면 1, 이하면 0으로 분류한다. 0과 1로 분류하기 위해서는 분류 임계값(Classification threshold)이  필요하고 기본 임계값은 0.5 이다.

 

로지스틱 함수(시그모이드 함수)


선택 미션

 

 

 

 

 

 

 

 

 

 

출처

https://ai.plainenglish.io/why-is-logistic-regression-called-regression-if-it-is-a-classification-algorithm-9c2a166e7b74

https://en.wikipedia.org/wiki/Sigmoid_function