스터디/ML, DL

[ML] 회귀 알고리즘 : 선형 회귀 (1)

sollllllll 2022. 3. 3. 23:50

머신러닝 알고리즘에는 지도 학습 알고리즘과 비지도 학습 알고리즘이 있다.

지도 학습은 훈련을 위한 데이터와 정답이 필요하고, 비지도 학습은 정답이 없고 대신 비슷한 데이터끼리 묶는다.

지도 학습은 또 다시 분류와 회귀로 나뉘는데 데이터를 여러 옵션 중 하나로 선택/결정하는 것이 분류, 데이터를 통해 임의의 어떤 값을 예측하는 것이 회귀이다.

 

 

여러 회귀 알고리즘 중 이번 포스트에서는 선형 회귀 알고리즘에 대해 다뤄보려고 한다.

 

선형 회귀는 대표적인 회귀 알고리즘으로, 여러 곳에서 널리 사용되고 있다.

단어 그대로 데이터의 특성이 하나인 경우 특성을 가장 잘 나타낼 수 있는 어떠한 직선에 대해 학습하는 알고리즘이다.

 

(전처리한)데이터를 그래프로 나타내면 그 데이터의 특성이 하나일 때 분포에 따라 어떠한 선이 생기는 것을 볼 수 있다.

선형 회귀 알고리즘은 바로 그 선을 그리도록 학습하는 것이다.

직선을 그리기 위해서는 여러 방법이 있지만 직선을 구성하는 요소에는 그 직선의 기울기와 (y)절편이 있고,

머신러닝에서는 이 기울기를 계수(coefficient) 혹은 가중치(weight)라고 하기도 한다.

 

파이썬의 사이킷런(sklearn)에는 선형 회귀 알고리즘을 구현해놓은 LinearRegression 클래스가 있기 때문에 쉽게 데이터를 가지고 훈련해 볼 수 있다.

LinearRegression 클래스의 fit() 메소드는 훈련, score() 메소드는 평가, predict() 메소드는 예측하는 메소드이다.

 

그리고 훈련이 끝나면 알고리즘은 훈련을 통해 얻은 최적값을 찾게 되는데 그 값을 모델 파라미터라고 한다.

선형 회귀 알고리즘에서는 기울기와 절편을 찾아야 하니 모델 파라미터 값은 기울기와 절편 값이 될 것이다.

 

 

( 데이터로 실습해 본 결과 추가할 예정 )

 

 

이번 포스트에서는 회귀 알고리즘 중 선형 회귀 알고리즘에 대해 공부해보았다.

 

 

 

참고: 「혼자 공부하는 머신러닝+딥러닝」, 한빛미디어, 박해선 (2020)

 

 

'스터디 > ML, DL' 카테고리의 다른 글

[LLM] LangChain이란?  (0) 2025.01.27
[ML] 로지스틱 회귀  (0) 2022.03.19
[ML] 회귀 알고리즘 : 선형 회귀 (2) - 다중 회귀  (0) 2022.03.14
[CV] CNN, 합성곱 연산, 패딩, 풀링  (0) 2020.02.01
[CV] 퍼셉트론, 신경망  (0) 2020.01.11