본문 바로가기
개인 프로젝트/대학원 수업 정리

기계학습특론_3주차

by 응_비 2026. 3. 19.

3주차_단순선형회귀의개념_회귀모델의손실함수_학습방법.pdf
1.27MB

 

 

회귀와 분류 문제

- 회귀 : 가까운 정도(거리)를 색깔로 표현함.

- 분류 : 물체의 종류별로 다른 색깔로 표현함.

 

집값 예측 -> 관계, 예측

집값과 집 크기의 관계는 어떻게 되는가?

 

< 데이터셋 > -> 시험문제 나옴. 반드시 잘 기억하기!

훈련데이터 - 첫번째 학습하는 데이터

검증데이터 - 유사하지만 다른 데이터로 학습

테스트데이터 - 시험장에 가서 시험 보는 것처럼 아예 학습하지 않은 데이터를 테스트

External dataset

대학원에서 위의 4부분에 대해서는 다 검증하는 노력이 필요함.

 

회귀의 목적 

회귀에서의 학습

- 입력값이 주어졌을 때, 적합한 출력값을 내는 함수를 찾는 과정,

- 독립변수와 종속변수 간의 관계를 표현하는 함수를 찾는 과정

 

상관관계는 인과관계와 같지 않음. -> (통계) 인과관계로 인해 학습하는 연구분야가 많이 등장하기 시작함.

p-value값이 필요함.

기계학습을 진행할 때 p-value 값이 없으면 쓸 수 없음. (유의확률)

상한과 하한

 

단순 선형 회귀

y = ax + b

y = w1x + w0 (가중치) -> 공부할 파라미터값

* 오차를 잡는 손실, 비용함수 -> 예측에 맞는 Loss Function을 사용해야함 (MSE, MEAN)

 

비용함수에서 오차를 줄이는 방향으로 공부가 되도록 할 것.

편미분 -> 알파(변화량)

* 학습률 : Learning Rate -> 알파

 

문제

w1 = 0.1

w0 = 0.2

x = 180

y = 78 (Ground Truth, GT, 정답)

y = w1x + w0

 

Linear Regression

Model Prediciton (모델예측값)  = 0.1x180 + 0.2

 

오차 계산하는 법 -> Loss Function(손실, 비용, 목적함수)

MSE(Mean Square Error) = Loss 계산됨.

Loss 혹은 모델 예측값 계산할 줄 알아야 함.

 

오차에 대한 제곱합

최적화 낼 수 있는 값을 찾기 위한 과정

w0, w1 -> 파라미터(매개변수)

Loss -> 둘의 오차

평가지표(테스트 데이터에 대한 정확도)와 손실함수(모델 학습시 오차를 다룸)는 다르다.

 

w* = argmin L(W)

Loss가 최소가 될 수 있도록 

둘 다 MSE 손실함수를 사용함.

예측 - > 제곱 또는 절댓값 - > 음수가 나올 수 없음

평균 제곱 오차

평균 절대 오차

 

 

* 경사하강법 -> 손실함수가 주어졌을 때, w* = argmin L(w) 찾는 것이 목표.

Loss가 감소하는 방향으로 반복적으로 업데이트 함.

 

< 중요 > 

1) w는 어디에서 시작하는가? -> 초기화

2) 어느 방향으로 w를 업데이트 하는가? -> 기울기

3) w를 업데이트 할 때, 얼만큼 움직이는가? -> 학습률

 

MSE 수식 중요

이게 제일 중요!

오차와 데이터값의 가중치가 바뀜 -> 다중선형 회귀에서 끝의 xij가 살아남음

좋은 인풋이 들어가야지만 좋은 xij가 나옴.

 

학습해야 할 데이터 w0, w1

Loss Function 계산

경사하강법 계산시 큰 차이 (다중선형회귀 vs 단순선형회귀)

 

단순선형회귀가 성능이 잘 나오는 경우가 많이 있음.

'개인 프로젝트 > 대학원 수업 정리' 카테고리의 다른 글

기계학습특론 6주차  (0) 2026.04.09
기계학습특론_4주  (0) 2026.03.26
기계학습특론 2주차 정리  (0) 2026.03.12
[CV] 기말고사 정리  (0) 2025.12.03
[CV] Classification, Segmentation  (0) 2025.12.02

댓글