본문 바로가기

RMSE2

건물 에너지 효율 예제(2) - 모델 학습 소개이전 글에 이어 건물의 Energy Efficiency 데이터셋을 가지고 머신러닝 실습을 하고자 한다.여러 모델을 학습시켜보고 그 결과를 확인해 볼 것이다. 최상의 결과를 내기보다는 각 모델별 어떤 특징이 있는지 알아보는 정도로 하고자 한다.데이터 분할다음과 같은 일반적으로 사용되는 비율로 데이터를 나눴다. 학습 데이터(70%, 536샘플) : 모델 학습용검증 데이터(15%, 116샘플) : 하이퍼파라미터 튜닝 및 모델 선택용테스트 데이터(15%, 116샘플) : 최종 모델 성능 평가데이터가 그렇게 크지 않기 때문에 검증과 테스트 데이터를 너무 줄이면 신뢰도가 낮아질 우려가 있다.분할 결과는 다음과 같다. Heating Load 평균 Cooling Load 평균Heating Load 표준편차Cool.. 2025. 6. 21.
회귀, 분류 모델 평가 기준 소개머신러닝에서 회귀 및 분류 모델을 학습시킨 후 이게 잘 예측을 하는 건지 어떻게 판단할까?당연하겠지만 마치 우리 수능 성적처럼 숫자로 점수를 매기는 방법이 여럿 고안되어 있다.내가 쓰기 위해서 잘 사용되는 것 위주로 적당히 찾아 정리해 보았다.1. 회귀 모델 평가 기준회귀 모델은 연속적인 값을 예측한다. 따라서 예측값과 실제값 간의 차이를 정량화하는 지표를 주로 사용한다. MAE (Mean Absolute Error, 평균 절대 오차)$$ \text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i| $$($ y_i $는 실제값, $ \hat{y}_i $는 예측값, $ n $은 데이터 포인트 수.) 예측값과 실제값의 절대 오차 평균이다. 가장 직관적이고 해석이 .. 2025. 6. 7.