2024. 3. 26. 22:02ㆍDATA/BIGDATA
■ MSE (Mean Squared Error, 평균 제곱 오차)의 공식
\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \]
- \( n \)은 샘플의 수
- \( y_i \)는 실제 값(ground truth)
- \( \hat{y}_i \)는 모델이 예측한 값
MSE는 회귀 모델의 예측 정확성을 측정하는 지표이다. 예측된 값과 실제 값 간의 차이를 제곱한 후, 이를 모든 샘플에 대해 평균화하여 모델의 예측 값과 실제 값 사이의 거리를 평가한 후 예측 모델이 얼마나 잘 작동하는지를 평가하는 데 사용되며 MSE 값이 작을수록 모델이 더 좋은 성능을 가진다.
이상치에 민감할 수 있음.
■ RMSE (Root Mean Square Error, 평균 제곱근 오차)의 공식
\[ \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} \]
실제 값과 예측 값 사이의 제곱 오차의 평균의 제곱근 예측 오차를 제곱하여 평균화한 뒤 다시 제곱근을 취하며
모델의 예측 값과 실제 값 사이의 거리를 평가하고, 제곱 오차에 비해 이상치에 더 민감하지 않다. 예측 모델이 얼마나 잘 작동하는지를 평가하는 데 사용되며 RMSE는 MSE와 마찬가지로 값이 작을수록 모델의 성능이 더 좋다고 할 수 있다.
■ RMSE와 MSE 모델의 성능 평가
MSE는 오차를 제곱하여 평균화한 값이므로 오차의 크기를 파악하는 데 도움이 되지만 제곱된 값은 원래 단위와 다르기 때문에 직관적으로 해석하기 어렵다. 이에 비해 RMSE는 MSE의 제곱근이므로, 오차의 크기를 원래 단위로 변환하여 해석하기 쉽고 오차의 크기뿐만 아니라 오차의 표준편차를 고려할 수 있어 모델의 예측값이 실제 값과 얼마나 일치하는지 더 잘 파악할 수 있다. 또, RMSE와 MSE는 표준화된 지표이므로, 다양한 모델 및 데이터셋에서 일관된 성능 측정을 제공한다.
'DATA > BIGDATA' 카테고리의 다른 글
t 통계량과 F 통계량을 분석함으로써 알고자하는 결과 (0) | 2024.03.27 |
---|---|
ROC(Receiver Operating Characteristic) (0) | 2024.03.27 |
회귀분석모델과 결정계수 (0) | 2024.03.21 |
t-statistic , p-value (0) | 2024.03.20 |
지도학습과 비지도학습 (0) | 2024.03.19 |