기계학습1 분산과 바이어스 분산 (Variance) 분산은 예측값들끼리의 차이 정의 : 분산은 모델이 훈련 데이터에 얼마나 민감하게 반응하는지를 나타냅니다. 의미 높은 분산 모델이 훈련 데이터의 작은 변화나 노이즈까지도 과도하게 학습합니다. 결과적으로 새로운 데이터에 대한 예측이 불안정하고, 과적합(overfitting)의 위험이 있습니다. 낮은 분산 모델이 훈련 데이터의 노이즈에 덜 민감합니다. 이로 인해, 새로운 데이터에 대해서는 더 일반적으로 동작할 가능성이 높습니다. 바이어스 (Bias) 예측값이 정답과 얼마나 멀리 떨어져 있는지 정의 : 바이어스는 모델이 훈련 데이터와 실제 현실 세계의 데이터를 얼마나 일반화할 수 있는지에 대한 척도입니다. 의미 높은 바이어스 : 모델이 너무 단순하여 데이터의 복잡한 패턴을 학습하지 못합.. 2023. 9. 13. 이전 1 다음