Толковый словарь по нейросетям и искусственному интеллекту
Среднеквадратичная ошибка
Категория термина
Среднеквадратичная ошибка (Mean Squared Error, MSE) — это метрика, используемая для оценки качества модели регрессии или любого алгоритма, выдающего числовые предсказания. Она измеряет среднее значение квадратов разностей между предсказанными значениями модели и фактическими (реальными) значениями.
Формула вычисления:
MSE=1n∑i=1n(yi−y^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2где:
- nn — общее количество примеров в выборке,
- yiy_i — фактическое значение,
- y^i\hat{y}_i — предсказанное моделью значение.
🧠 Почему используется:
- Квадратичные отклонения увеличивают вклад больших ошибок, что делает MSE чувствительной к выбросам.
- В отличие от абсолютной ошибки (MAE), MSE даёт более строгую оценку качества, поскольку большие ошибки «штрафуются» сильнее.
- Это метрика с хорошими математическими свойствами, особенно в задачах оптимизации: она дифференцируема, что важно при использовании градиентного спуска.
🔍 Пример:
Допустим, у нас есть предсказания модели:
Разности: [0.5, -0.5, 0, -1]
Квадраты: [0.25, 0.25, 0, 1.0]
MSE = (0.25 + 0.25 + 0 + 1.0) / 4 = 0.375
🧪 Области применения:
- Машинное обучение и статистика — для оценки регрессионных моделей.
- Глубокое обучение — как функция потерь (loss function) в задачах восстановления, предсказания, генерации числовых данных.
- Компьютерное зрение — при обучении моделей, восстанавливающих изображение, например, в автоэнкодерах, суперразрешении и денойзинге.
- Прогнозирование временных рядов — для оценки точности предсказаний.
🛠 Использование в коде (Python / scikit-learn):
📌 Особенности:
- Чем ближе значение MSE к нулю, тем лучше модель.
- Недостаток: чувствительность к выбросам.
- Иногда используется RMSE (корень из MSE) для сохранения единиц измерения оригинальных данных.
✅ Заключение:
MSE — это одна из самых популярных и простых в понимании метрик регрессионной ошибки. Благодаря своей чувствительности к большим ошибкам и легкости реализации, она широко используется в машинном обучении и статистике как функция потерь и как способ оценки качества модели.