Толковый словарь по нейросетям и искусственному интеллекту
Евклидово расстояние
Euclidean Distance
Категория термина
Евклидово расстояние (Euclidean Distance) — это метрика для измерения прямого расстояния между двумя точками в многомерном пространстве. В контексте машинного обучения и представлений (embeddings) используется для оценки степени различия между векторами объектов.
🧠 Механизм работы
- Даны два вектора A=(a1,a2,...,an)mathbf{A} = (a_1, a_2, ..., a_n) и B=(b1,b2,...,bn)mathbf{B} = (b_1, b_2, ..., b_n).
- Вычисляется квадрат разности каждой компонент: (ai−bi)2(a_i - b_i)^2.
- Суммируются все квадраты разностей и извлекается квадратный корень:
- Полученное значение отражает абсолютную близость двух объектов в n-мерном пространстве.
🔑 Основные особенности
- Простая и интуитивно понятная метрика.
- Чувствительна к масштабу векторов; большие значения компонент увеличивают расстояние.
- Часто используется для измерения различий в embedding space или при кластеризации.
- Может быть комбинирована с нормализацией векторов для устранения эффекта масштаба.
📌 Примеры применения
- Face Recognition / Face Verification — сравнение лицевых embeddings.
- Image Retrieval — оценка схожести изображений в latent space.
- Clustering — алгоритмы K-means и иерархической кластеризации.
- Dimensionality Reduction — оценка близости объектов после снижения размерности (PCA, t-SNE).
- Recommendation Systems — поиск похожих объектов или пользователей.
⚖️ Преимущества и недостатки
Преимущества:
- Простая и легко интерпретируемая.
- Универсальна для любых числовых векторов.
- Широко применима в машинном обучении и анализе данных.
Недостатки:
- Чувствительна к масштабам и различной размерности признаков.
- Может быть менее эффективна в высокоразмерных пространствах (curse of dimensionality).
- Не учитывает направления векторов, только абсолютные различия.
🧠 Связанные понятия
- Cosine Similarity — альтернативная метрика, оценивающая угол между векторами.
- Embedding Space — пространство, где вычисляется расстояние между векторами.
- FaceNet / Image Embeddings — примеры использования евклидова расстояния.
- Distance Metrics — общее понятие метрик расстояний между объектами.
💡 Вывод
Euclidean Distance является фундаментальной метрикой для измерения абсолютного расстояния между объектами в многомерных пространствах и широко используется для оценки схожести в задачах распознавания, кластеризации и поиска.