Толковый словарь по нейросетям и искусственному интеллекту
Дополнение границ
Padding
Категория термина
Дополнение границ (Padding) — это метод добавления фиктивных значений (обычно нулей) вокруг входного тензора в сверточных или pooling слоях, чтобы контролировать размер выходной карты признаков и сохранить важную информацию на границах.
🧠 Механизм работы:
- Входной тензор (например, изображение) расширяется путём добавления строк и столбцов с фиксированными значениями (чаще всего нулями) вокруг краёв.
- После добавления padding применяется свёртка или pooling с заданным stride и kernel size.
- Padding позволяет контролировать пространственные размеры выходной карты признаков:
- Valid Padding (без дополнения) — фильтр обрабатывает только реальные элементы входа, размер выхода уменьшается.
- Same Padding (с дополнением) — выходная карта имеет тот же размер, что и входная.
🔑 Основные особенности:
- Позволяет сохранять пространственное разрешение на границах входа.
- Влияет на размер выходного тензора и рецептивное поле.
- В сочетании с stride и kernel size обеспечивает гибкость архитектуры CNN.
- Может использоваться для центровки свёртки и улучшения обучения модели.
📌 Примеры применения:
- Convolutional Neural Networks (CNN) — сохранение размерности feature map после свёртки.
- Segmentation — обеспечение совпадения размеров входа и выхода для пиксельной классификации.
- Object Detection — точное расположение объектов на границах изображения.
- Super-Resolution — сохранение информации на краях изображения при апскейлинге.
⚖️ Преимущества и недостатки:
Преимущества:
- Сохраняет размер выходного тензора.
- Предотвращает потерю информации на границах входных данных.
- Облегчает проектирование архитектуры и обучение модели.
Недостатки:
- Введение фиктивных значений может слегка искажать признаки на границах.
- Увеличивает вычислительные затраты из-за обработки добавленных элементов.
- Может создавать артефакты при некорректной настройке.
🧠 Связанные понятия:
- Kernel Size — размер фильтра совместно с padding определяет выходной размер.
- Stride — шаг фильтра влияет на эффект padding.
- Receptive Field — padding увеличивает область входа, влияющую на выход.
- Feature Map / Activation Map — элементы выходной карты зависят от padding.
💡 Вывод:
Дополнение границ (Padding) — это ключевой инструмент в сверточных и pooling слоях, позволяющий сохранять пространственное разрешение, предотвращать потерю информации на краях и гибко управлять архитектурой нейросети.