Толковый словарь по нейросетям и искусственному интеллекту
Шаг свёртки
Категория термина
Шаг свёртки (Stride) — это параметр сверточного или pooling слоя, определяющий, на сколько пикселей или элементов фильтр перемещается по входной карте признаков при каждой итерации. Stride управляет плотностью охвата входных данных и размером выходной карты признаков.
🧠 Механизм работы:
- Фильтр (ядро) устанавливается на определённой позиции входного тензора.
- После вычисления свёртки или агрегирования (в pooling) фильтр сдвигается на количество элементов, заданное параметром stride.
- Процесс повторяется до полного покрытия входного тензора.
- Размер выходной карты признаков зависит от stride, размера ядра и padding. Больший stride уменьшает размер выхода и повышает эффективность вычислений, но может теряться часть информации.
🔑 Основные особенности:
- Stride = 1 — фильтр перемещается на один элемент, обеспечивая полное покрытие и высокое разрешение карты признаков.
- Stride > 1 — фильтр перескакивает элементы, уменьшая размер выходной карты (downsampling).
- В сочетании с padding позволяет сохранять размер выходного тензора.
- В pooling слоях stride задаёт размер шага окна агрегирования.
📌 Примеры применения:
- Convolutional Neural Networks (CNN) — контроль пространственного разрешения feature map.
- Pooling Layers — уменьшение размерности карт признаков.
- Super-Resolution — stride управляет плотностью апскейлинга.
- Object Detection и Segmentation — баланс между точностью локализации и вычислительной эффективностью.
⚖️ Преимущества и недостатки:
Преимущества:
- Позволяет регулировать размер выходной карты признаков.
- Уменьшает вычислительные затраты при больших stride.
- Может использоваться для downsampling без отдельного pooling слоя.
Недостатки:
- Большой stride может пропускать важные признаки.
- Малый stride увеличивает вычислительную нагрузку и память.
- Требует баланса с размером ядра и padding для сохранения качества признаков.
🧠 Связанные понятия:
- Kernel Size — размер ядра совместно со stride определяет рецептивное поле.
- Padding — добавление границ для сохранения размерности выхода.
- Receptive Field — stride влияет на рост рецептивного поля.
- Feature Map / Activation Map — элементы зависят от шага свёртки.
💡 Вывод:
Шаг свёртки (Stride) — это ключевой параметр свёрточных и pooling слоёв, определяющий перемещение фильтра по входным данным, размер выходной карты признаков и эффективность вычислений, играющий важную роль в балансировке точности и производительности нейросети.