Толковый словарь по нейросетям и искусственному интеллекту
Размер ядра
Категория термина
Размер ядра (Kernel Size) — это параметр свёрточного слоя (Convolutional Layer) или слоя подвыборки (Pooling Layer), определяющий размер фильтра или окна, используемого для обработки входного тензора. Он задаёт, сколько пикселей или элементов учитывается одновременно при вычислении свёртки или агрегации.
🧠 Механизм работы:
- Ядро представляет собой матрицу весов (для свёрточного слоя) или область выборки (для pooling).
- При свёртке фильтр скользит по входной карте признаков с определённым stride, умножая элементы ядра на соответствующие элементы входа и суммируя результаты.
- В pooling слой ядро задаёт область, из которой берётся максимум (Max Pooling) или среднее (Average Pooling).
- Размер ядра напрямую влияет на рецептивное поле — область входа, которая учитывается при формировании одного элемента выходной карты признаков.
🔑 Основные особенности:
- Малое ядро (например, 3×3) — захватывает локальные признаки, позволяет строить глубокие сети с небольшими параметрами.
- Большое ядро (например, 7×7 или 11×11) — захватывает более глобальные структуры, но увеличивает количество параметров.
- Часто используется сочетание маленьких ядер в последовательных слоях для эффективного увеличения рецептивного поля.
- В pooling слой задаёт размер области агрегации, влияя на степень уменьшения размерности.
📌 Примеры применения:
- Convolutional Neural Networks (CNN) — выбор размера ядра для извлечения локальных или глобальных признаков.
- Super-Resolution и Image Enhancement — небольшие ядра для точного восстановления деталей.
- Semantic Segmentation — комбинации ядер разного размера для захвата контекста.
- Pooling Layers — ядро определяет область агрегирования максимума или среднего значения.
⚖️ Преимущества и недостатки:
Преимущества:
- Позволяет контролировать рецептивное поле слоя.
- Малые ядра уменьшают количество параметров и вычислительные затраты.
- Большие ядра захватывают глобальные признаки без увеличения глубины сети.
Недостатки:
- Большие ядра требуют больше вычислений и могут привести к переобучению.
- Малые ядра ограничены локальными признаками и требуют большего числа слоёв для глобального контекста.
- Неправильный выбор ядра может ухудшить извлечение признаков.
🧠 Связанные понятия:
- Stride — шаг скольжения ядра по входу.
- Padding — добавление границ для сохранения размерности.
- Receptive Field — область входа, видимая для одного элемента выходной карты.
- Pooling / Convolutional Layer — слои, где используется ядро.
💡 Вывод:
Размер ядра (Kernel Size) — это ключевой параметр свёрточных и pooling слоёв, определяющий локальный контекст обработки данных, напрямую влияющий на извлечение признаков, рецептивное поле и эффективность нейросетевой модели.