[Глубокое обучение] Терминология нейронных сетей: эпоха, размер пакета и итерация
[Глубокое обучение] Терминология нейронных сетей: эпоха, размер пакета и итерация

Batchsize: китайский перевод — размер партии (размер партии).

Проще говоря, размер пакета будет определять количество образцов, которые мы обучаем одновременно.

Batch_size повлияет на степень оптимизации и скорость модели.

Зачем вам нужен Batch_Size:

Правильный выбор размера пакета заключается в нахождении наилучшего баланса между эффективностью использования памяти и ее объемом.

Значение Batch_Size:

Полная партия (синяя)

еслиНабор данных относительно небольшойМы будем использовать вседанныенабор。Полныйданныенабор Определенное направление лучше представляет совокупность выборки.,Таким образом точнее направляемся в сторону экстремального значения.

Примечание. Для больших наборов данных мы не можем использовать полный пакет, поскольку получим худшие результаты.

мини-пакет (зеленый)

Выберите умеренное значение Batch_Size. То есть после того, как мы выберем размер партии, мы введем данные в сеть глубокого обучения в соответствии с размером партии, а затем рассчитаем среднюю потерю всех образцов в этой партии, то есть функция стоимости является средней всех образцов.

Случайный (batch_size равен 1) (красный)

Каждое направление коррекции корректируется в соответствии с направлением градиента соответствующего образца, и добиться сходимости сложно.

Преимущества соответствующего увеличения размера пакета:

1. Улучшение использования памяти за счет распараллеливания.

2. Уменьшается количество итераций в одной эпохе и увеличивается скорость работы. (Одна эпоха = (все обучающие выборки/размер пакета)/итерация = 1)

3. Соответствующим образом увеличьте Batch_Size, точность направления градиентного спуска увеличится, а амплитуда тренировочной вибрации уменьшится. (Вы можете узнать, посмотрев на картинку выше)

Краткое описание опыта:

По сравнению с обычным набором данных, если Batch_Size слишком мал, обучающим данным будет очень трудно сходиться, что приведет к недостаточному подбору.

Увеличение Batch_Size ускорит относительную скорость обработки.

Увеличение Batch_Size увеличивает требуемый объем памяти (для достижения наилучших результатов необходимо увеличить количество эпох).

Здесь мы обнаруживаем две вышеупомянутые противоречивые проблемы, потому что увеличение эпохи также приведет к увеличению затрат времени и уменьшению скорости. Поэтому нам нужно найти лучший пакетный_размер.

повторять:Правильный выбор размера пакета заключается в нахождении наилучшего баланса между эффективностью использования памяти и ее объемом.

Итерация: китайский перевод — это итерация.

Итерацияповторитьобратная связьдействие,нейронная В сети мы надеемся выполнить несколько итераций обучения для достижения желаемой цели или результата.

Результат каждой итерации будет использоваться в качестве начального значения следующей итерации.

Одна итерация = один прямой проход + один обратный проход.

Эпоха: Китайский перевод — это точка.

Одна эпоха = один проход вперед и один проход назад для всех обучающих выборок.

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода