Эта статья начнется сПрирода функции потерь、Принцип функции потерь、алгоритм функции потерьтри аспекта,Подробное введениеФункция потерь Функция потерь。
функция потерь
Выберите семейство моделей, определите функцию потерь для количественной оценки ошибки прогнозирования и найдите оптимальные параметры модели с минимальными потерями с помощью алгоритма оптимизации.
Машинное обучение против человеческого обучения
Цель:определить подходящее пространство гипотез или Модельсемья。
Пример:Линейная регрессия、логистическая регрессия、нейронная сеть, время принятия решения и т.д.
Факторы, которые следует учитывать:сложность проблемы、характер данных、Вычислительные ресурсы и т.д.
Цель:Определите количественную разницу между предсказаниями модели и истинными результатами.
Пример:среднеквадратическая ошибка(MSE)для регресса;Перекрестная потеря энтропии используется для классификации.。
Факторы, которые следует учитывать:характер потери(Выпуклость、дифференцируемость и др.).、Легко оптимизировать、Устойчивость к выбросам и т. д.
Цель:существоватьфункция Сосредоточьтесь на поиске минимальных потерьфункцияиз Модельпараметр。
Основные методы:Градиентный спуск и его варианты.(стохастический градиентный спуск、пакетный градиентный спуск、Адам и др.).
Факторы, которые следует учитывать:Скорость сходимости、Вычислительная эффективность、Сложность настройки параметров и т.д.
Определите количественную разницу между предсказаниями модели и истинными результатами.
Природа функции потерь
Функция потерь используется для количественной оценки разницы между предсказаниями модели и истинными значениями.
Это метод расчета разницы между прогнозируемым и реальным значением, инкапсулированный в структуру глубокого обучения (например, PyTorch, TensorFlow).
В машинном обучении цель состоит в том, чтобы сделать прогнозируемое значение как можно ближе к истинному значению, поэтому этого необходимо достичь путем минимизации разницы между прогнозируемым значением и истинным значением.
Выбор функции потерь имеет решающее значение для скорости обучения и эффективности модели, поскольку разные функции потерь приведут к разным скоростям градиентного спуска.
Функция потерь находится между прямым и обратным распространением модели машинного обучения.
На этапе прямого распространения модель генерирует прогнозы на основе входных функций.
Функция потерь принимает эти прогнозируемые значения и вычисляет разницу с истинными значениями.
Эта разница затем используется на этапе обратного распространения для обновления параметров модели и уменьшения будущих ошибок прогнозирования.
Расположение функции потерь
Ошибка отражает смещение прогноза одной точки данных, а потеря представляет собой сумму смещения прогноза всего набора данных. Функция потерь использует эти два принципа для агрегирования ошибок с целью оптимизации модели и уменьшения общей ошибки прогнозирования.
Разница между прогнозируемым результатом и истинным значением для одной точки данных используется для оценки точности прогнозирования модели в конкретной точке данных.
Ошибка относится к разнице или отклонению между результатами прогнозирования модели и истинным значением при прогнозировании одной точки данных. Эта разница отражает неточность или предвзятость прогнозов модели.
Погрешность можно рассчитать с помощью различных математических формул. Среди них абсолютная ошибка — это абсолютное значение разницы между прогнозируемым значением и истинным значением, которое используется для количественной оценки фактического отклонения прогноза от истинного значения. Квадрат ошибки — это квадрат разницы между прогнозируемыми значениями; значение и истинное значение, которое часто используется в функции квадратичных потерь, чтобы более заметно выделить более крупные ошибки.
Столбики ошибок обычно отображаются в виде линий или прямоугольников выше, ниже или по обе стороны от точки данных, а их длина или размер представляют собой величину ошибки. Этот метод визуализации помогает выявить потенциальные проблемные области и направлять дальнейшие улучшения модели или анализ данных.
Название горизонтальной оси
Потери — это общая мера прогнозной неточности модели машинного обучения по всему набору данных, а минимизация потерь позволяет оптимизировать параметры модели и повысить производительность прогнозирования.
Потери измеряются машинное обучение Модельсуществовать Прогнозирование по всему набору данныхизобщая неточностьизиндекс。это отражает Модельмежду прогнозом и фактическим значениемизразница,и объединить эти различия,чтобы предоставить скалярное значение, представляющее общую неточность прогноза。
Конкретный расчет потерь осуществляется с помощью функции потерь. Функция потерь принимает прогнозируемые и истинные значения модели в качестве входных данных и выводит скалярное значение, значение потерь, представляющее общую ошибку прогнозирования модели по всему набору данных.
Кривая потерь визуально представляет тенденцию изменения значения потерь модели в процессе обучения. Построив график изменений потерь при обучении и потерь при проверке в зависимости от количества итераций, мы можем получить представление о том, сталкивается ли модель с такими проблемами, как переоснащение или недостаточное оснащение, а затем скорректировать структуру модели и стратегию обучения.
кривая потерь
алгоритм функции потерь
Точность результатов прогнозирования в задаче регрессии измеряется путем расчета среднего значения квадратов разностей между прогнозируемыми значениями модели и истинными значениями с целью сделать прогнозируемые значения как можно ближе к истинным значениям.
Функция потерь среднеквадратических ошибок (MSE)
В основном используется в задачах регрессии, т.е. задачах прогнозирования непрерывных значений.
Функция потерь среднеквадратических ошибок (MSE)чиновник
Когда прогнозируемое значение близко к истинному значению, значение потерь меньше.
Когда разница между прогнозируемым значением и фактическим значением велика, значение потерь быстро увеличивается.
Благодаря простой форме градиента его легко оптимизировать.
Минимизируйте потери среднеквадратической ошибки, чтобы прогнозируемое значение модели было как можно ближе к истинному значению.
Он используется для измерения разницы между распределением вероятностей, предсказанным моделью, и истинной меткой в задаче классификации с целью приблизить прогноз модели к истинной категории за счет минимизации потерь.
Функция перекрестной энтропийной потери (CE)
В основном используется для задач классификации, особенно задач мультиклассификации.
Функция перекрестной энтропийной потери (CE)чиновник
Когда прогнозируемое распределение вероятностей близко к истинному распределению вероятностей, значение потерь невелико.
Очень чувствителен к небольшим изменениям прогнозируемых вероятностей, особенно когда вероятность истинной метки близка к 0 или 1.
Модели, подходящие для вероятностного вывода, такие как логистическая регрессия, классификатор softmax и т. д.
Минимизированная потери перекрестной энтропии позволяет прогнозированию модели каждой категории как можно ближе к реальному распределению вероятности.
Ссылка: Architect предлагает вам поиграть с ИИ.