Контрастная потеря
Контрастная потеря

Contrastive Loss(Потеря контраста) — разновидность функции потерь, обычно используемая для тренировки контрастного обучения (Contrastive Модели обучения, предназначенные для изучения сходств и различий в данных. В этой статье записан соответствующий контент.

Введение

Contrastive Loss(Потеря контраста) — разновидность функции потерь, обычно используемая для тренировки контрастного обучения (Contrastive Модели обучения, предназначенные для изучения сходств и различий в данных. Основная цель контрастного обучения — сопоставить похожие пары образцов с близкими местоположениями и несходные пары образцов с удаленными местами. Контрастный Loss помогите достичь этой цели.

Контрастную потерю можно рассматривать как тип потери рейтинга. Когда мы обычно выполняем задачи ML, наиболее часто используемыми являются потеря перекрестной энтропии или потеря MSE. Должна быть четкая цель, например, определенное значение или определенная классификационная категория. Но потеря рейтинга на самом деле является своего рода обучением показателям. Они изучают относительные расстояния и корреляции, но не очень заботятся о конкретных значениях.

Потеря контраста

Потеря контраста чаще всего используется в сети близнецов (сиамские сеть), эта функция потерь может эффективно обрабатывать парную нейронную сеть Связь между данными (формально это не обязательно должно быть две Сети, это может быть и одна Сеть и два Выхода. Можно считать, что Сеть1 и 2 на приведенной схеме одинаковые или не одинаковые). контрастный Выражение потерь следующее:

L=\frac{1}{2N}~\sum_{n=1}Nyd2+(1-y)\max(margin-d,0)^2

в

Эта функция потерь была первоначально получена из «Уменьшения размерности» Янна Лекуна путем изучения инвариантного отображения. Она в основном используется при уменьшении размерности, то есть после уменьшения размерности (извлечения признаков) исходно похожих выборок в пространстве признаков два образца по-прежнему остаются похожими. ; хотя исходно несходные выборки, после уменьшения размерности эти две выборки все еще различаются в пространстве признаков.

Наблюдая за выражением контрастной потери выше, мы можем обнаружить, что эта функция потерь может хорошо выражать степень совпадения парных выборок, а также может быть хорошо использована для обучения моделей для извлечения признаков.

  • когда y=1 (т.е. когда выборки похожи), остается только функция потерь ∑ y d^ 2 ,То есть исходный аналогичный образец,Если евклидово расстояние в пространстве признаков велико,Это значит, что когда до из Модель это не хорошо,тем самым увеличивая потери.
  • когда y=0 (то есть выборки не похожи), функция потерь равна ∑ ( 1 − y )\max ( m a r g i n − d , 0 ) ^2 ,То есть, когда образцы не похожи,Его характерное пространство меньше евклидова расстояния.,Сумма потерь станет больше,Это также точно символизирует наши требования.

в margin является суперпараметром, который эквивалентен заданию loss 定了一个上界(margin квадрат), если d Больше или равно margin ,Тогда это значит, что уже очень хорошо.,loss=0

На рисунке ниже показана связь между значением потерь и евклидовым расстоянием выборочного объекта.,Красная пунктирная линия указывает на то, что из — величина потерь аналогичных образцов.,Синяя сплошная линия представляет значение потерь разнородных образцов.

Contrastive Loss Цель состоит в том, чтобы свести к минимуму расстояние или сходство между парами положительных образцов, гарантируя при этом, что расстояние или сходство между парами отрицательных образцов превышает определенный порог. margin . Таким образом, модель учится лучше различать похожие и непохожие образцы в пространстве внедрения.

Ссылки

Ссылка на статью: https://cloud.tencent.com/developer/article/2372744

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода