Эксклюзивное оригинальное улучшение YOLOv8: точки увеличения FPN | Многоуровневая пирамида объединения функций (HS-FPN), помогающая обнаруживать небольшие цели | Последняя статья 2024 года |
Эксклюзивное оригинальное улучшение YOLOv8: точки увеличения FPN | Многоуровневая пирамида объединения функций (HS-FPN), помогающая обнаруживать небольшие цели | Последняя статья 2024 года |

💡💡💡Эксклюзивные улучшения этой статьи:Пирамидальная сеть с функциями фильтрации высокого уровня(HS-FPN),Способен уничтожать как крупные, так и мелкие цели.,Расширьте возможности модели выражать функции в разных масштабах.,Помощь в обнаружении небольших целей

💡💡💡существоватьBCCDНаборы медицинских данных демонстрируют бурный рост。

1. Введение в принцип MFDS-DETR.

бумага: https://arxiv.org/pdf/2401.00926.pdf

Аннотация: Традиционный процесс стандартного больничного анализа крови требует, чтобы врачи вручную отделяли лейкоциты. Используйте микроскоп, чтобы наблюдать микроскопическое изображение крови пациента. Эти изолированные лейкоциты затем сортируются с помощью автоматических сортировщиков лейкоцитов для определения типов лейкоцитов, присутствующих в различных соотношениях и объемах образцов крови, что помогает в диагностике заболеваний. Этот метод не таков, но он также имеет высокую склонность к ошибкам из-за таких факторов, как качество изображения и условия окружающей среды, которые потенциально могут привести к неправильной последующей классификации с ошибочным диагнозом. Современные методы обнаружения лейкоцитов имеют ограничения. При обработке изображений с меньшим количеством признаков WBC и различиями между разными масштабами WBC в большинстве случаев приводит к неудовлетворительным результатам. Для решения этих проблем в данной статье предлагается инновационный метод обнаружения лейкоцитов: многоуровневое слияние и деформация признаков. Обнаружение внимания (MFDS-DETR). Чтобы решить проблему разницы в размерах лейкоцитов, мы разработали пирамиду слияния функций скрининга высокого уровня (HS-FPN) для достижения многоуровневого слияния. Эта модель использует функции высокого уровня в качестве весов для фильтрации информации о функциях низкого уровня через модуль внимания канала, а затем объединяет отфильтрованную информацию с функциями высокого уровня, тем самым улучшая способность модели выражать функции. Кроме того, мы решили проблему отсутствия сигнатур лейкоцитов, включив A. Использование многомасштабного деформируемого модуля самообслуживания в кодере, а также использование механизмов самообслуживания и перекрестно-деформируемого внимания в декодере может помочь извлечь глобальные функции. Характеристическая карта лейкоцитов. Эффективность, превосходство и обобщаемость предлагаемого метода MFDSDETR подтверждены путем сравнения с другими передовыми моделями обнаружения лейкоцитов с использованием частных наборов данных WBCDD, общедоступных LISC и BCCD.

Архитектура, получившая название MFDS-DETR (Multi-Level Feature Fusion with Deformable Self-Attention DETR), предназначена для решения проблемы обнаружения лейкоцитов, которые различаются по масштабу и могут иметь ограниченные функции на изображениях.

Вот разбивка четырех частей архитектуры MFDS-DETR:

Магистральная сеть: это базовая сеть, которая извлекает функции из входного изображения. Обычно в качестве магистральной сети используются предварительно обученные сверточные нейронные сети (CNN), такие как ResNet или VGG.

Сеть пирамидальных функций с фильтрацией высокого уровня (HS-FPN). Этот компонент предназначен для решения проблемы масштабных различий между различными лейкоцитами. Скорее всего, это сеть пирамидных объектов (FPN), которая создает многомасштабную иерархию функций, которая позволяет модели обнаруживать лейкоциты разных размеров. Функции высокого уровня используются для фильтрации (или взвешивания) функций низкого уровня, а затем объединяются с функциями высокого уровня, чтобы улучшить способность модели выражать функции в разных масштабах.

Кодировщик: Кодер отвечает за кодирование функций, извлекаемых магистральной сетью и HS-FPN. Его можно комбинировать с многомасштабным деформируемым модулем самообслуживания для дальнейшего улучшения процесса извлечения признаков. Деформируемые сверточные сети могут адаптивно настраивать свои рецептивные поля, чтобы сосредоточиться на более насыщенных информацией областях изображения, что особенно полезно для обнаружения объектов, которые меняют форму и размер.

Декодер: Декодер принимает закодированные функции и использует их для прогнозирования местоположения и категории лейкоцитов на изображении. Он может использовать механизмы само-внимания и перекрестно-деформируемого внимания для уточнения обнаружения путем рассмотрения глобального контекста в картах объектов.

Структура HS-FPN показана на рисунке 2 и включает два основных компонента:

  1. Модуль выбора функций;
  2. Особенность модуля Fusion.

Чтобы решить присущие многомасштабные проблемы, связанные с наборами данных по лейкоцитам, мы разработали сеть пирамидальных пирамид на основе иерархической шкалы (HS-FPN) для завершения многомасштабного объединения функций. Это позволяет модели собирать более полную информацию о характеристиках лейкоцитов. Структура HS-FPN показана на рисунке 2. HS-FPN в основном состоит из двух частей: (1) Модуль выбора функций. (2) Функциональный модуль Fusion. Первоначально карты объектов в разных масштабах проходят процесс проверки в модуле выбора объектов. Впоследствии информация высокого и низкого уровня в этих картах функций совместно интегрируется с помощью механизма Selective Feature Fusion (SFF). Характеристики, полученные в результате этого слияния, имеют богатое семантическое содержание, что помогает обнаруживать тонкие особенности на микроскопических изображениях лейкоцитов, тем самым расширяя возможности обнаружения модели. Дальнейшая разработка этого механизма SFF и его влияния на производительность модели будет представлена ​​в последующем разделе исследований абляции.

2. Как интегрировать HS-FPN в YOLOv8

Основной код:

Язык кода:python
кодКоличество запусков:0
копировать
import torch
import torch.nn as nn



class HSFPN(nn.Module):
    def __init__(self, in_planes, ratio = 4, flag=True):
        super(HSFPN, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.max_pool = nn.AdaptiveMaxPool2d(1)

        self.conv1 = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)
        self.relu = nn.ReLU()
        self.conv2 = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)
        self.flag = flag
        self.sigmoid = nn.Sigmoid()

        nn.init.xavier_uniform_(self.conv1.weight)
        nn.init.xavier_uniform_(self.conv2.weight)

    def forward(self, x):
        avg_out = self.conv2(self.relu(self.conv1(self.avg_pool(x))))
        max_out = self.conv2(self.relu(self.conv1(self.max_pool(x))))
        out = avg_out + max_out
        return self.sigmoid(out) * x if self.flag else self.sigmoid(out)

от искусственного интеллекта, маленький монстр

Я участвую в пятом выпуске специального учебного лагеря Tencent Technology Creation 2024 с эссе, получившими награды. Приходите и разделите приз со мной!

boy illustration
Устраните проблему совместимости между версией Spring Boot и Gradle Java: возникла проблема при настройке корневого проекта «demo1» > Не удалось.
boy illustration
Научите вас шаг за шагом, как настроить Nginx.
boy illustration
Это руководство — все, что вам нужно для руководства по автономному развертыванию сервера для проектов Python уровня няни (рекомендуемый сборник).
boy illustration
Не удалось запустить docker.service — Подробное объяснение идеального решения ️
boy illustration
Настройка файлового сервера Samba в системе Linux Centos. Анализ NetBIOS (супер подробно)
boy illustration
Как настроить метод ssh в Git, как получить и отправить код через метод ssh
boy illustration
RasaGpt — платформа чат-ботов на основе Rasa и LLM.
boy illustration
Nomic Embed: воспроизводимая модель внедрения SOTA с открытым исходным кодом.
boy illustration
Улучшение YOLOv8: EMA основана на эффективном многомасштабном внимании, основанном на межпространственном обучении, и эффект лучше, чем у ECA, CBAM и CA. Малые цели имеют очевидные преимущества | ICASSP2023
boy illustration
Урок 1 серии Libtorch: Тензорная библиотека Silky C++
boy illustration
Руководство по локальному развертыванию Stable Diffusion: подробные шаги и анализ распространенных проблем
boy illustration
Полностью автоматический инструмент для работы с видео в один клик: VideoLingo
boy illustration
Улучшения оптимизации RT-DETR: облегченные улучшения магистрали | Support Paddle облегченный rtdetr-r18, rtdetr-r34, rtdetr-r50, rtdet
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | Деформируемое внимание с большим ядром (D-LKA Attention), большое ядро ​​​​свертки улучшает механизм внимания восприимчивых полей с различными функциями
boy illustration
Создано Datawhale: выпущено «Руководство по тонкой настройке развертывания большой модели GLM-4»!
boy illustration
7B превышает десятки миллиардов, aiXcoder-7B с открытым исходным кодом Пекинского университета — это самая мощная модель большого кода, лучший выбор для корпоративного развертывания.
boy illustration
Используйте модель Huggingface, чтобы заменить интерфейс внедрения OpenAI в китайской среде.
boy illustration
Оригинальные улучшения YOLOv8: несколько новых улучшений | Сохранение исходной информации — алгоритм отделяемой по глубине свертки (MDSConv) |
boy illustration
Второй пилот облачной разработки | Быстро поиграйте со средствами разработки на базе искусственного интеллекта
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция с нулевым кодированием и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
Решенная Ошибка | Загрузка PyTorch медленная: TimeoutError: [Errno 110] При загрузке факела истекло время ожидания — Cat Head Tiger
boy illustration
Brother OCR, библиотека с открытым исходным кодом для Python, которая распознает коды проверки.
boy illustration
Новейшее подробное руководство по загрузке и использованию последней демонстрационной версии набора данных COCO.
boy illustration
Выпущен отчет о крупной модели финансовой отрасли за 2023 год | Полный текст включен в загрузку |
boy illustration
Обычные компьютеры также могут работать с большими моделями, и вы можете получить личного помощника с искусственным интеллектом за три шага | Руководство для начинающих по локальному развертыванию LLaMA-3
boy illustration
Одной статьи достаточно для анализа фактора транскрипции SCENIC на Python (4)
boy illustration
Бросая вызов ограничениям производительности небольших видеокарт, он научит вас запускать большие модели глубокого обучения с ограниченными ресурсами, а также предоставит полное руководство по оценке и эффективному использованию памяти графического процессора!
boy illustration
Команда Fudan NLP опубликовала 80-страничный обзор крупномасштабных модельных агентов, в котором в одной статье представлен обзор текущего состояния и будущего агентов ИИ.
boy illustration
[Эксклюзив] Вы должны знать о новой функции JetBrains 2024.1 «Полнострочное завершение кода», чтобы решить вашу путаницу!
boy illustration
Краткое изложение базовых знаний о регистрации изображений 1.0