Введение в обнаружение малых целей YOLOv8
Введение в обнаружение малых целей YOLOv8

Обнаружение небольших целей Yolo, эксклюзивная первая инновация (оригинальная), подходит для различных серий Yolo, таких как Yolov5, Yolov7, Yolov8 и т. д. В статье колонки представлены все этапы и исходный код, которые помогут вам легко улучшить обнаружение небольших целей.

Ключевые моменты:Читая эту колонку,Позже вы сможете объединить его со своим собственным небольшим набором данных для обнаружения целей.,Выполняйте магические модификации в разных местах сети (магистраль, головка, обнаружение, потеря и т. д.).,Достигайте небольших целей, увеличивайте баллы и внедряйте инновации! ! !

1. Введение в обнаружение малых целей

1.1 Определение малых целей

1) Если взять в качестве примера определение объекта COCO общего набора данных в области обнаружения объектов, маленькие объекты относятся к размеру менее 32×32 пикселей (средние объекты относятся к 32*32-96*96, а большие объекты относятся к больше 96*96); 2) В реальных сценариях применения обычно предпочтительнее использовать соотношение относительно исходного изображения, чтобы определить: произведение длины и ширины поля метки объекта, разделенное на произведение длины и ширины всего изображения, а затем открыть квадратный корень. Если результат меньше 3%, просто назовите это малыми целями;

1.2 Трудности

1) Количество образцов, содержащих мелкие цели, невелико, что потенциально позволяет модели обнаружения целей уделять больше внимания обнаружению средних и крупных целей;

2) Площадь, охваченная мелкими целями, меньше, поэтому места расположения мелких целей не будут разнообразными. Мы полагаем, что это затрудняет проверку возможности обобщения обнаружения небольших объектов;

3) Проблема сопоставления якорей сложна. В основном это касается метода, основанного на привязке. Поскольку поле gt и привязка небольшой цели очень малы, поле привязки и gt слегка смещаются, и IoU становится очень низким, что позволяет легко оценить его как отрицательную выборку. по сети;

4) Они не только мелкие, но и сложные, с различной степенью непроходимости, размытости и незавершенности;

Подождите, пока трудности

2. Небольшой целевой набор данных для этого столбца.

Адрес загрузки набора данных:

Single-frame InfraRed Small Target

Размер набора данных: 427 изображений, 3-кратное улучшение данных было выполнено для получения 1708 изображений, а окончательный обучающий набор, набор проверки и тестовый набор были случайным образом назначены как 8:1:1.

Оглавление

1. Введение в обнаружение малых целей

1.1 Определение малых целей

1.2 Трудности

2. Небольшой целевой набор данных для этого столбца.

3. Направление оптимизации трудоёмкости малых целевых колонн.

3.1 Разумное улучшение данных

3.2 Многомасштабная сеть

3.2.1 Многоголовочный детектор

3.2.2 Эффективное двунаправленное межмасштабное соединение BiFPN и объединение взвешенных функций

3.2.3 Поймайте все маленькие цели до больших, GiraffeDet, легкий детектор целей с легкой основой и тяжелой шейкой.

3.2.4 Модуль многоветвевой свертки RFB

3.2.5 ЗОЛОТО-ЙОЛО, далеко впереди

3.3 оптимизация потерь

3.3.1 Wasserstein Distance Loss

3.4 Механизм внимания

3.4.1 Механизм внимания SEAM

3.4.2 Многомасштабный термоядерный модуль «подключи и работай» EVC

3.4.3 Сеть агрегирования контекста и уточнения функций для обнаружения небольших целей

3.4.4 Эффективное многомасштабное внимание для межпространственного обучения EMA ICASSP2023 |

3.4.5 Динамическое разреженное внимание BiFormer CVPR 2023

3.4.6 LSKblockAttention | ICCV 2023

3.4.7 Триплет Внимание

3.4.8 Приоритетное путаница (CPCA) |

3.4.8 Многомасштабный MultiSEAM

3.4.9 Легкое внимание MobileViTAttention | ECCV2022

3.4.10 Операция свертки внимания рецептивного поля

3.4.11 Dual-ViT: многомасштабный трансформер двойного видения

3.5 Варианты свертки

3.5.1 SPD-Conv

3.5.2 Деформируемая свертка DCNv3 CVPR2023

3.5.3 Новая частичная свертка (PConv) | CVPR2023 FasterNet

3.5.4 ODConv | ICLR 2022

3.5.5 Динамическая свертка змеи ICCV2023

Посмотреть подробности:https://blog.csdn.net/m0_63774211/article/details/132322340

layers

parameters

GFLOPs

kb

mAP50

yolov8

168

3005843

8.1

6103

0.755

Wasserstein loss

168

3005843

8.1

6103

0.784

yolov8_smallob

207

2921172

12.2

6137

0.878

yolov8_SEAM

219

3109331

8.3

6331

0.785

yolov8_SPD

174

3598739

49.2

7394

0.875

yolov8_EVC

217

7293523

11.5

14513

0.779

yolov8_BiFPN

168

3005849

8.1

6104

0.766

yolov8_ContextAggregation

195

3008092

8.1

6121

0.759

yolov8_EMA

192

3006739

8.1

6114

0.766

yolov8_DCNV3

264

2892317

7.9

5892

0.765

yolov8_MCALayer

209

2545659

7.2

5194

0.769

yolov8_BiFormerBlock

204

3356179

22.4

6800

0.758

yolov8_LSKblockAttention

201

3343333

8.7

6784

0.775

yolov8_GPFN

216

2986131

8.1

6079

0.766

yolov8_C2f_Pconv

177

2716883

7.6

5537

0.758

yolov8_ODConv

179

3012110

7.9

6121

0.76

yolov8_TripletAttention

201

3006443

8.2

6120

0.79

yolov8_ChannelAttention

171

3137427

7.8

6428

0.815

yolov8_DySnakeConv

229

3356287

8.5

6822

0.77

yolov8_MultiSEAM

325

5742291

11711

0.87

yolov8_MobileViTAttention

241

3957659

11.1

7992

0.799

yolov8-RFA

258

3019439

8.2

6166

0.765

yolov8_BasicRFB

303

3440235

8.9

7040

0.762

yolov8_RepViTBlock

186

3338387

7.9

6771

0.791

yolov8-goldyolo

359

6015123

11.9

12123

0.768

yolov8_DualAttention

186

4604819

8.3

9236

0.766

Следите за личными сообщениями, чтобы получить исходный код.

https://blog.csdn.net/m0_63774211/article/details/132322340

я участвуюНа третьем этапе специального тренировочного лагеря Tencent Technology Creation 2023 года будет проводиться конкурс сочинений. Соберите команду, чтобы выиграть приз!

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода