Обнаружение небольших целей Yolo, эксклюзивная первая инновация (оригинальная), подходит для различных серий Yolo, таких как Yolov5, Yolov7, Yolov8 и т. д. В статье колонки представлены все этапы и исходный код, которые помогут вам легко улучшить обнаружение небольших целей.
Ключевые моменты:Читая эту колонку,Позже вы сможете объединить его со своим собственным небольшим набором данных для обнаружения целей.,Выполняйте магические модификации в разных местах сети (магистраль, головка, обнаружение, потеря и т. д.).,Достигайте небольших целей, увеличивайте баллы и внедряйте инновации! ! !
1) Если взять в качестве примера определение объекта COCO общего набора данных в области обнаружения объектов, маленькие объекты относятся к размеру менее 32×32 пикселей (средние объекты относятся к 32*32-96*96, а большие объекты относятся к больше 96*96); 2) В реальных сценариях применения обычно предпочтительнее использовать соотношение относительно исходного изображения, чтобы определить: произведение длины и ширины поля метки объекта, разделенное на произведение длины и ширины всего изображения, а затем открыть квадратный корень. Если результат меньше 3%, просто назовите это малыми целями;
1) Количество образцов, содержащих мелкие цели, невелико, что потенциально позволяет модели обнаружения целей уделять больше внимания обнаружению средних и крупных целей;
2) Площадь, охваченная мелкими целями, меньше, поэтому места расположения мелких целей не будут разнообразными. Мы полагаем, что это затрудняет проверку возможности обобщения обнаружения небольших объектов;
3) Проблема сопоставления якорей сложна. В основном это касается метода, основанного на привязке. Поскольку поле gt и привязка небольшой цели очень малы, поле привязки и gt слегка смещаются, и IoU становится очень низким, что позволяет легко оценить его как отрицательную выборку. по сети;
4) Они не только мелкие, но и сложные, с различной степенью непроходимости, размытости и незавершенности;
Подождите, пока трудности
Адрес загрузки набора данных:
Single-frame InfraRed Small Target
Размер набора данных: 427 изображений, 3-кратное улучшение данных было выполнено для получения 1708 изображений, а окончательный обучающий набор, набор проверки и тестовый набор были случайным образом назначены как 8:1:1.
Оглавление
1. Введение в обнаружение малых целей
2. Небольшой целевой набор данных для этого столбца.
3. Направление оптимизации трудоёмкости малых целевых колонн.
3.2.1 Многоголовочный детектор
3.2.2 Эффективное двунаправленное межмасштабное соединение BiFPN и объединение взвешенных функций
3.2.4 Модуль многоветвевой свертки RFB
3.2.5 ЗОЛОТО-ЙОЛО, далеко впереди
3.3.1 Wasserstein Distance Loss
3.4.2 Многомасштабный термоядерный модуль «подключи и работай» EVC
3.4.3 Сеть агрегирования контекста и уточнения функций для обнаружения небольших целей
3.4.4 Эффективное многомасштабное внимание для межпространственного обучения EMA ICASSP2023 |
3.4.5 Динамическое разреженное внимание BiFormer CVPR 2023
3.4.6 LSKblockAttention | ICCV 2023
3.4.8 Приоритетное путаница (CPCA) |
3.4.8 Многомасштабный MultiSEAM
3.4.9 Легкое внимание MobileViTAttention | ECCV2022
3.4.10 Операция свертки внимания рецептивного поля
3.4.11 Dual-ViT: многомасштабный трансформер двойного видения
3.5.2 Деформируемая свертка DCNv3 CVPR2023
3.5.3 Новая частичная свертка (PConv) | CVPR2023 FasterNet
3.5.5 Динамическая свертка змеи ICCV2023
Посмотреть подробности:https://blog.csdn.net/m0_63774211/article/details/132322340
layers | parameters | GFLOPs | kb | mAP50 | |
---|---|---|---|---|---|
yolov8 | 168 | 3005843 | 8.1 | 6103 | 0.755 |
Wasserstein loss | 168 | 3005843 | 8.1 | 6103 | 0.784 |
yolov8_smallob | 207 | 2921172 | 12.2 | 6137 | 0.878 |
yolov8_SEAM | 219 | 3109331 | 8.3 | 6331 | 0.785 |
yolov8_SPD | 174 | 3598739 | 49.2 | 7394 | 0.875 |
yolov8_EVC | 217 | 7293523 | 11.5 | 14513 | 0.779 |
yolov8_BiFPN | 168 | 3005849 | 8.1 | 6104 | 0.766 |
yolov8_ContextAggregation | 195 | 3008092 | 8.1 | 6121 | 0.759 |
yolov8_EMA | 192 | 3006739 | 8.1 | 6114 | 0.766 |
yolov8_DCNV3 | 264 | 2892317 | 7.9 | 5892 | 0.765 |
yolov8_MCALayer | 209 | 2545659 | 7.2 | 5194 | 0.769 |
yolov8_BiFormerBlock | 204 | 3356179 | 22.4 | 6800 | 0.758 |
yolov8_LSKblockAttention | 201 | 3343333 | 8.7 | 6784 | 0.775 |
yolov8_GPFN | 216 | 2986131 | 8.1 | 6079 | 0.766 |
yolov8_C2f_Pconv | 177 | 2716883 | 7.6 | 5537 | 0.758 |
yolov8_ODConv | 179 | 3012110 | 7.9 | 6121 | 0.76 |
yolov8_TripletAttention | 201 | 3006443 | 8.2 | 6120 | 0.79 |
yolov8_ChannelAttention | 171 | 3137427 | 7.8 | 6428 | 0.815 |
yolov8_DySnakeConv | 229 | 3356287 | 8.5 | 6822 | 0.77 |
yolov8_MultiSEAM | 325 | 5742291 | 11711 | 0.87 | |
yolov8_MobileViTAttention | 241 | 3957659 | 11.1 | 7992 | 0.799 |
yolov8-RFA | 258 | 3019439 | 8.2 | 6166 | 0.765 |
yolov8_BasicRFB | 303 | 3440235 | 8.9 | 7040 | 0.762 |
yolov8_RepViTBlock | 186 | 3338387 | 7.9 | 6771 | 0.791 |
yolov8-goldyolo | 359 | 6015123 | 11.9 | 12123 | 0.768 |
yolov8_DualAttention | 186 | 4604819 | 8.3 | 9236 | 0.766 |
Следите за личными сообщениями, чтобы получить исходный код.