Пошаговое руководство по распознаванию вращающихся объектов (OBB) YOLO11: как обучить собственный набор данных (примером является QR-код)
Пошаговое руководство по распознаванию вращающихся объектов (OBB) YOLO11: как обучить собственный набор данных (примером является QR-код)

💡💡💡Содержание этой статьи: YOLO11 OBB реализует обнаружение цели вращения дефектов в своем собственном наборе данных, начиная с 1) маркировки данных 2) преобразования формата данных json в формат txt, подходящий для yolo; 3) обучения модели;

1.Введение YOLO11

Ultralytics YOLO11 — передовая, современная модель.,Он основан на успехе предыдущих выпусков YOLO.,и представляет новые функции и улучшения,для дальнейшего улучшения производительности и гибкости。YOLO11 спроектирован так, чтобы быть быстрым, точным и простым в использовании, что делает его отличным выбором для различных задач обнаружения и отслеживания объектов, сегментации экземпляров, классификации изображений и задач оценки позы.

Представители OBB провели дополнительные тесты набора данных (DOTAv1):

2. Знакомство с вращающейся мишенью OBB.

Формат YOLO OBB определяет ограничивающую рамку четырьмя угловыми точками с координатами, нормализованными между 0 и 1. Он имеет следующий формат:

Язык кода:javascript
копировать
class_index, x1, y1, x2, y2, x3, y3, x4, y4

Внутренне YOLO обрабатывает потери и выводит результаты в формате xywhr, который представляет центральную точку (xy), ширину, высоту и вращение ограничивающей рамки.

2.1 скачать этикетку

Язык кода:javascript
копировать
# Установить ярлык
pip install labelme

2.2 Использование ярлыка

Запуск непосредственно в среде Python

Язык кода:javascript
копировать
labelme

2.3 введение в этикетку

1) Create Polygons создает многоугольный блок;

3. Знакомство с набором данных вращения QR-кода.

Обучающий набор, проверочный набор и тестовый набор составляют: 1894, 100 и 101 изображение соответственно.

3.1 obb генерирует txt, подходящий для формата yolo

obb_json_to_txt

Пошаговое руководство по распознаванию вращающихся объектов (OBB) YOLO11: аннотация набора данных | Преобразование формата данных Как обучать и тестировать — блог CSDN

4. Тренировка с вращающейся мишенью OBB

Просто скачайте последнюю версию, которая уже поддерживает OBB.

GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite

4.1 qrcode-obb.yaml

Язык кода:javascript
копировать
path: D:/ultralytics-11/data/qrcode-obb/ 
train: train/images
val: valid/images
test: test/images

names: 
  0: qr_code

4.2 Как тренироваться

Язык кода:javascript
копировать
import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
    model = YOLO('ultralytics/cfg/models/11/yolo11-obb.yaml')
    #model.load('yolov11.pt') # loading pretrain weights
    model.train(data='data/qrcode-obb.yaml',
                cache=False,
                imgsz=640,
                epochs=200,
                batch=16,
                close_mosaic=10,
                device='0',
                optimizer='SGD', # using SGD
                project='runs/train',
                name='exp',
                )

4.3 Визуализация результатов обучения

Язык кода:javascript
копировать
YOLO11-obb summary (fused): 300 layers, 2,897,630 parameters, 0 gradients, 6.6 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 7/7 [00:04<00:00,  1.53it/s]
                   all         99        128      0.953      0.955      0.966      0.908
boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.