Кто-то сравнил производительность самых мощных на сегодняшний день графических процессоров A6000 и 3090. Пользователи сети заявили: они даже не могут себе этого позволить.
Кто-то сравнил производительность самых мощных на сегодняшний день графических процессоров A6000 и 3090. Пользователи сети заявили: они даже не могут себе этого позволить.

Отчет о сердце машины

Монтажер: Зенан

Пришло время состязания видеокарт, которое люди любят видеть.

Хотя большинство графических процессоров, которые люди сегодня используют для обучения глубокому обучению, производятся Nvidia, ее продукты часто затрудняют принятие решения при покупке.

В декабре прошлого года Nvidia обновила свою линейку видеокарт с профессиональным ускорением графики до архитектуры Ampere, из которых наиболее высокопроизводительная RTX A6000 привлекает наибольшее внимание.

Что касается базовых характеристик, A6000 основан на полном ядре графического процессора GA102 со встроенными 10752 ядрами CUDA и тензорным ядром третьего поколения с производительностью с плавающей запятой одинарной точности, достигающей 38,7 терафлопс. Объем видеопамяти достигает 48 ГБ, тип — GDDR6 (16 Гбит/с, GDDR6X не используется из-за низкой однокристальной емкости) и поддерживает проверку ECC.

A6000 использует традиционную конструкцию вентилятора с турбонаддувом и прямым обдувом и может построить систему с двумя картами и 96 ГБ видеопамяти. Он имеет слот PCIe 4.0 x16, обеспечивает 4 интерфейса DP 1.4 (без HDMI) и имеет номинальное энергопотребление. 300 Вт. Цена этой видеокарты составляет 5500 долларов США (около 36 000 юаней).

Флагманская потребительская видеокарта RTX 3090, выпущенная ранее, вдвое мощнее предыдущего поколения с точки зрения производительности и энергоэффективности. Когда она впервые поступила в продажу, было трудно найти одну карту из-за таких проблем, как ограниченность. мощности по производству чипов.

Будучи самой мощной видеокартой на данный момент в глазах геймеров и специалистов по глубокому обучению, 3090 имеет 10 496 ядер CUDA и производительность операций с плавающей запятой FP32, составляющую 35,6 терафлопс. Объем видеопамяти составляет 24 ГБ, а материал — самый дорогой GDDR6X. Он также поддерживает HDMI 2.1, может достигать высокой частоты обновления 4K или игр 8K, а номинальное энергопотребление составляет 350 Вт. Цена RTX 3090 составляет 1500 долларов США (публичная версия Национального банка стоит 11 999 юаней).

Lambda, которая рассмотрела эти две видеокарты, — это компания, которая создает серверы глубокого обучения. Они предоставляют специальные компьютеры для обучения искусственному интеллекту и часто публикуют обзоры оборудования для глубокого обучения. В этом обзоре эти лучшие графические процессоры сравниваются по скорости обучения моделей в среде глубокого обучения PyTorch.

A6000 против 3090, это дуэль двух сильнейших видеокарт в линейке продуктов Nvidia. Конечно, вы в лаборатории глубокого обучения хотите знать, какая из них лучше. Но, честно говоря, моей первой реакцией, когда я увидел это название, было то, что я не могу себе этого позволить:

Слушать тебя — все равно, что слушать тебя, но я все еще не могу себе этого позволить.

Судя по результатам оценки, трата в три раза больше денег на RTX A6000 не даст вам особого преимущества в задачах глубокого обучения:

  • использовать PyTorch Классификация обучающих изображенийсверточная нейронная сетьчас,существовать 32-bit Точнее, одна штука. RTX A6000 Скорость RTX 3090 из 0.92 раз; если использовать смешанную точность. 1.01 раз.
  • использовать PyTorch Язык обучения Модель transformer час,существовать 32-bit Точнее, одна штука. RTX A6000 Скорость RTX 3090 из 1.34 раз точность смешивания также высока; 1.34 раз.
  • существуют при параллельном подключении нескольких карт,использовать PyTorch Классификация обучающих изображенийсверточная нейронная сеть,существовать 32-bit Если быть точным, восемь долларов. RTX A6000 Скоростьвосемь юаней RTX 3090 из 1.13 раз; если использовать смешанную точность. 1.14 раз.
  • использовать PyTorch рамка Язык обучения Модель transformer,существовать 32-bit Если быть точным, восемь долларов. RTX A6000 Скоростьвосемь юаней RTX 3090 из 1.36 раз; если использовать смешанную точность. 1.33 раз.

Поэтому, похоже, если вы хотите продемонстрировать возможности A6000 в задачах глубокого обучения, вам нужно купить еще несколько графических процессоров.

Сравнение возможностей 3090 и A6000 при обучении сверточной нейронной сети PyTorch

Как показано на рисунке, 32-битное обучение модели изображения при использовании одного RTX A6000 происходит немного медленнее, чем при использовании одного RTX 3090. Но поскольку скорость связи между графическими процессорами выше, чем больше видеокарт у A6000, тем очевиднее преимущество. Результаты тестов модели зрения усреднены на SSD, ResNet-50 и Mask RCNN.

Сравнение возможностей 3090 и A6000 при обучении языковых моделей на фреймворке PyTorch

В отличие от модели изображения, RTX A6000 стабильно был более чем в 1,3 раза быстрее, чем RTX 3090 для протестированной языковой модели. Это может быть связано с более высокими требованиями к памяти языковых моделей. По сравнению с RTX 3090, RTX A6000 имеет более медленную, но большую память. Результаты тестирования языковой модели являются средними для базовой версии Transformer-XL и большой версии Transformer-XL.

Обратите внимание, что здесь при параллельном подключении графических процессоров вместо SLI используется NVLink. Однако, согласно механизму самого оборудования, потеря производительности будет больше при использовании SLI, поэтому нет смысла использовать последний.

Lambda открыла код для этой оценки: https://github.com/lambdal/deeplearning-benchmark.

На этом этапе вы сможете найти свой вариант графического процессора. В будущем компания также планирует использовать тот же контент, что и в этом тесте, для изучения возможностей глубокого обучения 3080Ti.

Справочное содержание:

https://lambdalabs.com/blog/nvidia-rtx-a6000-vs-rtx-3090-benchmarks/

Применение инструмента разработки диалогового искусственного интеллекта NVIDIA NeMo

Набор инструментов NeMo с открытым исходным кодом — это набор инструментов диалогового искусственного интеллекта, который объединяет автоматическое распознавание речи (ASR), обработку естественного языка (NLP) и синтез речи (TTS), что позволяет разработчикам легко и быстро использовать его «из коробки», а также легко и просто с помощью всего лишь несколько строк кода. Выполните соответствующие задачи в диалоговых сценариях ИИ.

Начиная с 12 августа,Эксперты NVIDIA привезутТри прямых эфираделиться,Через теоретическую интерпретацию и практическую демонстрацию,покажи какиспользовать NeMo быстрый Завершить быстроЗадача классификации текста、быстрый Быстрая сборкаИнтеллектуальная система вопросов и ответов.、构建智能Разговорный бот

Живая ссылка:https://jmq.h5.xeknow.com/s/how4w(Нажмите, чтобы прочитать исходный текст напрямую)

Метод регистрации:Войдите в комнату прямой трансляции——Нажмите внизу в мобильной версии「Смотреть в прямом эфире」、Нажмите «Узнать сейчас» на ПК — после заполнения регистрационной формы вы сможете войти в комнату прямой трансляции для просмотра.

Группа общения и вопросов и ответов:Отсканируйте QR-код на странице сведений о комнате прямой трансляции, чтобы присоединиться.。

© THE END 

Пожалуйста, свяжитесь с этим общедоступным аккаунтом, чтобы получить разрешение на перепечатку.

Публикуйте статьи или ищите освещение: content@jiqizhixin.com

boy illustration
Объяснение прослушивателя серии Activiti7 последней версии 2023 года
boy illustration
API-интерфейс Jitu Express для электронных счетов-Express Bird [просто для понимания]
boy illustration
Каковы архитектуры микросервисов Java. Серверная часть плавающей области обслуживания
boy illustration
Описание трех режимов жизненного цикла службы внедрения зависимостей Asp.net Core.
boy illustration
Java реализует пользовательские аннотации для доступа к интерфейсу без проверки токена.
boy illustration
Серверная часть Unity добавляет поддержку .net 8. Я еще думал об этом два дня назад, и это сбылось.
boy illustration
Проект с открытым исходным кодом | Самый элегантный метод подписки на публичные аккаунты WeChat на данный момент
boy illustration
Разрешения роли пользователя Gitlab Гость, Репортер, Разработчик, Мастер, Владелец
boy illustration
Spring Security 6.x подробно объясняет механизм управления аутентификацией сеанса в этой статье.
boy illustration
[Основные знания ASP.NET] — Аутентификация и авторизация — Использование удостоверений для аутентификации.
boy illustration
Соединение JDBC с базой данных MySQL в jsp [легко понять]
boy illustration
[Уровень няни] Полный процесс развертывания проекта Python (веб-страницы Flask) в Docker.
boy illustration
6 способов чтения файлов свойств, рекомендуем собрать!
boy illustration
Графическое объяснение этапа строительства проекта IDEA 2021 Spring Cloud (базовая версия)
boy illustration
Подробное объяснение технологии междоменного запроса данных JSONP.
boy illustration
Учебное пособие по SpringBoot (14) | SpringBoot интегрирует Redis (наиболее полный во всей сети)
boy illustration
Подробное объяснение механизма подтверждения выпуска сообщений RabbitMQ.
boy illustration
На этот раз полностью поймите протокол ZooKeeper.
boy illustration
Реализуйте загрузку файлов с использованием минимального WEB API.
boy illustration
Демо1 Laravel5.2 — генерация и хранение URL-адресов
boy illustration
Spring boot интегрирует Kafka и реализует отправку и потребление информации (действительно при личном тестировании)
boy illustration
Мысли о решениях по внутренней реализации сортировки методом перетаскивания
boy illustration
Междоменный доступ к конфигурации nginx не может вступить в силу. Междоменный доступ к странице_Page
boy illustration
Как написать текстовый контент на php
boy illustration
PHP добавляет текстовый водяной знак или водяной знак изображения к изображениям – метод инкапсуляции
boy illustration
Интерпретация быстрой таблицы (TLB)
boy illustration
Интерфейс WeChat API (полный) — оплата WeChat/красный конверт WeChat/купон WeChat/магазин WeChat/JSAPI
boy illustration
Преобразование Java-объекта в json string_complex json-строки в объект
boy illustration
Примените сегментацию слов jieba (версия Java) и предоставьте пакет jar
boy illustration
matinal: Самый подробный анализ управления разрешениями во всей сети SAP. Все управление разрешениями находится здесь.