Кто-то сравнил производительность самых мощных на сегодняшний день графических процессоров A6000 и 3090. Пользователи сети заявили: они даже не могут себе этого позволить.

Shortcuts

Calendar Appointments

Invoice App Manage Accounts

User App Manage Users

Role Management Permission

Dashboard Analytics

Setting Account Settings

FAQs FAQs & Articles

Modals Useful Popups
- Notification
  8 New
- - Congratulation Lettie 🎉
    Won the monthly best seller gold badge
    
    1h ago
  - CF
    
    Charles Franklin
    Accepted your connection
    
    12hr ago
  - New Message ✉️
    You have new message from Natalie
    
    1h ago
  - Whoo! You have new order 🛒
    ACME Inc. made new order $1,154
    
    1 day ago
  - Application has been approved 🚀
    Your ABC project application has been approved.
    
    2 days ago
  - Monthly report is generated
    July monthly financial report is generated
    
    3 days ago
  - Send connection request
    Peter sent you connection request
    
    4 days ago
  - New message from Jane
    Your have new message from Jane
    
    5 days ago
  - CPU is running high
    CPU Utilization Percent is currently at 88.63%,
    
    5 days ago
- View all notifications

Кто-то сравнил производительность самых мощных на сегодняшний день графических процессоров A6000 и 3090. Пользователи сети заявили: они даже не могут себе этого позволить.

Отчет о сердце машины

Монтажер: Зенан

Пришло время состязания видеокарт, которое люди любят видеть.

Хотя большинство графических процессоров, которые люди сегодня используют для обучения глубокому обучению, производятся Nvidia, ее продукты часто затрудняют принятие решения при покупке.

В декабре прошлого года Nvidia обновила свою линейку видеокарт с профессиональным ускорением графики до архитектуры Ampere, из которых наиболее высокопроизводительная RTX A6000 привлекает наибольшее внимание.

Что касается базовых характеристик, A6000 основан на полном ядре графического процессора GA102 со встроенными 10752 ядрами CUDA и тензорным ядром третьего поколения с производительностью с плавающей запятой одинарной точности, достигающей 38,7 терафлопс. Объем видеопамяти достигает 48 ГБ, тип — GDDR6 (16 Гбит/с, GDDR6X не используется из-за низкой однокристальной емкости) и поддерживает проверку ECC.

A6000 использует традиционную конструкцию вентилятора с турбонаддувом и прямым обдувом и может построить систему с двумя картами и 96 ГБ видеопамяти. Он имеет слот PCIe 4.0 x16, обеспечивает 4 интерфейса DP 1.4 (без HDMI) и имеет номинальное энергопотребление. 300 Вт. Цена этой видеокарты составляет 5500 долларов США (около 36 000 юаней).

Флагманская потребительская видеокарта RTX 3090, выпущенная ранее, вдвое мощнее предыдущего поколения с точки зрения производительности и энергоэффективности. Когда она впервые поступила в продажу, было трудно найти одну карту из-за таких проблем, как ограниченность. мощности по производству чипов.

Будучи самой мощной видеокартой на данный момент в глазах геймеров и специалистов по глубокому обучению, 3090 имеет 10 496 ядер CUDA и производительность операций с плавающей запятой FP32, составляющую 35,6 терафлопс. Объем видеопамяти составляет 24 ГБ, а материал — самый дорогой GDDR6X. Он также поддерживает HDMI 2.1, может достигать высокой частоты обновления 4K или игр 8K, а номинальное энергопотребление составляет 350 Вт. Цена RTX 3090 составляет 1500 долларов США (публичная версия Национального банка стоит 11 999 юаней).

Lambda, которая рассмотрела эти две видеокарты, — это компания, которая создает серверы глубокого обучения. Они предоставляют специальные компьютеры для обучения искусственному интеллекту и часто публикуют обзоры оборудования для глубокого обучения. В этом обзоре эти лучшие графические процессоры сравниваются по скорости обучения моделей в среде глубокого обучения PyTorch.

A6000 против 3090, это дуэль двух сильнейших видеокарт в линейке продуктов Nvidia. Конечно, вы в лаборатории глубокого обучения хотите знать, какая из них лучше. Но, честно говоря, моей первой реакцией, когда я увидел это название, было то, что я не могу себе этого позволить:

Слушать тебя — все равно, что слушать тебя, но я все еще не могу себе этого позволить.

Судя по результатам оценки, трата в три раза больше денег на RTX A6000 не даст вам особого преимущества в задачах глубокого обучения:

использовать PyTorch Классификация обучающих изображенийсверточная нейронная сетьчас,существовать 32-bit Точнее, одна штука. RTX A6000 Скорость RTX 3090 из 0.92 раз; если использовать смешанную точность. 1.01 раз.
использовать PyTorch Язык обучения Модель transformer час,существовать 32-bit Точнее, одна штука. RTX A6000 Скорость RTX 3090 из 1.34 раз точность смешивания также высока; 1.34 раз.
существуют при параллельном подключении нескольких карт,использовать PyTorch Классификация обучающих изображенийсверточная нейронная сеть,существовать 32-bit Если быть точным, восемь долларов. RTX A6000 Скоростьвосемь юаней RTX 3090 из 1.13 раз; если использовать смешанную точность. 1.14 раз.
использовать PyTorch рамка Язык обучения Модель transformer,существовать 32-bit Если быть точным, восемь долларов. RTX A6000 Скоростьвосемь юаней RTX 3090 из 1.36 раз; если использовать смешанную точность. 1.33 раз.

Поэтому, похоже, если вы хотите продемонстрировать возможности A6000 в задачах глубокого обучения, вам нужно купить еще несколько графических процессоров.

Сравнение возможностей 3090 и A6000 при обучении сверточной нейронной сети PyTorch

Как показано на рисунке, 32-битное обучение модели изображения при использовании одного RTX A6000 происходит немного медленнее, чем при использовании одного RTX 3090. Но поскольку скорость связи между графическими процессорами выше, чем больше видеокарт у A6000, тем очевиднее преимущество. Результаты тестов модели зрения усреднены на SSD, ResNet-50 и Mask RCNN.

Сравнение возможностей 3090 и A6000 при обучении языковых моделей на фреймворке PyTorch

В отличие от модели изображения, RTX A6000 стабильно был более чем в 1,3 раза быстрее, чем RTX 3090 для протестированной языковой модели. Это может быть связано с более высокими требованиями к памяти языковых моделей. По сравнению с RTX 3090, RTX A6000 имеет более медленную, но большую память. Результаты тестирования языковой модели являются средними для базовой версии Transformer-XL и большой версии Transformer-XL.

Обратите внимание, что здесь при параллельном подключении графических процессоров вместо SLI используется NVLink. Однако, согласно механизму самого оборудования, потеря производительности будет больше при использовании SLI, поэтому нет смысла использовать последний.

Lambda открыла код для этой оценки: https://github.com/lambdal/deeplearning-benchmark.

На этом этапе вы сможете найти свой вариант графического процессора. В будущем компания также планирует использовать тот же контент, что и в этом тесте, для изучения возможностей глубокого обучения 3080Ti.

Справочное содержание:

https://lambdalabs.com/blog/nvidia-rtx-a6000-vs-rtx-3090-benchmarks/

Применение инструмента разработки диалогового искусственного интеллекта NVIDIA NeMo

Набор инструментов NeMo с открытым исходным кодом — это набор инструментов диалогового искусственного интеллекта, который объединяет автоматическое распознавание речи (ASR), обработку естественного языка (NLP) и синтез речи (TTS), что позволяет разработчикам легко и быстро использовать его «из коробки», а также легко и просто с помощью всего лишь несколько строк кода. Выполните соответствующие задачи в диалоговых сценариях ИИ.

Начиная с 12 августа,Эксперты NVIDIA привезутТри прямых эфираделиться,Через теоретическую интерпретацию и практическую демонстрацию,покажи какиспользовать NeMo быстрый Завершить быстроЗадача классификации текста、быстрый Быстрая сборкаИнтеллектуальная система вопросов и ответов.、构建智能Разговорный бот。

Живая ссылка：https://jmq.h5.xeknow.com/s/how4w（Нажмите, чтобы прочитать исходный текст напрямую）

Метод регистрации：Войдите в комнату прямой трансляции——Нажмите внизу в мобильной версии「Смотреть в прямом эфире」、Нажмите «Узнать сейчас» на ПК — после заполнения регистрационной формы вы сможете войти в комнату прямой трансляции для просмотра.

Группа общения и вопросов и ответов:Отсканируйте QR-код на странице сведений о комнате прямой трансляции, чтобы присоединиться.。

Пожалуйста, свяжитесь с этим общедоступным аккаунтом, чтобы получить разрешение на перепечатку.

Публикуйте статьи или ищите освещение: content@jiqizhixin.com

Рекомендация

Категории

тест Модель сверточная нейронная сеть глубокое обучение производительность

Новые посты

Объяснение прослушивателя серии Activiti7 последней версии 2023 года

API-интерфейс Jitu Express для электронных счетов-Express Bird [просто для понимания]

Каковы архитектуры микросервисов Java. Серверная часть плавающей области обслуживания

Описание трех режимов жизненного цикла службы внедрения зависимостей Asp.net Core.

Java реализует пользовательские аннотации для доступа к интерфейсу без проверки токена.

Серверная часть Unity добавляет поддержку .net 8. Я еще думал об этом два дня назад, и это сбылось.

Проект с открытым исходным кодом | Самый элегантный метод подписки на публичные аккаунты WeChat на данный момент

Разрешения роли пользователя Gitlab Гость, Репортер, Разработчик, Мастер, Владелец

Spring Security 6.x подробно объясняет механизм управления аутентификацией сеанса в этой статье.

[Основные знания ASP.NET] — Аутентификация и авторизация — Использование удостоверений для аутентификации.

Соединение JDBC с базой данных MySQL в jsp [легко понять]

[Уровень няни] Полный процесс развертывания проекта Python (веб-страницы Flask) в Docker.

6 способов чтения файлов свойств, рекомендуем собрать!

Графическое объяснение этапа строительства проекта IDEA 2021 Spring Cloud (базовая версия)

Подробное объяснение технологии междоменного запроса данных JSONP.

Учебное пособие по SpringBoot (14) | SpringBoot интегрирует Redis (наиболее полный во всей сети)

Подробное объяснение механизма подтверждения выпуска сообщений RabbitMQ.

На этот раз полностью поймите протокол ZooKeeper.

Реализуйте загрузку файлов с использованием минимального WEB API.

Демо1 Laravel5.2 — генерация и хранение URL-адресов

Spring boot интегрирует Kafka и реализует отправку и потребление информации (действительно при личном тестировании)

Мысли о решениях по внутренней реализации сортировки методом перетаскивания

Междоменный доступ к конфигурации nginx не может вступить в силу. Междоменный доступ к странице_Page

Как написать текстовый контент на php

PHP добавляет текстовый водяной знак или водяной знак изображения к изображениям – метод инкапсуляции

Интерпретация быстрой таблицы (TLB)

Интерфейс WeChat API (полный) — оплата WeChat/красный конверт WeChat/купон WeChat/магазин WeChat/JSAPI

Преобразование Java-объекта в json string_complex json-строки в объект

Примените сегментацию слов jieba (версия Java) и предоставьте пакет jar

matinal: Самый подробный анализ управления разрешениями во всей сети SAP. Все управление разрешениями находится здесь.

Congratulation Lettie 🎉

Charles Franklin

New Message ✉️

Whoo! You have new order 🛒

Application has been approved 🚀

Monthly report is generated

Send connection request

New message from Jane

CPU is running high

Объяснение прослушивателя серии Activiti7 последней версии 2023 года

API-интерфейс Jitu Express для электронных счетов-Express Bird [просто для понимания]

Каковы архитектуры микросервисов Java. Серверная часть плавающей области обслуживания

Описание трех режимов жизненного цикла службы внедрения зависимостей Asp.net Core.

Java реализует пользовательские аннотации для доступа к интерфейсу без проверки токена.

Серверная часть Unity добавляет поддержку .net 8. Я еще думал об этом два дня назад, и это сбылось.

Проект с открытым исходным кодом | Самый элегантный метод подписки на публичные аккаунты WeChat на данный момент

Разрешения роли пользователя Gitlab Гость, Репортер, Разработчик, Мастер, Владелец

Spring Security 6.x подробно объясняет механизм управления аутентификацией сеанса в этой статье.

[Основные знания ASP.NET] — Аутентификация и авторизация — Использование удостоверений для аутентификации.

Соединение JDBC с базой данных MySQL в jsp [легко понять]

[Уровень няни] Полный процесс развертывания проекта Python (веб-страницы Flask) в Docker.

6 способов чтения файлов свойств, рекомендуем собрать!

Графическое объяснение этапа строительства проекта IDEA 2021 Spring Cloud (базовая версия)

Подробное объяснение технологии междоменного запроса данных JSONP.

Учебное пособие по SpringBoot (14) | SpringBoot интегрирует Redis (наиболее полный во всей сети)

Подробное объяснение механизма подтверждения выпуска сообщений RabbitMQ.

На этот раз полностью поймите протокол ZooKeeper.

Реализуйте загрузку файлов с использованием минимального WEB API.

Демо1 Laravel5.2 — генерация и хранение URL-адресов

Spring boot интегрирует Kafka и реализует отправку и потребление информации (действительно при личном тестировании)

Мысли о решениях по внутренней реализации сортировки методом перетаскивания

Междоменный доступ к конфигурации nginx не может вступить в силу. Междоменный доступ к странице_Page

Как написать текстовый контент на php

PHP добавляет текстовый водяной знак или водяной знак изображения к изображениям – метод инкапсуляции

Интерпретация быстрой таблицы (TLB)

Интерфейс WeChat API (полный) — оплата WeChat/красный конверт WeChat/купон WeChat/магазин WeChat/JSAPI

Преобразование Java-объекта в json string_complex json-строки в объект

Примените сегментацию слов jieba (версия Java) и предоставьте пакет jar

matinal: Самый подробный анализ управления разрешениями во всей сети SAP. Все управление разрешениями находится здесь.