Начало работы с nvidia-smi
Начало работы с nvidia-smi

Начало работы с nvidia-smi

представлять

nvidia-smi — инструмент для управления и мониторинга NVIDIA. Утилита командной строки для графического процессора. Он предоставляет простой и мощный способ просмотра использования графического процессора, температуры, использования памяти и другой информации, а также выполнения некоторых основных операций управления. Эта статья будетпредставлять Как использоватьnvidia-smiА также общие варианты использования и параметров.。

Установить

nvidia-smi обычно используется вместе с драйвером видеокарты NVIDIA. Если у вас уже есть соответствующий драйвер, вы можете запустить nvidia-smi прямо из командной строки.

Язык кода:javascript
копировать
plaintextCopy codenvidia-smi

Если nvidia-smi недоступен,вам нужно убедиться, что у вас есть правильный УстановитьNVIDIAДрайвер видеокарты。Вы можете посетить​Официальный сайт NVIDIA​Загрузите и Установитьпоследний Драйвер видеокартыпрограмма。

Основное использование

Когда вы запустите команду nvidia-smi, будет отображена информация обо всех доступных графических процессорах NVIDIA в текущей системе. Будут указаны индекс, температура, использование и другая информация для каждого графического процессора. Запустите следующую команду, чтобы просмотреть информацию о графическом процессоре в вашей системе:

Язык кода:javascript
копировать
bashCopy codenvidia-smi

Вы увидите вывод, аналогичный следующему:

Язык кода:javascript
копировать
plaintextCopy code+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39       Driver Version: 460.39       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:00:1E.0 Off |                    0 |
| N/A   41C    P8     8W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

Кроме того, nvidia-smi поддерживает множество других параметров командной строки для получения более подробной информации о графическом процессоре и выполнения некоторых операций управления.

Общие варианты

Ниже приведены распространенные параметры команды nvidia-smi:

  • ​--list-gpus​​:Только списокGPUИндекс、имя и общий объем памяти.
  • ​--query-gpu=QUERY​​:Используйте операторы запроса, чтобы получить более подробную информациюGPUинформация。Например,использовать​​--query-gpu=temperature.gpu,fan.speed,memory.total,memory.used​​доступныйGPUтемпература、скорость вентилятора и состояние памяти.
  • ​--format=FORMAT​​:Укажите выходной формат,Включая csv, json, xml и т. д.
  • ​--display=DISPLAY​​:Указатьинформацияотображается, в которомGPUначальство。
  • ​--gpu-reset​​:Сбросить указанноеGPU。
  • ​--help​​:показать помощьинформация。

Пример

Вот некоторые варианты использования Примера:

  1. Перечислите индексы и названия всех графических процессоров:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --list-gpus
  1. Получите температуру графического процессора и использование памяти:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --query-gpu=temperature.gpu,memory.used --format=csv
  1. Отображение информации о графическом процессоре для указанного индекса:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --display=1
  1. Сброс графического процессора для указанного индекса:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --gpu-reset=2

Мы можем выбрать подходящие опции и параметры в соответствии с реальными потребностями.

в заключение

nvidia-smi — бесплатная утилита командной строки для управления и мониторинга графических процессоров NVIDIA. Он предоставляет множество функций и опций, позволяющих пользователям легко просматривать состояние, производительность и использование памяти графического процессора. С nvidia-smi пользователи могут лучше понимать и управлять ресурсами своего графического процессора. Надеюсь, эта статья поможет вам понять и использовать nvidia-smi. Если у вас есть дополнительные вопросы о nvidia-smi, обратитесь к официальной документации или другим ресурсам для получения дополнительной информации.

Пример кода: используйте nvidia-smi для мониторинга температуры графического процессора и отправки предупреждений.

В некоторых сценариях приложений с интенсивным использованием графического процессора,Очень важно своевременно следить за температурой графического процессора. Ниже приведен пример кода,Получите температуру графического процессора с помощью nvidia-smi,и отправляет предупреждение, когда температура превышает пороговое значение.

Язык кода:javascript
копировать
pythonCopy codeimport subprocess
import smtplib
from email.mime.text import MIMEText
def get_gpu_temperature():
    result = subprocess.run(['nvidia-smi', '--query-gpu=temperature.gpu', '--format=csv,noheader'], capture_output=True, text=True)
    temperatures = result.stdout.strip().split('\n')
    return [int(temp) for temp in temperatures]
def send_email_alert(message):
    sender_email = 'your_email@example.com'
    receiver_email = 'recipient_email@example.com'
    password = 'your_email_password'
    
    msg = MIMEText(message)
    msg['Subject'] = 'GPU Temperature Alert'
    msg['From'] = sender_email
    msg['To'] = receiver_email
    
    with smtplib.SMTP_SSL('smtp.example.com', 465) as smtp:
        smtp.login(sender_email, password)
        smtp.send_message(msg)
# Установить порог температуры
temperature_threshold = 80
# Получить температуру графического процессора
gpu_temperatures = get_gpu_temperature()
# Проверьте, не превышает ли температура какого-либо графического процессора пороговое значение, и если да, отправьте оповещение по электронной почте.
for i, temp in enumerate(gpu_temperatures):
    if temp > temperature_threshold:
        message = f'GPU {i} temperature is {temp}°C, exceeding the threshold of {temperature_threshold}°C!'
        send_email_alert(message)

пожалуйста, обрати внимание,Перед запуском приведенного выше кода примера,Убедитесь, что ваша система правильно установлена ​​и настроена с помощью инструмента командной строки nvidia-smi.,и вы правильно настроилиSMTPсерверинформация。 начальствоописывать Пример Код вызывает​​nvidia-smi​​Заказ Получить температуру графического процессораинформация,ииспользовать​​subprocess​​захват модуля Заказ Выход выполнения。Затем,Он сравнивает полученную температуру с заданным порогом.,Если температура любого графического процессора превышает порог,будет отправлено оповещение по электронной почте。 Вы можете изменять и расширять его в соответствии с фактическими потребностями, например, добавляя такие функции, как запланированные проверки и запись исторических данных о температуре.

Примечание. Код примера предоставляет только базовую структуру.,При реальном применении необходимо вносить соответствующие изменения и корректировки в соответствии с конкретными обстоятельствами. в то же время,Если вы хотите перехватывать исключения и отправлять оповещения по электронной почте при аномальной температуре графического процессора.,Также необходимо настроить соответствующие механизмы обработки ошибок и циклов.,Обеспечить надежность и стабильность кода. кроме того,при отправке электронной почты,Пожалуйста, используйте SMTP-сервер легально,и соблюдать соответствующие политики безопасности и конфиденциальности.

Недостатки nvidia-smi

  1. Зависит от драйвера NVIDIA: nvidia-smi — это инструмент командной строки, предоставляемый NVIDIA.,Для установки и правильной работы он использует графический драйвер NVIDIA. Если драйвер неправильный или неисправен,nvidia-smi может работать неправильно.
  2. Применимо только к видеокартам NVIDIA: nvidia-smi можно использовать только для мониторинга и управления видеокартами NVIDIA, а не видеокартами других марок. Это ограничивает его применение в некоторых средах с гибридными графическими процессорами.
  3. Интерфейс командной строки: nvidia-smi взаимодействует через интерфейс командной строки, который может быть недостаточно интуитивным и дружелюбным для пользователей, не знакомых с операциями командной строки.
  4. Мониторинг в реальном времени не поддерживается: nvidia-smi — это статическая команда, которая обеспечивает однократный запрос информации о графическом процессоре. Если вам необходимо отслеживать такие параметры, как температура графического процессора, в режиме реального времени, вам необходимо использовать другие инструменты или писать собственные скрипты.

Похожие инструменты

  1. GPU-Z: GPU-Z — это инструмент для мониторинга и отображения информации о видеокарте. Он поддерживает видеокарты нескольких марок, включая NVIDIA, AMD и т. д. По сравнению с nvidia-smi, GPU-Z обеспечивает более дружественный графический интерфейс, который может динамически отображать такие параметры, как температура графического процессора, мощность, нагрузка и т. д., а также имеет некоторые дополнительные функции, такие как идентификация модели видеокарты, просмотр информации BIOS, и т. д.
  2. MSI Afterburner: MSI Afterburner — это инструмент для разгона видеокарт, который может отслеживать и настраивать параметры производительности видеокарт NVIDIA и AMD. Он обеспечивает мониторинг параметров графического процессора в режиме реального времени, таких как температура, частота, нагрузка и т. д., а также может отображать изменения производительности видеокарты с помощью диаграмм и журналов. Помимо функций мониторинга, он также поддерживает частотную модуляцию видеокарты, управление вентиляторами, перехват видео и другие функции.
  3. Open Hardware Monitor: Open Hardware Monitor — это инструмент мониторинга оборудования с открытым исходным кодом. Помимо поддержки мониторинга информации об оборудовании, такой как процессор и память, он также может отслеживать такие параметры, как температура графического процессора, нагрузка и частота. Он предоставляет графический интерфейс и интерфейс API, позволяющие пользователям просматривать состояние оборудования в режиме реального времени, а также может создавать отчеты и записи журналов. Все перечисленные выше инструменты можно использовать в качестве альтернативы nvidia-smi. Выберите подходящий инструмент для мониторинга и управления графическим процессором в соответствии с реальными потребностями. Эти инструменты предоставляют более богатые функции и более дружественные интерфейсы для удовлетворения потребностей различных пользователей.
boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода