LM Studio для создания локальных больших моделей
LM Studio для создания локальных больших моделей

Ранее я уже рассказывал об Ollama. На этот раз я поделюсь еще одним инструментом для локального запуска больших моделей — LM Studio.

Что такое ЛМ Студия?

LM Studio — это настольное приложение для разработки и экспериментирования с LLM на вашем компьютере.

Ключевые функции

  • Настольное приложение для запуска локальных LLM
  • Знакомый интерфейс чата
  • Функция поиска и загрузки (через Hugging Face 🤗)
  • Локальный сервер, который может прослушивать аналогичные конечные точки OpenAI.
  • Система управления конфигурацией локальных моделей

Системные требования

LM Studio обычно поддерживает компьютеры Apple Silicon Mac, ПК с Windows x64/ARM64 и ПК с Linux x64.

macOS

  • Чип: Apple Silicon (M1/M2/M3/M4).
  • macOS 13.4 или выше.
    • для MLX Модель,нуждаться macOS 14.0 или выше.
  • Рекомендуется 16 ГБ+ памяти.
  • Возможно, вы по-прежнему сможете использовать LM Studio на Mac с 8 ГБ памяти, но придерживайтесь моделей меньшего размера и скромных размеров контекста.
  • Компьютеры Intel Mac в настоящее время не поддерживаются.

Windows

LM Studio поддерживает системы архитектуры x64 и ARM (Snapdragon X Elite).

  • ЦП: требуется поддержка набора инструкций AVX2 (для x64).
  • ОЗУ: LLM могут потреблять большие объемы ОЗУ. Рекомендуется не менее 16 ГБ оперативной памяти.

Linux

  • LM Studio для Linux распространяется как AppImage.
  • Требуется Ubuntu 20.04 или выше.
  • Поддерживает только x64, aarch64 пока не поддерживается.
  • Версии Ubuntu выше 22 плохо протестированы.
  • ЦП: центральный процессор
  • LM Studio по умолчанию поддерживает AVX2.

Как установить ЛМ Студию?

LM Studio доступна для macOS, Windows и Linux.

Перейти кСтраница загрузкии скачать Применимо Вы пользуетесь установщиком системы.

Установить китайский

Настройки нижнего правого угла

Установить каталог модели

В каталоге модели лучше всего не иметь специальных китайских символов, а лучше всего использовать английские буквы.

Скачать модель

Если у вас есть доступ к иностранным сайтам

Зеркало сайта скачать

https://hf-mirror.com/

Загрузите модель gguf и поместите ее в заданный ранее каталог модели.

Выбор модели

Размер файла модели меньше размера вашей собственной видеопамяти, но эффект однозначно будет лучше, если он будет ближе к размеру видеопамяти.

Модель GGUF

GGUF, полное название унифицированного формата, созданного GPT, — это новый формат файлов, специально используемый для хранения и обмена данными больших моделей машинного обучения. Этот формат оптимизирован для быстрой загрузки и сохранения моделей, что делает его более эффективным для вывода. GGUF может иметь несколько разных версий квантования: Q2, Q3, Q4, Q5, Q6, Q8. Эти числа представляют количество цифр веса модели. Чем больше количество цифр, тем выше точность модели. но места для хранения и вычислений требуется Чем больше ресурсов.

Не все модели в формате gguf можно запустить с помощью LM Studio. Вы можете открыть ссылку ниже, где все модели можно запустить с помощью LM Studio: https://hf-mirror.com/lmstudio-community *Квантование относится к преобразованию модели. в Преобразуйте числа высокой точности в числа низкой точности, чтобы уменьшить объем памяти и вычислительные требования модели.

Эту статью написал Маленькая Ма создать, принять Атрибуция Creative Commons 4.0 Лицензировано по международному лицензионному соглашению. Если не указана перепечатка/источник, все статьи на этом сайте являются оригинальными или переведены с этого сайта. Обязательно подпишитесь перед перепечаткой.

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода