Одна строка команд для запуска больших моделей локально и автономно.
Одна строка команд для запуска больших моделей локально и автономно.

Знакомство с Олламой

В одном предложении: Ollama — это инструмент, который позволяет запускать модели большого языка с открытым исходным кодом (LLM) локально на вашем компьютере.

Минималистичная установка и запуск больших моделей

Установите клиент: https://ollama.com/download

Просто скачайте и установите

Тогда ты сможешьTerminalсерединакомандаскачать、бежать по-крупному Модель,Например, ставший популярным в последнее время мистраль.,Около 4G.

После загрузки модели вы можете общаться прямо в Терминале.

Мой компьютер — MacBook Air M1, убогая версия, и это огромная карта для рассуждений.

Olamma поддерживает большие списки моделей.

https://ollama.com/library

Model

Parameters

Size

Download

Llama 2

7B

3.8GB

ollama run llama2

Mistral

7B

4.1GB

ollama run mistral

Dolphin Phi

2.7B

1.6GB

ollama run dolphin-phi

Phi-2

2.7B

1.7GB

ollama run phi

Neural Chat

7B

4.1GB

ollama run neural-chat

Starling

7B

4.1GB

ollama run starling-lm

Code Llama

7B

3.8GB

ollama run codellama

Llama 2 Uncensored

7B

3.8GB

ollama run llama2-uncensored

Llama 2 13B

13B

7.3GB

ollama run llama2:13b

Llama 2 70B

70B

39GB

ollama run llama2:70b

Orca Mini

3B

1.9GB

ollama run orca-mini

Vicuna

7B

3.8GB

ollama run vicuna

LLaVA

7B

4.5GB

ollama run llava

Gemma

2B

1.4GB

ollama run gemma:2b

Gemma

7B

4.8GB

ollama run gemma:7b

Gemma — это серия легких современных открытых моделей, созданных Google DeepMind.

Llama 2 — это серия базовых языковых моделей с параметрами от 7B до 70B.

Модель 7Б, выпущенная компанией Mistral, обновлена ​​до версии 0.2.

Mixtral — это высококачественная модель Mix of Experts (MoE) с открытыми весами, предоставляемыми Mistral AI.

LLaVA — это новая крупномасштабная мультимодальная модель, сочетающая в себе визуальный кодировщик и Vicuna для общего зрения и понимания языка. Обновлено до версии 1.6.

нейронный чат — это тонко настроенная модель, основанная на Mistral и охватывающая широкий спектр доменов и языков.

Codellama — это крупномасштабная языковая модель, которая может генерировать и обсуждать код с помощью текстовых подсказок.

Dolphin-mixtral — это точно настроенная модель без цензуры, основанная на экспертных моделях микширования Mixtral, которая хорошо справляется с задачами кодирования. Создан Эриком Хартфордом.

Mistral OpenOrca — это модель с 700 миллионами параметров, точно настроенная с использованием набора данных OpenOrca на основе модели Mistral 7B.

Orca-mini — модель общего назначения с параметрами от 3 миллиардов до 7 миллиардов, подходящая для оборудования начального уровня.

Phi-2: языковая модель 2,7B, разработанная Microsoft Research, которая демонстрирует отличные способности к рассуждению и пониманию языка.

DeepSeek Coder — это мощная модель кодирования, обученная на двух триллионах кодов и тегах естественного языка.

Модель Dolphin без цензуры на базе Mistral, которая хорошо справляется с задачами кодирования. Обновлено до версии 2.6.

Vicuna — это общая модель чата, основанная на Llama и Llama 2, с размерами контекста от 2 КБ до 16 КБ.

Wizard Vicuna Uncensored — это модель параметров 7B, 13B и 30B без цензуры, основанная на Llama 2, созданная Эриком Хартфордом.

Бета-версия Zephyr — это доработанная версия версии 7B от Mistral, обученная на общедоступных синтетических наборах данных.

OpenHermes 2.5 — это модель 7B, настроенная Teknium поверх Mistral с использованием полностью открытого набора данных.

Современная модель генерации кода.

Qwen 1.5 — это серия больших языковых моделей, предоставляемых Alibaba Cloud, с параметрами от 0,5B до 72B.

Модель на основе Llama 2, оптимизированная для улучшения возможностей общения на китайском языке.

Модель генерации кода на основе Code Llama.

Проект TinyLlama — это открытая попытка обучить компактную модель ламы размером 1,1 миллиарда долларов с использованием 3 триллионов токенов.

OpenChat — это серия моделей с открытым исходным кодом, обученных на различных данных, превосходящих производительность ChatGPT в различных тестах. Обновлено до версии 3.5-0106.

Orca 2 была создана Microsoft Research и представляет собой доработанную версию модели Llama 2 от Meta. Модель особенно хороша в рассуждениях.

Модель общего использования на основе Llama и Llama 2, предоставленная Nous Research.

2.7B модель Dolphin без цензуры, созданная Эриком Хартфордом на основе модели языка Phi от Microsoft Research.

TinyDolphin — это экспериментальная модель с параметрами 1.1B, основанная на новом наборе данных Эрика Хартфорда Dolphin 2.8 и обученная на TinyLlama.

Starling — это крупномасштабная языковая модель, обученная посредством обучения с подкреплением и обратной связью от искусственного интеллекта, ориентированная на повышение полезности чат-ботов.

Отличная модель генерации кода на основе Llama2.

StarCoder — это модель генерации кода, обученная на более чем 80 языках программирования.

Точная настройка модели Llama 2 для ответа на медицинские вопросы на основе набора медицинских данных с открытым исходным кодом.

BakLLaVA — это мультимодальная модель, дополненная базовой моделью Mistral 7B и архитектурой LLaVA.

Модель на базе Llama2 без цензуры с поддержкой контекстных окон размером 16 КБ.

Stable Code 3B — это модель, которая обеспечивает точное и быстрое завершение кода наравне с моделями, которые в 2,5 раза больше, например CodeLLaMA 7B.

Solar — это компактная, но мощная крупномасштабная языковая модель с поддержкой 10,7 млрд бит, предназначенная для одноразового общения.

Модель, основанная на Llama 2, оптимизированная для наборов данных в стиле Orca. Первоначально назывался Свободный Вилли.

SQLCoder — это модель завершения кода, настроенная для задач генерации SQL на основе StarCoder.

Расширение Mistral, поддерживающее контекстные окна размером 64 КБ или 128 КБ.

Модель Nous Hermes 2 от Nous Research, теперь обученная на Mixtral.

Саманта-Мистраль — помощница пар, обученная философии, психологии и личным отношениям. На базе Мистраля.

StableLM-Zephyr — это легкая модель чата, которая обеспечивает точный и быстрый вывод без необходимости использования высокопроизводительного оборудования.

Meditron — это крупномасштабная медицинская языковая модель с открытым исходным кодом, адаптированная из Llama 2 для медицинской сферы.

Wizard Vicuna — это модель с 13B параметрами, основанная на Llama 2, обученная MelodysDreamj.

Magicoder — это семейство моделей с 7B параметрами, обученных с использованием синтетических данных инструкций OSS-Instruct объемом 75 000, нового подхода к LLM, вдохновленного фрагментами кода с открытым исходным кодом.

Stable LM 2 1.6B — это современная модель небольшого языка со 160 миллионами параметров, обученная на многоязычных данных, охватывающих английский, испанский, немецкий, итальянский, французский, португальский и голландский языки.

Расширение для Llama 2, поддерживающее до 128 тысяч контекстов с тегами.

Мощное семейство моделей от Nous Research, которые превосходно справляются с задачами научного обсуждения и кодирования.

DeepSeek LLM — это усовершенствованная языковая модель, созданная с использованием 2 триллионов двуязычных токенов.

Расширение Llama 2, которое специально объединяет общее понимание языка со знаниями по конкретной предметной области, особенно в области программирования и математики.

Слияние модели Open Orca OpenChat и модели Garage-bAInd Platypus 2. Предназначен для чата и генерации кода.

Codebooga — это высокопроизводительная модель обучения кодированию, созданная путем объединения двух существующих моделей кода.

Nexus Raven — это модель инструкций 13B, настроенная для задач вызова функций.

MistralLite — это усовершенствованная модель на основе Mistral с расширенными возможностями обработки длинных контекстов.

Голиаф — это языковая модель, созданная путем объединения двух точно настроенных моделей Llama 2 70B в одну.

Notux — это высокопроизводительная экспертная смешанная модель, настроенная на высококачественные данные.

Alfred — это мощная диалоговая модель, предназначенная для использования в чате и коучинге.

MegaDolphin-2.2-120b — это преобразование, созданное путем чередования модели Dolphin-2.2-70b самой с собой.

Nomic-embed-text — это высокопроизводительная открытая модель внедрения с контекстным окном с тегами 8192.

Wizardlm — это универсальная модель использования, основанная на 7 миллиардах параметров Llama 2.

Xwinlm — это сессионная модель, основанная на Llama 2, которая показывает конкурентоспособные результаты в различных тестах.

Notus — это модель чата 7B, основанная на Zephyr, настроенная на использование высококачественных данных.

Duckdb-nsql — это модель преобразования текста в SQL с 7B параметрами, созданная MotherDuck и Numbers Station.

All-minilm — это модель внедрения очень больших наборов данных на уровне предложений.

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода