Создано Datawhale: выпущено «Руководство по тонкой настройке развертывания большой модели GLM-4»!
Создано Datawhale: выпущено «Руководство по тонкой настройке развертывания большой модели GLM-4»!

Datawhale с открытым исходным кодом

Вклад открытого исходного кода: команда Datawhale, занимающаяся самостоятельной съемкой

Предисловие

Буквально вчера компания Zhipu AI выпустила новейшую модель GLM4 с открытым исходным кодом, которая обеспечивает лучшие результаты генерации благодаря 10Т высококачественных многоязычных данных и более передовым технологиям обучения.

Имея всего 9B параметров, он добился лучших результатов в таких задачах, как китайский язык, длинный текст и вызов инструментов.

Более подробную информацию об оценке см.:

Хардкорная оценка последней версии GLM-4 с открытым исходным кодом! Оценка участника Datawhale на 10 000 слов (1)

Взгляд разработчика на GLM-4-9B! Оценка участников Datawhale на 10 000 слов (2)

Введение в учебник

Придерживаясь цели предоставления открытого исходного кода, члены команды Datawhale выпустили модель. 12 Час внутри, для Разработан полный набор методик обучения GLM-4, включающий:

  1. Модель api развертывать;
  2. Доступ к Лангчейну;
  3. WebDemo развертывать;
  4. vLLM развертывать;
  5. Эффективная точная настройка инструкций LoRA。

Учебное пособиеобеспечивать код процесса снаружи,Он также вдумчиво предоставляет учащимсяданные обученияОбраз среды Autodl,Удобно для обучающихсяОдин клик для запуска!!

Адрес проекта: https://github.com/datawhalechina/self-llm/tree/master/GLM-4

Текущий проект официально рекомендован компанией Zhipu к изучению:

Здесь мы извлекаем часть контента, чтобы каждый мог понять этот урок~

Эффективная точная настройка инструкций LoRA

Сначала данные точной настройки инструкций создаются путем анализа шаблона внедрения подслова. Учебное пособие обеспечивает встраивание соответствия путем визуального просмотра шаблона до и после кодирования и проверки номеров специальных подслов поочередно.

Затем посредством иерархического анализа Модели,суждениематрица высшего порядкаРасположение,таким образом используя PEFT Инструмент указывает слой преобразования низкого ранга и включает его. LoRA Тонкая настройка.

Наконец, проверьте эффект тонкой настройки:

Язык кода:javascript
копировать
User: Мисс, другие красавицы все просятся, чтобы их выбрали, а мы, мисс, хотим, чтобы нас выгнали. Бодхисаттва должна помнить Женженер...

Assistant: Бодхисаттвы тоже видят вещи неправильно.

Введение в проект

《Большая модель с открытым исходным кодом Путеводитель по еде》это окружениеБольшая модель с открытым исходным кодом、противОтечественные новички、на основе AutoDL Эксклюзивная платформа для китайских малышей Модель Учебное пособие, для всех видов Большая модель с открытым исходным кодом Предложения включают в себяКонфигурация средылокальное развертываниеЭффективная точная настройкаждать Полное руководство процессом, включая навыки,упрощать Большая модель с открытым исходным процесс развертывания, использования и применения кода, чтобы больше обычных студентов и исследователей могли лучше использовать Большую модель с открытым исходным кодом,помощь Открытый исходный код, бесплатно большой Модель может быстрее интегрироваться в жизнь обычных учащихся.

удалять GLM4 Кроме того, проект поддержал LLama3, InternLM, Qwen1.5 ждать 20 предметовОткрытый исходный код Модельвесь процесс Учебное пособие,и,книгаэлемент Код проектаВсе с открытым исходным кодом!!Настройте пример вместеданные обучения,AutoDL зеркало окружающей долгождать, удобно использовать учащимся!

Проект уже реализован 4930 star~ садился много раз Github Trending список

Если вам это нравится, пожалуйста, поставьте нам звезду, чтобы помочь открыть исходный код (^▽^)

Конец статьи

Наконец, из-за нехватки времени и ограниченности энергии команды участников в руководствах неизбежно присутствуют некоторые упущения и даже ошибки. Мы надеемся, что учащиеся смогут активно давать нам предложения во время обучения или напрямую вносить свой вклад в проект. отшлифовать учебные пособия и подготовиться к будущему. Предоставляйте учащимся более качественный контент.

Адрес проекта: https://github.com/datawhalechina/self-llm/tree/master/GLM-4

Открытый исходный код вклад,Нравитьсязаглянуть↓

boy illustration
Подробное объяснение технологии междоменного запроса данных JSONP.
boy illustration
Учебное пособие по SpringBoot (14) | SpringBoot интегрирует Redis (наиболее полный во всей сети)
boy illustration
Подробное объяснение механизма подтверждения выпуска сообщений RabbitMQ.
boy illustration
На этот раз полностью поймите протокол ZooKeeper.
boy illustration
Реализуйте загрузку файлов с использованием минимального WEB API.
boy illustration
Демо1 Laravel5.2 — генерация и хранение URL-адресов
boy illustration
Spring boot интегрирует Kafka и реализует отправку и потребление информации (действительно при личном тестировании)
boy illustration
Мысли о решениях по внутренней реализации сортировки методом перетаскивания
boy illustration
Междоменный доступ к конфигурации nginx не может вступить в силу. Междоменный доступ к странице_Page
boy illustration
Как написать текстовый контент на php
boy illustration
PHP добавляет текстовый водяной знак или водяной знак изображения к изображениям – метод инкапсуляции
boy illustration
Интерпретация быстрой таблицы (TLB)
boy illustration
Интерфейс WeChat API (полный) — оплата WeChat/красный конверт WeChat/купон WeChat/магазин WeChat/JSAPI
boy illustration
Преобразование Java-объекта в json string_complex json-строки в объект
boy illustration
Примените сегментацию слов jieba (версия Java) и предоставьте пакет jar
boy illustration
matinal: Самый подробный анализ управления разрешениями во всей сети SAP. Все управление разрешениями находится здесь.
boy illustration
Коротко расскажу обо всем процессе работы алгоритма сборки мусора G1 --- Теоретическая часть -- Часть 1
boy illustration
[Спецификация] Результаты и исключения возврата интерфейса SpringBoot обрабатываются единообразно, поэтому инкапсуляция является элегантной.
boy illustration
Интерпретация каталога веб-проекта Flask
boy illustration
Что такое подробное объяснение файла WSDL_wsdl
boy illustration
Как запустить большую модель ИИ локально
boy illustration
Подведение итогов десяти самых популярных веб-фреймворков для Go
boy illustration
5 рекомендуемых проектов CMS с открытым исходным кодом на базе .Net Core
boy illustration
Java использует httpclient для отправки запросов HttpPost (отправка формы, загрузка файлов и передача данных Json)
boy illustration
Руководство по развертыванию Nginx в Linux (Centos)
boy illustration
Интервью с Alibaba по Java: можно ли использовать @Transactional и @Async вместе?
boy illustration
Облачный шлюз Spring реализует примеры балансировки нагрузки и проверки входа в систему.
boy illustration
Используйте Nginx для решения междоменных проблем
boy illustration
Произошла ошибка, когда сервер веб-сайта установил соединение с базой данных. WordPress предложил решение проблемы с установкой соединения с базой данных... [Легко понять]
boy illustration
Новый адрес java-библиотеки_16 топовых Java-проектов с открытым исходным кодом, достойных вашего внимания! Обязательно к просмотру новичкам