Основы глубокого обучения Анализ классических моделей глубокого обучения Анализ стратегий оптимизации модели глубокого обучения Принципы глубокого обучения графического процессора и методы применения Анализ стратегий параллельного обучения графического процессора с глубоким обучением Практика обучения модели глубокого обучения с несколькими графическими процессорами
Обзор интеллектуальных диалоговых систем Анализ архитектуры многооборотной диалоговой системы Анализ архитектуры системы обеспечения качества Анализ архитектуры системы графа знаний Анализ архитектуры системы KBQA Анализ архитектуры генеративной диалоговой системы Перспективы развития интеллектуальных диалоговых систем Система графов знаний на практике
Обзор технологии больших моделей Подробное объяснение основных принципов моделей серии GPT (GPT1/GPT2/GPT3/GPT4/InstructGPT). Подробное объяснение основных принципов моделей серии LLaMA (LLaMA/Alpaca/Vicuna/BaiChuan/LLaMA2/BaiChuan2) Подробное объяснение исходного кода модели серии LLaMA. Подробное объяснение основных принципов моделей серии BLOOM (BLOOM/BLOOMZ). Подробные основные принципы моделей серии ChatGLM (ChatGLM/ChatGLM2) Подробное объяснение основных принципов структуры Langchain. Практика развертывания Langchain-LLM
Обзор тонкой настройки больших моделей Основные элементы тонкой настройки больших моделей Сбор и оценка данных при точной настройке большой модели Использование ChatGPT для тонкой настройки больших моделей. Подробное объяснение технологии настройки большой модели (подсказка-настройка/инструкция-настройка/P-настройка) Подробное объяснение технологии PEFT для крупных моделей (адаптер/LoRA) Подробное объяснение технологии полной настройки параметров для больших моделей (DeepSpeed) Подробное объяснение технологии RLHF для больших моделей (PPO/DeepSpeed-Chat) Практическая практика тонкой настройки больших моделей на основе обычных задач НЛП.
Создание среды обучения большой модели Сбор данных большой модели и разработка инструкций Общая разработка кода тонкой настройки больших моделей (поддерживает мультимодель/мультиплатформу) Реализация тонкой настройки LoRA с несколькими графическими процессорами Baichuan-13B Реализация полной настройки параметров многочипового процессора Baichuan-13B Построение системы оценки производительности большой модели Развертывание крупной модели и разработка сервисного интерфейса Разработка системы вызова интерфейса большой модели