Я писал о NL2SQL в прошлом выпуске. Я считаю, что друзья, прочитавшие его, должны быть очень заинтересованы в исследовании и разработке больших моделей на уровне офиса взаимодействия с данными. На рынке также есть много коммерческих продуктов, таких как Alibaba Cloud. анализ ГБИ:
ChatBI от Tencent Cloud:
Можно сказать, что подобные продукты наиболее актуальны для бизнеса.
существуют во многих бизнес-сценариях,Что больше всего беспокоит пользователей, так это то, как быстро получить окончательные результаты данных.,Вместо понимания того, как данные извлекаются и обрабатываются. Сложный процесс сбора обучающих данных часто является дорогостоящим барьером.,А снижение этой стоимости напрямую связано с привлекательностью продукта и конверсией пользователей. Для наших технических специалистов,Хотя мышление в области НИОКР является основой,Но услуги, которые мы разрабатываем, в конечном итоге предназначены для лучшего удовлетворения потребностей бизнеса. С развитием технологий,Преобразование естественного языка в SQL (NL2SQL) стало будущей тенденцией разработки данных.,Это позволяет пользователям получать необходимые им данные с минимальными затратами на обучение.。ChatBIЭто конкретное проявление этой тенденции.,Это не только снижает технический порог,Это также значительно улучшило пользовательский опыт и конкурентоспособность продукта.,Сделайте анализ данных более интуитивным и эффективным.
Итак, в этой статье мы изучим такие технологии, как DB-GPT, как принципы продукта и структуры, которые объединяют LLM с базами данных, чтобы помочь нам по-настоящему применить их в нашем собственном бизнесе.
DB-GPT — это платформа разработки приложений для обработки данных искусственного интеллекта с открытым исходным кодом, использующая AWEL (язык выражений агентских рабочих процессов) и агентов. Разработан для упрощения создания приложений с большими моделями, особенно тех, которые связаны с базами данных. Он помогает предприятиям и разработчикам более удобно разрабатывать большие приложения на основе моделей за счет интеграции множества технических возможностей, таких как управление несколькими моделями (SMMF), оптимизация эффектов Text2SQL, оптимизация платформы RAG и совместная работа с несколькими агентами. Кроме того, DB-GPT также представляет AWEL (Agent Workflow Orchestration) для автоматизации сложных рабочих процессов и снижения рабочей нагрузки на кодирование, необходимой разработчикам. Вступая в эпоху Data 3.0, это означает, что разработчики могут быстро создавать свои собственные эксклюзивные приложения для обработки данных с меньшим количеством кода и более высокой эффективностью для продвижения бизнес-инноваций.
В этой статье в основном подробно объясняется система DB-GPT и дается подробное описание всей структуры искусственного интеллекта. Давайте посмотрим на всю архитектуру DB-GPT на рисунке выше.
В нижней части рамки находится DB-GPT-Hub,Это базовый уровень для обучения модели и подготовки данных. Оно включает в себя обучение различным техническим навыкам.,нравиться Text2SQL、Text2DSL、Text2API、Text2Vis ждать. Этот уровень обеспечивает мощную поддержку обучения для модулей и приложений верхнего уровня, чтобы гарантировать эффективность и точность модели.
AWEL (язык оркестрации рабочих процессов агента):AWEL Это язык протокола, используемый для определения рабочих процессов агентов и управления ими. На этом уровне AWEL предоставил DSL (предметно-ориентированный язык), AgentFrame (фреймворк агента), Operations (операторы), Parallelization (распараллеливание) и другие функции. Эти компоненты делают оркестрацию и выполнение рабочих процессов более гибкими и эффективными.
Уровень модуля содержит три основных основных модуля:
Уровень сервиса включает в себя несколько компонентов сервиса, таких как LLMServer(Сервис больших языковых моделей)、APIServer(APIСлужить)、RAGServer(RAGСлужить)а также dbgptServer(DBGPTСлужить)ждать。这些Служить组件共同支持上层应用的运行,Обеспечить стабильность и масштабируемость системы.
Уровень приложений показывает множество конкретных приложений, созданных на основе DB-GPT, в том числе DBGPTs、GBI、ChatDB、ChatData、KBQ4、ChatExcel ждать. Эти приложения ориентированы на различные потребности бизнеса и используют базовые технологии и сервисы для реализации автоматизированных процессов, от запросов на естественном языке до анализа данных.
Верхний слой — это слой визуализации. GPT-Vis,它включать了 Markdown、Charts、Flow、Graph、CodeFragment、StreamOutput、Table и другие инструменты визуализации. Эти инструменты помогают пользователям более интуитивно понимать и отображать результаты анализа данных.
Платформа также интегрирует несколько облачных сервисов и технологий контейнеризации, таких как Kubernetes, Ray, AWS, Alibaba Cloud и Private Cloud, для поддержки кроссплатформенного и мультисредового развертывания и эксплуатации.
С правой стороны рамки также выделена опора. Мониторинг、Оценка、Обратная связь、Тестирование и Отладка Инструменты и механизмы для обеспечения надежности системы и постоянной оптимизации.
Эта структура показывает DB-GPT Ее мощные функции и гибкость позволяют разработчикам использовать эту платформу для эффективной разработки и развертывания сложных приложений искусственного интеллекта, особенно в средах, управляемых базами данных. Вынимаем ключ основной модуль для обсуждения исследований.
Многомодельная структура управления (SMMF, Multi-Model Management Framework) — это ключевой компонент DB-GPT для управления и оптимизации нескольких больших языковых моделей (LLM). Его основная функция — предоставить разработчикам эффективный и гибкий способ одновременного управления несколькими моделями.,Тем самым улучшая производительность и эффективность приложений с большими моделями.,Особенно в сценариях, связанных с базами данных.
В приложениях уровня предприятия SMMF особенно подходит для сценариев, когда необходимо одновременно обрабатывать несколько задач или интегрировать несколько моделей. Например, интеллектуальной системе обслуживания клиентов может потребоваться одновременно обрабатывать запросы клиентов на естественном языке, рекомендации по продуктам и анализ настроений. Для выполнения каждой из этих задач могут потребоваться разные модели. SMMF может помочь предприятиям гибко управлять этими моделями и динамически корректировать их в соответствии с реальными потребностями для обеспечения эффективной работы системы.
как следует из названия,это своего родаПоиск(Retrieval)игенерировать(Generation)комбинированные технологии。Все начинается с использования огромной базы знаний.ПоискПредоставьте наиболее актуальную информацию по заданному вопросу.,а затем на основе этой информациигенерироватьотвечать。Преимущество этого заключается в том, что,Это позволяет модели полагаться не только на существующие знания.,Внешние данные также можно использовать в режиме реального времени для предоставления более точных и полных ответов.
Традиционные модели генеративного языка могут давать неточные или неполные ответы из-за отсутствия знаний по конкретной предметной области при работе с широкими темами или сложными запросами к базе данных. Объединив технологию поиска информации, платформа RAG сначала извлекает информацию, связанную с запросом, из соответствующих баз знаний или баз данных, а затем вводит эту информацию в генеративную модель. Этот метод эффективно компенсирует недостаток знаний о генеративной модели в конкретной области, тем самым повышая точность генерируемого контента.
существовать DB-GPT Средний, тряпка Фреймворк позволяет системе динамически обрабатывать сложные запросы на естественном языке. Для сложного запроса RAG Сначала выполните поиск по соответствующей схеме базы данных или записи данных, затем объедините эту информацию с запросом пользователя, чтобы сделать более точный и контекстно-зависимый SQL-запрос. Эта способность позволяет DB-GPT существование является более гибким и мощным при работе с разнообразными потребностями пользователей.
Автоматизация:自动化是 Agents Одна из основных функций модуля.。Это позволяет агентамсуществоватьбез вмешательства человека,На основе предопределенных правил или моделей,Самостоятельно выполнять задачи. Эта возможность значительно повышает эффективность системы.,Уменьшает необходимость в ручных операциях,Особенно при работе с повторяющимися задачами.,Функции автоматизации позволяют значительно повысить скорость выполнения и точность рабочих процессов.
План:Функция планирования позволяет агенту выполнять задачи в соответствии с входными данными.и Цель,Самостоятельно формулировать и корректировать планы выполнения задач. Агент анализирует сложность задачи, требования по времени и ограничения ресурсов.,придерживаться оптимального плана выполнения. Эта функция особенно важна в сложных многоэтапных задачах.,Это может гарантировать, что задачи выполняются эффективно в соответствии с оптимальным путем.
Мульти-роли:Эта функция позволяет одному агенту выполнять несколько ролей.,Или выполните сложную задачу посредством сотрудничества нескольких агентов. Многофункциональная функция обеспечивает гибкое распределение задач.,Убедитесь, что каждое задание выполняется наиболее подходящим персонажем или агентом. Такая гибкость позволяет системе справляться с разнообразными потребностями бизнеса и сложностью задач.
Управляемый данными:Управление данными означает, что агент может принимать решения на основе данных в реальном времени.и Выполнение задачи。Эта возможность позволяет агенту динамически корректировать свое поведение.,адаптироваться к изменениям в окружающей среде или обновлениям данных,Тем самым повышается точность и своевременность выполнения задач. Возможности, основанные на данных, гарантируют, что система существует в условиях неопределенности и динамических изменений.,Он по-прежнему может поддерживать эффективную и стабильную работу.
Агенты могут использовать RAGs Информация, предоставляемая модулем, расширяет возможности более точно понимать запросы пользователей и отвечать на них. Также можно использовать с SMMF Совместная работа модулей, динамический вызов и управление несколькими моделями гарантируют, что наиболее подходящая модель будет использоваться в различных сценариях задач для достижения наилучших результатов. Такая масштабируемость обеспечивает DB-GPT Платформа может адаптироваться к различным сложным сценариям применения и предоставлять индивидуально настраиваемые решения.
Вокруг больших языковых моделей、Набор данных Text2SQL、LoRA/QLoRA/Pturningждать微调方法构建的Автоматизированная точная настройка облегченного фреймворка, Сделайте тонкую настройку TextSQL такой же удобной, как сборочный конвейер.
Исходные данные пользователя сохраняются первыми,Обычно включает крупномасштабные наборы данных SQL-запросов для обучения.,Например, набор данных Spider. Набор данных Spider — это эталонный набор данных, широко используемый для задач преобразования текста в SQL.,Содержит большое количество SQL-запросов и соответствующих им описаний на естественном языке. Следующий,Сохраненные данные пройдут этап обработки данных.,Включая очистку, форматирование и предварительную обработку.,Чтобы гарантировать, что данные могут эффективно использоваться последующими моделями большого языка (LLM). Этот шаг имеет решающее значение,Потому что качественная обработка данных позволяет существенно улучшить обучающий эффект модели.
существоватьэтот этап,Загружаются предварительно обученные базовые модели большого языка (LLM). К этим моделям относятся GPT OpenAI, LLaMA Meta, BERT Google и т. д. Эти базовые модели были предварительно обучены на крупномасштабных данных.,Обладание мощными способностями к пониманию естественного языка,Однако существующие показатели в конкретных областях могут нуждаться в дальнейшей оптимизации.
Модель оптимизирована с помощью нескольких различных методов тонкой настройки.,В том числе LoRA (низкоранговое адаптивное), QLoRA (квантованное низкоранговое адаптивное), SST (пошаговое обучение масштабированию) и SPT (пошаговое обучение) и т. д. Эти методы могут сохранить мощные возможности исходной модели.,Внесите более детальные настройки в свою модель.,Сделайте так, чтобы он лучше справлялся с конкретными задачами. Например, предметно-ориентированный SQL,Улучшите эффект практического применения модели.
RLHF(Reinforcement Learning with Human Feedback):существовать После тонкой настройки,Модель дополнительно оптимизируется за счет обучения с подкреплением в сочетании с обратной связью от человека. Этот процесс постоянно корректирует модель, учитывая фактические отзывы пользователей.,Сделайте содержание ограниченности более соответствующим ожиданиям пользователей. от RLHF,Модели не только лучше понимают намерения пользователей,Может продолжать совершенствоваться,реагировать на меняющиеся потребности.
Итак, в следующей главе мы полностью развернем и создадим всю DB-GPT на облачном сервере вычислительной мощности для использования, а также проведем некоторую практическую проверку в соответствии с бизнесом.
Это все по этому вопросу. Меня зовут фанат. Если у вас есть вопросы, оставьте сообщение для обсуждения. Увидимся в следующем выпуске.