Исследование и практика реального бизнес-производства и применения GBI (генеративная бизнес-аналитика)
Исследование и практика реального бизнес-производства и применения GBI (генеративная бизнес-аналитика)
Предисловие
Недавно я узнал о концепции генеративного бизнес-аналитики, изучая, как развивать движущую силу ИИ в бизнесе. В то же время я также изучаю фактическое применение технологии ChatBI. На самом деле, эти две технологии имеют почти одно и то же значение. с точки зрения эффекта реализации GBI (генеративная бизнес-аналитика) более ориентирована на бизнес, а ChatBI более ориентирован на технические аспекты. Конечная цель обоих — позволить предприятиям быстрее перейти от данных к принятию решений и удовлетворить потребности предприятий в анализе данных в различных сценариях.
В частности, основной функцией первого является автоматическое генерирование многоуровневой бизнес-информации, углубленного анализа и результатов прогнозирования с помощью генеративных моделей. Такая система может учиться на мультимодальных данных, не только ограничиваясь существующими данными, но также обеспечивать перспективный анализ и персонализированные предложения в новых бизнес-сценариях. Основная функция ChatBI — анализ запросов пользователей с помощью технологии обработки естественного языка и предоставление анализа и отчетов на основе существующих данных в режиме чата. Эта система в основном опирается на вопросы пользователей и заранее установленные правила запроса данных, уделяя особое внимание упрощению доступа к данным и процесса их получения посредством диалога.
Если ИИ-агент можно обучить интеллектуальному анализу конкретных полевых сценариев и объединить его с данными, полученными интуитивно и быстро через ChatBI, можно будет принимать более точные и точные решения. Основываясь на вышеизложенных концепциях, бизнес можно спроектировать для поддержки модели дизайна. Я провел некоторые исследования в этой области и теперь поделюсь ими с вами. Я с нетерпением жду ваших отзывов и мыслей.
1. Что такое ГБИ?
Генеративный бизнес-аналитик (GBI) — это новая форма бизнес-аналитики (BI), которая использует генеративный искусственный интеллект (например, GPT, BERT и другие большие языковые модели) для автоматизированного бизнес-анализа, анализа данных и поддержки бизнес-решений. В отличие от традиционных систем бизнес-аналитики, которые полагаются на структурированные данные и предопределенные отчеты, GBI учится на массивных данных и обеспечивает более гибкий и динамичный бизнес-анализ благодаря возможностям интеллектуального генерирования данных.
Основные технологии GBI включают генеративные модели искусственного интеллекта, алгоритмы адаптивного обучения и обработку естественного языка (NLP). Эти технологии могут извлекать информацию из огромных массивов данных из нескольких источников и напрямую предоставлять пользователям персонализированные аналитические отчеты и бизнес-аналитики путем создания контента. Эта возможность позволяет GBI динамически реагировать на сложные бизнес-потребности, не полагаясь на предопределенные запросы и отчеты. Традиционный BI требует, чтобы пользователи выполняли запросы вручную, тогда как GBI может анализировать динамические данные в режиме реального времени:
GBI позволяет пользователям взаимодействовать с системой посредством естественного языка. Пользователи могут описывать свои потребности посредством языка, не осваивая сложные SQL-запросы или методы моделирования данных, а система автоматически генерирует соответствующие результаты с помощью генеративного искусственного интеллекта.
Существует множество реальных сценариев использования GBI в бизнесе, например:
Персонализированный маркетинг и прогнозирование спроса
проходить GBI Анализируйте исторические данные о продажах, рыночные тенденции и отзывы клиентов для разработки персонализированных маркетинговых стратегий. Например, ГБИ Рекомендуемые продукты и планы продвижения могут автоматически генерироваться на основе истории покупок клиентов.
Система GBI может извлекать тенденции из различных типов данных (данные о продажах, комментарии в социальных сетях, динамика рынка), автоматически генерировать отчеты о прогнозах потребительского спроса и помогать компаниям оптимизировать управление запасами.
Пример:
GBI автоматически генерирует прогнозы продаж: на основе сезонных тенденций и анализа социальных сетей.,Создайте отчет о прогнозе спроса на продукцию на следующие три месяца.,Помогите компаниям заранее спланировать запасы.
GBI анализирует отзывы клиентов: метод анализирует данные отзывов клиентов,Создавайте отчеты об удовлетворенности конкретными продуктами,И вносить предложения по оптимизации продуктов.
Автоматическое формирование финансовой отчетности и управление рисками
Используйте GBI для автоматического создания квартальных финансовых отчетов, охватывающих такие ключевые показатели, как доходы, расходы, анализ прибыли и многое другое. GBI собирает данные из нескольких финансовых систем и генерирует описания на естественном языке, сокращая количество ручных операций.
GBI также может отслеживать динамику рынка в режиме реального времени, анализировать факторы, которые могут повлиять на финансовые риски (например, колебания процентных ставок, аномальные изменения рынка), и автоматически создавать отчеты по анализу рисков, чтобы помочь руководству сформулировать стратегии реагирования на риски.
Пример:
GBI автоматически формирует финансовую отчетность: проводит сбор всех данных финансовой системы.,Автоматически формировать квартальные и годовые финансовые отчеты,И предоставлять персонализированные финансовые консультации с учетом меняющихся рыночных условий.
GBI Мониторинг рисков: мониторинг валютного рынка в режиме реального времени, проведение генеративных AI Автоматически генерирует прогнозы возможных рыночных рисков и рекомендует корректировку портфеля.
Оптимизация производства и управление цепочками поставок
GBI проводит анализ данных датчиков производственной линии, данных о поставках сырья и данных заказов клиентов.,Автоматически формировать отчеты по оптимизации производственного процесса,Помогите компаниям увеличить производственные мощности.
GBI может создавать отчеты по управлению цепочкой поставок,Анализируйте работу поставщиков, задержки поставок и состояние запасов.,Предложить стратегии по оптимизации цепочки поставок.
Пример:
Отчет по оптимизации производственного процесса: GBI формирует отчеты по техническому обслуживанию оборудования и оптимизации мощности на основе данных производственной линии.,Помогите заводам автоматически обнаруживать неисправности и давать рекомендации по техническому обслуживанию.
Прогноз цепочки поставок: GBI автоматически анализирует данные цепочки поставок,Создавайте отчеты о работе поставщиков и прогнозируйте риски в цепочке поставок.,Компаниям рекомендуется менять поставщиков и корректировать заказы.
GBI находится на стадии быстрого развития. Он сочетает в себе мощные возможности генеративного искусственного интеллекта с аналитической глубиной традиционного бизнес-аналитики, обеспечивая предприятиям более гибкую, динамичную и персонализированную поддержку бизнес-решений. Несмотря на то, что GBI сталкивается с некоторыми техническими и коммерческими проблемами по мере развития технологии и расширения ее практического применения, она продемонстрировала широкие перспективы применения во многих отраслях. В будущем ее возможности автоматизации и генерации будут продолжать способствовать изменениям в бизнес-решениях, основанных на данных. .
2. Общий проект архитектуры GBI
Глубокая архитектура реализации GBI (генеративной бизнес-аналитики) требует интеграции множества технологий и систем для поддержки сбора, обработки, анализа данных, применения генеративных моделей и поддержки бизнес-решений конечных пользователей. При проектировании такой архитектуры необходимо всесторонне учитывать производительность системы, масштабируемость, возможности обработки данных, эффективность генеративной модели искусственного интеллекта и удобство взаимодействия с пользователем с точки зрения выбора технологии.
Общую архитектуру GBI можно разделить на следующие ключевые уровни:
уровень данных:Ответственный за данныеизколлекция、хранилищеиуправлять,Поддерживает обработку структурированных и неструктурированных данных.
слой модели:В основном содержит Генеративный AI модели, модели обработки естественного языка и модели анализа данных.
уровень обслуживания:Обеспечить формирование отчетов、Запрос данных、Взаимодействие с пользователем и другие основные бизнес-функции с использованием API-услуг.
Прикладной уровень:пользовательпроходить Прикладной Уровень взаимодействует с системой для получения бизнес-информации и поддержки принятия решений.
Язык кода:bash
копировать
+-----------------------+ +-------------------------+
| Прикладной уровень (UI) |<------>| Служба взаимодействия с пользователем (NLP) |
+-----------------------+ +-------------------------+
^ |
| v
+----------------------+ +-------------------------+
| Уровень бизнес-логики обслуживания (API) |<------>| Генеративный AI слой модели |
+----------------------+ +-------------------------+
^ |
| v
+-----------------------+ +-------------------------+
| Уровень обработки и анализа данных |<------>| Хранение и управление данными |
+-----------------------+ +-------------------------+
1. Уровень данных
GBI необходимо обрабатывать разнородные данные из нескольких источников, поэтому структура уровня данных должна иметь надежные возможности сбора, хранения и обработки данных, а также поддерживать структурированные, полуструктурированные и неструктурированные данные.
технология хранения данных:
Реляционная база данных (например, MySQL, PostgreSQL):используется дляхранилище结构化数据,Например, записи транзакций, данные о продажах и т. д.
База данных NoSQL (например, MongoDB, Cassandra):используется дляхранилище半结构化илинеструктурированные данные,Например, комментарии клиентов, файлы журналов и т. д.
Озеро данных (например, Hadoop, Amazon S3):используется дляхранилище大规模изнеобработанные данные,Поддержка пакетной обработки данных.
Технология сбора данных:
Инструменты ETL (извлечение, преобразование, загрузка):нравиться Apache Нифи, Таленд, по разным источникам, таким как CRM、ERP、IoT Извлечь данные из оборудования) и выполнить очистку и преобразование.
Обработка потока данных в реальном времени (например, Apache Kafka, Flink):используется для实时数据коллекция,Например, отслеживание поведения пользователей и данные мониторинга в реальном времени.
Интеграция и управление данными:
Инструменты интеграции данных:нравиться Apache Camel и MuleSoft поддерживают интеграцию и синхронизацию данных между разнородными системами.
Управление метаданными и управление данными:проходитьинструментнравиться Apache Atlas или Collibra Осуществлять управление активами данных и мониторинг качества данных.
2. Слой модели
Уровень модели является ядром системы GBI и отвечает за обучение, вывод и развертывание генеративных моделей ИИ. Этот уровень включает в себя различные модели для анализа данных, создания отчетов и обработки естественного языка. Выбор технологий в основном вращается вокруг генеративных моделей искусственного интеллекта и обработки естественного языка:
При исследовании и реализации приложений AIGC трудно избежать прямой связи с сервисами моделей. Однако в настоящее время не существует фактического стандарта для развертывания больших моделей. Постоянно выпускаются новые модели и постоянно предлагаются новые методы обучения. Нам нужно потратить время. Требуется много времени, чтобы адаптироваться к изменяющейся среде базовой модели, что в определенной степени ограничивает исследование и внедрение приложений AIGC.
Понятие этого уровня можно найти в DB-GPT. DB-GPT предлагает сервис-ориентированную структуру многомодельного управления (SMMF).
SMMF состоит из двух частей: уровня вывода модели и уровня развертывания модели. Уровень вывода модели соответствует платформе вывода модели vLLM, TGI, TensorRT и т. д. Уровень развертывания модели соединяется вниз с уровнем вывода и предоставляет возможности обслуживания модели вверху. Платформа развертывания модели основана на платформе вывода и предоставляет такие возможности, как несколько экземпляров модели, несколько платформ вывода, мультиоблачность, автоматическое расширение и сжатие, а также наблюдаемость.
2.1. Верхний уровень (сервисный и прикладной уровень)
Этот уровень представляет различные службы и приложения над SMMF, в том числе:
DB-GPT Web Server:提供пользовательинтерфейс,允许пользовательпроходить Web Интерфейс взаимодействует с моделью.
Агентская система:используется дляуправлятьи Планирование AI актерское мастерство.
Model Management API:提供模型управлятьизинтерфейс,для моделииззарегистрироваться、нагрузка、Удаление и другие операции.
Инструменты командной строки:Можетпроходить CLI Взаимодействие с системой, обычно используемой разработчиками, а также персоналом по эксплуатации и техническому обслуживанию для управления и эксплуатации.
2.2. Уровень структуры развертывания модели
Этот уровень является базовой структурой, отвечающей за управление и планирование нескольких моделей, в том числе:
API Server:для Прикладной уровень предоставляет интерфейс для передачи пользовательских запросов в модель для вывода.
Model Handle:Обработка экземпляров моделииззапрос на звонок,Управляйте моделью из потока запросов на вывод.
Model Controller
: Этот модуль состоит из двух частей:
Model Registry:记录所有зарегистрироватьсяиз Информация о модели,Включая версию, путь и т. д.
Model Manager:负责управлять模型изжизненный цикл(нравитьсянагрузка、возобновлять、Удалить ожидание).
Model Worker:Ответственный за реальностьизрассуждение,Непосредственное подключение к системе рассуждений.
2.3. Уровень структуры рассуждений
Этот уровень содержит фактическую машину вывода, которая отвечает за выполнение задач вывода большой языковой модели:
vLLM、llama.cpp и FastChat:Этидасистема рассуждений,Модели могут быть развернуты в этих средах.,Ответственный за получение API Запрашивает и возвращает результаты вывода.
Большие языковые модели (LLM):Это включает в себя конкретныеиз Экземпляр модели,нравиться Vicuna、Llama、Baichuan、ChatGLM。Эти模型да Ответственный за создание контентаизосновная часть,Они представляют собой основу для рассуждений для выполнения практических расчетов.
2.4. базовая среда развертывания
Этот уровень показывает инфраструктуру, на которой основана фактическая модель развертывания и структура вывода:
Kubernetes:для оркестровки контейнеров,Поддержка крупномасштабного развертывания и расширения моделей.
Ray:Распределенная вычислительная среда,Обеспечивает эффективное распараллеливание и планирование задач.
AWS、Алибаба Облако и частное облако:Выражайте разныеиз Облачная платформа,Поддержка потребностей развертывания различных предприятий.
2.5. Понимание потока данных
Вывод модели:当пользователь请求проходить API Server При передаче Модель Handle найду подходящий Model Экземпляры (экземпляры модели), а в Model Worker Сделайте выводы.
Deploy/Reload (развертывание и перезагрузка):Model Manager Отвечает за управление загрузкой, повторным развертыванием и обновлением моделей, чтобы гарантировать, что во время вывода используется правильная версия модели.
3. Сервисный уровень
Уровень обслуживания в основном отвечает за раскрытие возможностей уровня модели внешнему миру и предоставление прикладному уровню таких функций, как запросы, генерация данных и генерация отчетов через API. При проектировании этого уровня необходимо учитывать масштабируемость, высокую производительность и низкую задержку, и он отвечает за управление запросами модели, рассуждениями и взаимодействием с приложениями верхнего уровня. Это гарантирует, что пользователи могут беспрепятственно получать доступ к базовой модели и использовать ее через API, а также обрабатывает полный жизненный цикл пользовательских запросов. При проектировании этого уровня обслуживания необходимо учитывать высокий уровень параллелизма, низкую задержку, масштабируемость и отказоустойчивость.
3.1. Общая архитектура сервисного уровня
Основная функция уровня обслуживания — обработка запросов на вывод модели, управление жизненным циклом модели, балансировка нагрузки и т. д. К его основным компонентам относятся:
API Gateway:Ответственный за получениепользователь请求,и маршрут к соответствующему сервису модели.
Model Handle:Обработка запросов на вывод,Выберите подходящий экземпляр модели,И верните результаты вывода на сервер API.
Model Registry:управлять已зарегистрироватьсяиз Информация о модели,включить версию、состояние、Путь и другие метаданные.
Model Manager:Ответственный за модельизнагрузка、возобновлять、Развернуть и удалить.
API Gateway Это вход на уровень обслуживания, который отвечает за управление всеми входящими запросами, их маршрутизацию к соответствующим службам и обработку таких функций, как аутентификация, контроль разрешений и ограничение тока. Варианты технологии включают в себя:
Kong Gateway:Kong представляет собой высокомасштабируемую API Шлюз может выполнять такие функции, как маршрутизация, аутентификация личности и ограничение тока. Он также поддерживает подключаемые расширения для удовлетворения конкретных потребностей.
Nginx:Nginx Можно использовать как легкий API Шлюз, обеспечивающий балансировку нагрузки, функции кэширования и маршрутизации.
Amazon API Gateway:нравиться果在 AWS запускать на хостинге API Gateway Сервис, подходящий для быстрого развертывания.
3.3 Балансировка нагрузки и отказоустойчивость
В среде с высоким уровнем параллелизма нескольким экземплярам модели необходимо одновременно обрабатывать большое количество запросов на вывод. Для повышения надежности и производительности системы решающее значение имеют механизмы балансировки нагрузки и отказоустойчивости:
HAProxy:一个Может靠из Открытый исходный кодбалансировка устройство нагрузки, может использоваться в нескольких Model Worker Распределите нагрузку между экземплярами.
Kubernetes Ingress Controller:нравиться果системабежит дальше Kubernetes В кластере используйте Kubernetes Ingress Выполняйте маршрутизацию трафика и поддерживайте балансировку нагрузки。
Envoy:Envoy да Современный сервисный агент с мощной поддержкой дисбалансировки нагрузки、динамическая маршрутизация、Функции изоляции неисправностей и предохранителей.
3.4Model Handle
Model Handle Ответственный за управление API Gateway Направляет запросы в механизм вывода модели. Варианты технологии включают в себя:
FastAPI:высокая производительностьиз Python Web рамка,Поддержка асинхронных запросов и высокого параллелизма,Подходит для обработки запросов на вывод.
Spring Boot:нравиться果использовать Java Экология, Весна Boot да Обработка микросервисов Web Основная структура для запросов.
Flask:Для более легкого весаиз Обработка запроса на обоснование,Flask Это также хороший выбор, особенно подходящий для использования с TensorFlow Serving или TorchServe интегрированный.
3.5 Служба вывода модели (Model Worker)
Служба вывода модели отвечает за конкретные задачи вывода. Он хорошо работает с такими структурами модельного рассуждения, как vLLM、llama.cpp、FastChat)объединить,Выполнить вывод модели,и вернуть результат в Model Handle。
Техническая основа службы вывода:
TensorFlow Serving:TensorFlow Serving Это гибкая и высокопроизводительная платформа службы вывода, которая поддерживает динамическую загрузку моделей и выполнение задач вывода и подходит для производственных сред крупномасштабных моделей.
TorchServe:TorchServe да PyTorch Структура службы экологических рассуждений, поддерживающая PyTorch Модель развертывания и вывода можно легко интегрировать в существующую архитектуру сервиса.
ONNX Runtime:ONNX да Механизм рассуждения с открытым исходным кодом, который поддерживает кросс-платформенную модель глубокого обучения и подходит для нескольких платформ рассуждения (таких как TensorFlow、PyTorch ждать).
3.6Model Controller
Model Controller дауправлять模型жизненный циклизосновная часть。Он включает в себя два важных подмодуля.:Model Registry и Model Manager。
Model Registry:负责хранилище所有已зарегистрироватьсяиз Информация о модели,включить версию、путь модели、Конфигурация、состояниеждать。проходить Model Registry Может以управлять模型изметаданные,Убедитесь, что разные версиииз模型Может以有序управлять。общийизинструментвключать:
MLflow:一个Открытый исходный код平台,Используется для управления жизненным циклом модели.,Поддерживает регистрацию модели, контроль версий и отслеживание экспериментов.
Weights & Biases (W&B):используется дляуправлять模型训练иконтроль версий,Обеспечивает мощные функции визуализации и отслеживания журналов.
Model Manager:负责управлять模型изнагрузка、возобновлять、развертыватьиудалить,убеждатьсясистема Возможность динамического реагирования на моделиизизменять。技术实现Может以проходить Kubernetes из ConfigMap、Deployment или Ray Дождитесь планирования распределенных задач, чтобы динамически управлять развертыванием модели.
3.7 Структура вывода модели
Уровень обслуживания должен быть тесно интегрирован с базовой структурой вывода, чтобы выполнять реальные задачи вывода модели. Общие рамки рассуждения включают в себя:
FastChat:DB-GPT использовать структуру рассуждений, уделяя особое внимание эффективному разговорному стилю. AI Вывод, поддерживает несколько больших языковых моделей и задач вывода.
vLLM:Поддержка высокой производительностииз Вывод LLM (большая языковая модель),осуществлять оптимизированное управление памятью и параллельные рассуждения,Повысьте эффективность рассуждений модели.
llama.cpp:используется для LLaMA Isomodel — облегченная структура вывода, ориентированная на достижение эффективного вывода в средах с низким уровнем ресурсов.
4. Прикладной уровень
Прикладной уровень — это место, где пользователи взаимодействуют с GBI системавзаимодействиеизинтерфейс,Предоставляет такие функции, как запрос, создание отчетов и визуальное отображение. Этот уровень должен быть легко доступен, поддерживать пользовательские запросы и демонстрировать бизнес-аналитику в режиме реального времени.,Варианты технологии включают в себя:
интерфейсная платформа:
React, Vue.js, Angular:используется для构建пользовательвзаимодействиеинтерфейс,Поддержка ввода пользовательских запросов и отображения результатов.
Запрос на естественном языке:проходитьинтегрированный NLP Модель, которую будет использовать пользователь из Запроса на естественном язык решает SQL илидругой Запрос данных Способ。
Инструменты BI самообслуживания:нравиться Apache Superset и Tableau поддерживают операции перетаскивания пользователей для создания настраиваемых отчетов и диаграмм.
3. Обзор
хотя GBI имеет сильную динамику развития,Но есть еще некоторые технические и коммерческие проблемы.,Генеративный AI Модели часто рассматриваются как «черные ящики», а полученные бизнес-понимания и прогнозы могут не иметь интерпретируемости, что может вызвать проблемы доверия в бизнес-среде, которая в значительной степени зависит от принятия решений на основе моделей. И обеспечение конфиденциальности и безопасности данных имеет решающее значение. Как предотвратить утечку данных и нарушения, особенно в областях, связанных с конфиденциальностью личной информации и конфиденциальной деловой информацией? GBI Ключевые проблемы реализации. ГБИ Необходимо соответствовать существующему в компании BI системаи Как интегрировать инфраструктуру данных с традиционной BI Система Бесшовное соединение также является большой проблемой. Особенно на крупных предприятиях конвейер данных и процесс анализа сложны, GBI При развертывании необходимо учитывать совместимость и стабильность системы.
Однако по мере развития технологии и расширения ее применения GBI демонстрирует широкие перспективы применения во многих отраслях,В будущем его возможности автоматизации и генерации будут продолжать способствовать принятию и трансформации бизнес-решений на основе данных.
Если есть какие-либо ошибки, пожалуйста, оставьте сообщение для консультации. Большое спасибо.
Это все по этому вопросу. Меня зовут фанат. Если у вас есть вопросы, оставьте сообщение для обсуждения. Увидимся в следующем выпуске.