ChatGPT зажег волну всеобщего искусственного интеллекта. Вслед за сельскохозяйственной революцией, промышленной революцией и революцией в компьютерных технологиях он также может положить начало революции в технологиях искусственного интеллекта.
Индустрия уделяет больше внимания алгоритму искусственного интеллекта ChatGPT, но OpenAI превратился в платформенный сервис, обслуживающий сотни миллионов пользователей. За последние три месяца соглашение об уровне обслуживания ChatGPT составляло около 99 %, что означает, что он недоступен в среднем около 15 минут в день. Общая техническая архитектура и надежность также привлекли большое внимание.
Диаграмма состояния веб-сайта OpenAI за последние 90 дней (зеленый цвет указывает на доступность, остальные указывают на ненормальность)
ChatGPT официально не поделился своей технической архитектурой с внешним миром, поэтому сложно понять общую картину архитектуры со 100% точностью. В этой статье делается попытка охватить следующие аспекты:
Нарисована общая картина основного стека программных технологий ChatGPT.
OpenAI — это стартап в области искусственного интеллекта в эпоху облаков. Весь его бизнес построен на общедоступном облаке. Он получил поддержку от AWS на ранних этапах запуска. Следующий разговор является ответом на общедоступную информацию OpenAI по состоянию на 2021 год.
Приведенный выше абзац взят из ранней статьи на официальном сайте OpenAI. Видно, что использовалось большое количество сервисов AWS.
За последние два года он получил огромные инвестиции от Microsoft, и очевидно, что услуги будет предоставлять Azure. Совершенно очевидно, что ChatGPT переходит на мультиоблачное решение, в котором доминирует Azure, а количество сервисов AWS будет постепенно уменьшаться.
Кроме того, для управления облачными ресурсами используется сервис управления несколькими облаками Terraform.
Сначала спросите ChatGPT самостоятельно, и однозначного ответа, по сути, нет. Однако более точную информацию можно получить из позиций официального сайта и отчетов о неисправностях:
Основные бизнес-данные ChatGPT хранятся в реляционной базе данных PostgreSQL, которая представлена на официальном сайте. Здесь хранятся учетные записи, AK, разговоры и другая информация сотен миллионов пользователей.
В отчете об ошибке от 20 февраля 2023 года также говорилось, что возникла проблема с основной базой данных PostgreSQL. И упомянул об использовании службы пула соединений PgBouncer.
В то же время кластер Redis использовался в качестве службы кэширования. 20 марта 2023 года в ChatGPT была обнаружена уязвимость безопасности. Некоторые пользователи могли видеть записи чатов других людей, поскольку они наткнулись на ошибку Redis-py, вызвавшую ее. Сеансовая путаница в состоянии отмены соединения Сэм Альтман также извинился в Твиттере.
Кроме того, я все еще набираю сотрудников и надеюсь узнать о CosmosDB. Пока не подтверждено, в каких сценариях она будет использоваться. CosmosDB — это многорежимная база данных, запущенная Azure. Она поддерживает такие интерфейсы совместимости, как MongoDB, Cassandra, PostgreSQL. и Gremlin. Это флагманский продукт Microsoft в области NoSQL.
Ранее Патрик-Макфадин (Cassandra Committer) упоминал в LinkedIn, что OpenAI использует Cassandra, но в итоге обсуждение оказалось бредом со стороны самого ChatGPT. Пока не подтверждено, действительно ли используется Cassandra или API Cassandra используется в CosmosDB. .
Кроме того, CosmosDB также предоставляет распределенный интерфейс PostgreSQL через приобретенный Citus. Не подтверждено, будет ли Citus использоваться для завершения архитектуры распределенной базы данных.
ChatGPT использует Snowflake, облачное хранилище данных нового поколения, и Tableau для анализа данных. Snowflake, поддерживающий развертывание в нескольких облаках, очень полезен для миграции бизнеса из AWS в Azure.
Что касается веб-интерфейса, четкое использование языка TypeScript и платформы React.
В настоящее время ChatGPT официально не выпустила приложение для мобильных устройств, но уже набирает инженеров iOS и Android, что должно произойти в ближайшее время.
Будучи технологической компанией, основанной на искусственном интеллекте, OpenAI выбирает Python в качестве своего основного языка. Независимо от того, занимаетесь ли вы должностью ИИ или инженером-программистом платформы, вам необходимо хорошо владеть языком Python.
Служба платформы выбирает Python, использует популярную платформу Flask на Python и такие компоненты, как OpenAPI.
Ядром технологической среды искусственного интеллекта является Pytorch, который также может использовать Tensorflow.
OpenAI разработала собственную платформу алгоритмов Triton, ориентированную на графические процессоры, и разместила ее исходный код на github (
https://github.com/openai/triton),Используется вместо NVIDIA из CUDA. направлена на более эффективную разработку алгоритмов машинного обучения. Тритон из используемого языка программирования С++ и python。
Более подробную информацию об архитектуре службы обучения и развертывания ИИ еще предстоит раскрыть. Изображение ниже взято из того, что доктор Чэнь Вэй поделился в Интернете типичной архитектурной схемой большой модели для справки:
источник:https://zhuanlan.zhihu.com/p/611464068
Контейнерный сервис:Kubernetes
Мониторинг, эксплуатация и обслуживание:Prometheues(Набираем инженеров по эксплуатации и техническому обслуживаниюприезжатьнужно понятьPromQL)
Служба журналов: Splunk
язык программирования: Golang、Python
https://openai.com/careers/software-engineer-chatgpt
https://status.openai.com/incidents/mq5jgswy45fr
https://github.com/openai/triton
Автор этой статьи: Е Чжэншэн, программист NineData, генеральный директор Jiuzhang Arithmetic и бывший старший технический эксперт Alibaba Cloud.
NineData Официальный сайт: www.ninedata.cloud, предоставляющий базу данных корпоративного уровня. SQL Инструменты разработки, репликации данных, сравнения, резервного копирования и другие продукты, а также предоставляет услуги, аналогичные ChatGPTизSQL (SQL AI Copilot), можно использовать бесплатно, загрузка не требуется.
Каждый может оставить сообщение или перепечатать!