15 августа iFlytek провела «Конференцию по обновлению большой когнитивной модели iFlytek Spark V2.0» в Хэфэе. На этой пресс-конференции iFlytek и Huawei совместно представили Spark All-in-One — интегрированное программно-аппаратное устройство для создания эксклюзивных больших моделей.
Лю Цинфэн, председатель iFlytek, сказал: «iFlytek и Huawei совместно решили проблему нехватки вычислительной мощности». работа с Huawei над созданием кластеров отечественной вычислительной мощности для сверхкрупномасштабного обучения крупных моделей с преимуществами кластера.
Понятно, что в процессе разработки больших моделей необходимы вычислительные мощности и платформы, которые могут поддерживать параллельное обучение больших моделей с сотнями миллиардов параметров, что обычно требует тысяч мощных карт-ускорителей искусственного интеллекта для непрерывной работы на в то же время. Исходя из этого, архитектура системы и возможности кластера для параллельного обучения стали ключевыми для разработки больших моделей.
Понятно, что многофункциональная машина Spark основана на процессоре Kunpeng + графическом процессоре Ascend, а также использует хранилище и сеть Huawei для обеспечения комплексного кабинетного решения. Вычислительная мощность FP16 (формат с плавающей запятой половинной точности) составляет 2,5 петафлопс. (1 петафлопс — это один квадриллион операций в секунду). Самый популярный NVIDIA DGX A100 для обучения больших моделей имеет один узел, содержащий 8 графических процессоров, и может выдавать 5 петафлопс вычислительной мощности FP16.
(Предположительно, чип Ascend, используемый в моноблоке Spark, — это Ascend 910. Данные официального сайта показывают, что вычислительная мощность FP16 Ascend 910 составляет 320 терафлопс.)
Согласно сообщениям, интегрированное развертывание обучения и рассуждений универсальной машины Spark может использоваться в приложениях в различных областях, таких как системы вопросов и ответов, создание диалогов, построение графов знаний и интеллектуальные рекомендации. Он имеет большую модель. предварительное обучение, мультимодальное понимание и создание, а также возможности многозадачности. Способность учиться и передавать.
Универсальная машина Spark также оснащена специальным оборудованием для алгоритмов обучения и приложений для вывода когнитивной интеллектуальной большой модели Spark, что может значительно снизить стоимость использования для предприятий. Он может напрямую обеспечивать 5 настраиваемых режимов оптимизации, таких как разработка диалогов, оркестровка задач, выполнение плагинов, доступ к знаниям и быстрое проектирование, а также более 10 готовых к использованию богатых пакетов сценариев для офиса, кода, обслуживания клиентов и т. д. эксплуатация и обслуживание, маркетинг и закупки, поддерживаются три размера моделей на выбор пользователей.
Стоит отметить, что в прошлом месяце iFlytek объявила, что iFlytek Spark объединит усилия с Ascend AI для создания новой универсальной интеллектуальной базы на основе независимых инноваций Китая. С одной стороны, большая когнитивная модель iFlytek Spark основана на интегрированном подходе к обучению и рассуждениям, обеспечивая технологические прорывы в области разреженности больших моделей и низкоточной количественной оценки, и может эффективно адаптироваться к Ascend AI и ускорить промышленное применение и итерацию с другой стороны, с Ascend AI в качестве ядра совместно оптимизируются программное и аппаратное обеспечение для создания большого кластера обучения моделей с концентрированной вычислительной мощностью, превосходной производительностью, стабильным питанием и безопасностью данных.
В своем выступлении на конференции по обновлению большой модели iFlytek Spark Cognitive Large Model V2.0 Лю Цинфэн более подробно объяснил: «Huawei и iFlytek вместе работают над программно-аппаратной платформой Ascend AI и инструментами поддержки программного обеспечения. Сочетание высокой вычислительной мощности Чипы искусственного интеллекта, высокопроизводительные библиотеки операторов, высокоскоростное соединение нескольких карт и распределенное хранилище — мы совместно выявляем и совершенствуем наиболее важные библиотеки операторов, необходимые для искусственного интеллекта, а затем строим на этой основе полноценные возможности iFlytek. Разработан процесс обучения и замкнутый цикл данных, а также разработана собственная платформа обучения больших моделей, разработанная с интегрированным обучением и выводом. В середине она поддерживает совместимость крупномасштабных гетерогенных вычислительных мощностей, а также поддерживает гибридную облачную архитектуру. для легкого расширения Демонстрация iFlytek Spark V2.0 и всех продуктов, которые мы видели сегодня, построены на безопасной и управляемой платформе».
Сообщается, что «iFlytek Spark Cognitive Large Model V2.0», помимо дальнейшего улучшения общей основы возможностей, фокусируется на прорывах в возможностях кодирования и возможностях мультимодального взаимодействия. По словам Лю Цинфэна, в HumanEval, общедоступном тестовом наборе возможностей кода, созданном OpenAI, возможности написания кода iFlytek Spark Model V2.0 на основе Python и C близки к уровню ChatGPT с разрывом всего в 1% и Ожидается, что 2% будет 24 октября этого года, он полностью превзойдет ChatGPT и официально станет эталоном GPT-4 в первой половине следующего года.
На данный момент в модели iFlytek Spark доступны три версии параметров модели: 13 миллиардов, 65 миллиардов и 175 миллиардов. Сосредоточив внимание на модели Spark, iFlytek создает экосистему разработчиков, и в настоящее время к платформе Spark присоединились более 4000 команд помощников разработчиков.
Редактор: Xinzhixun-Linzi Comprehensive из Интернета.