Анализ самого мощного отечественного ядра RISC-V с открытым исходным кодом «Kunming Lake»: производительность сравнима с Neoverse N2
Анализ самого мощного отечественного ядра RISC-V с открытым исходным кодом «Kunming Lake»: производительность сравнима с Neoverse N2

27 августа по местному времени, во второй день конференции Hot Chips 2024, было официально представлено отечественное высокопроизводительное процессорное ядро ​​RISC-V третьего поколения «Xiangshan» с открытым исходным кодом «Kunming Lake».

Благодаря преимуществам оптимизированных инструкций, масштабируемости и открытому исходному коду набор инструкций RISC-V всегда считался третьей наиболее многообещающей архитектурой набора команд процессора после x86 и Arm.

На этом фоне Институт вычислительных технологий Китайской академии наук, Пекинский научно-исследовательский институт микросхем с открытым исходным кодом и Университет Китайской академии наук совместно запустили проект высокопроизводительного процессора RISC-V с открытым исходным кодом «Сяншань», который в основном нацелен на высокопроизводительные приложения.

В 2021 году было официально выпущено высокопроизводительное процессорное ядро ​​RISC-V первого поколения с открытым исходным кодом «Yanqi Lake» серии «Xiangshan». Это самое производительное процессорное ядро ​​с открытым исходным кодом в мире за тот же период. В мае 2023 года было официально выпущено высокопроизводительное процессорное ядро ​​RISC-V второго поколения серии «Xiangshan» «Nanhu». В то время оно также стало первым отечественным высокопроизводительным процессорным ядром RISC-V с открытым исходным кодом. тест Arm Cortex-A76 ; На этот раз выпущено высокопроизводительное процессорное ядро ​​RISC-V с открытым исходным кодом третьего поколения серии «Xiangshan», которое представляет собой тест ядра Arm Neoverse N2.

По имеющимся данным, высокопроизводительное процессорное ядро ​​RISC-V третьего поколения с открытым исходным кодом имеет техпроцесс 7 нм, основную частоту 3 ГГц и оценку SPECINT2006 15 баллов/ГГц. Его производительность сравнивается с Arm. Ядро Neoverse N2 может широко использоваться в серверах. Высокопроизводительные чипы, такие как микросхемы, чипы искусственного интеллекта, графические процессоры и DPU, могут служить в качестве технологий с открытым исходным кодом и общей базой для передовой компьютерной индустрии.

На рисунке ниже показана микроархитектура высокопроизводительного процессорного ядра RISC-V третьего поколения «Xiangshan» с открытым исходным кодом «Kunming Lake», включая векторные и гипервизорные расширения.

Вот конструкция предсказателя ветвления и кода инструкций/интерфейсного TLB для ядра «Озеро Куньмин».

Бэкэнд имеет 6-уровневое декодирование/переименование/планирование.

Модуль целочисленных вычислений представляет собой конструкцию из 4 АЛУ, которая также имеет модули с плавающей запятой и векторные модули.

Ядро «Kunming Lake» также имеет блоки памяти с конвейерами загрузки и хранения, MMU и кэши данных.

Ядро «Kunming Lake» имеет до 1 МБ выделенного кэша L2 и общий кэш L3 объемом 16 МБ. Общий L3 объемом 16 МБ может показаться небольшим по сравнению с современными конструкциями больших серверных процессоров, но по сравнению с Neoverse N2 он довольно хорош.

Это конвейерная схема 13-ступенчатой ​​сборочной линии активной зоны «Озеро Куньмин».

Сравнение параметров высокопроизводительных процессорных ядер RISC-V с открытым исходным кодом «Xiangshan» «Nanhu» и «Kunming Lake» с Arm Neoverse N2 и Arm Cortex A76. Видно, что по некоторым параметрам «Куньмин Лейк» уже лучше Neoverse N2.

Что касается производительности, оценка "Kunming Lake" по SPEC CPU 2006 достигла 44 баллов, а за счет оптимизации компилятора может даже достичь 47,63 балла.

Во время 4-го китайского саммита RISC-V (RVSC2024), проходившего с 19 по 25 августа этого года, разработчики успешно продемонстрировали в Пекинском научно-исследовательском институте микросхем с открытым исходным кодом, что они успешно запустили «Cloud·Original» на основе платы разработки «Nanhu». ". По имеющимся данным, Nanhu v3 и Kunming Lake v1 в настоящее время готовы к снятию на пленку.

В дополнение к процессорным ядрам RISC-V проект «Xiangshan» запустил настраиваемые и масштабируемые решения SoC, которые поддерживают более высокопроизводительные чипы для создания более крупных кластеров.

Что касается программного обеспечения, проект «Сяншань» также оснащен инструментами с открытым исходным кодом.

А цепочки инструментов гибкой разработки, такие как difftest, можно использовать для своевременного обнаружения ошибок RTL.

LightSSS поддерживает воспроизведение отладочной информации при моделировании. Эти инструменты помогают улучшить конструкцию чипов посредством тестирования перед запуском в производство.

По имеющимся данным, группа компаний разрабатывает чипы AI для центров обработки данных, серверные чипы RISC-V сверхвысокой вычислительной мощности на основе высокопроизводительного ядра RISC-V с открытым исходным кодом «Xiangshan», полностью независимые чипы облачных вычислений RISC-V для Ожидается, что в 2025 году отечественные графические процессоры на базе RISC-V и другие высокопроизводительные чипы станут коллективным прорывом в области высокопроизводительных вычислительных чипов RISC-V.

Наконец, есть краткое описание проекта Сяншань, дорожная карта двух ядер «Наньху» и «Озеро Куньмин». Два ядра продвигаются параллельно двумя командами. Планируется реализовать пятую версию проекта. Ядро «Наньху» и озеро Куньмин в этом году. Вторая версия проекта будет завершена, и итерации продолжатся в следующем году.

Редактор: Core Intelligence — Меч Руруни

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода