OFC2024: три мнения участников Huawei Fellows о том, как снизить энергопотребление SerDes
OFC2024: три мнения участников Huawei Fellows о том, как снизить энергопотребление SerDes

На OFC2024 научный сотрудник Huawei Давиде выступил с приглашенным докладом под названием «Подключение коммутатора к оптоволокну: проблема энергоэффективности» и выдвинул три основные точки зрения. Здесь для справки собрана соответствующая информация о маленьких ростках фасоли.

Поскольку пропускная способность сети продолжает увеличиваться, доля SerDe в потребляемой мощности и площади чипа коммутатора становится все больше и больше. С 2014 по 2022 год пропускная способность коммутационных чипов выросла с 1,28T до 51,2T, скорость одной линии выросла с 10 Гбит/с до 112 Гбит/с, а коэффициент энергопотребления SerDes увеличился с 15% до 40%, как показано на рис. рисунок ниже. Как еще более эффективно снизить энергопотребление SerDes, становится все более важным. Босс Давиде поделился некоторыми своими мыслями и предложениями.

1. Медленно эффективнее, чем быстро По этому поводу у вас может возникнуть иллюзия, что «использование более высоких скоростей снизит энергопотребление». Например, энергоэффективность оптических модулей 400G лучше, чем у оптических модулей 100G, но на самом деле с увеличением скорости сигнала, В процессе создания чипа используются более высокие скорости, более оптимизированная архитектура и дизайн чипа, более производительные подложки и печатные платы, используемые в системе, и т. д. Снижение энергоэффективности модулей 400G является результатом множества факторов. Если в оптическом модуле 100G используется тот же чип и печатная плата, его энергоэффективность должна быть выше, чем у оптического модуля 400G.

Если взять в качестве примера печатную плату, то по мере увеличения скорости сигнала вносимые потери печатной платы постепенно увеличиваются, но в то же время использование печатных плат с более высокими характеристиками поможет уменьшить вносимые потери. Например, вносимые потери печатной платы класса M8 на частоте 56 ГГц близки к вносимым потерям печатной платы класса M4 на частоте 10 ГГц, как показано на рисунке ниже.

Чип использует процесс с более высоким уровнем узла, что также приводит к снижению энергопотребления более высокоскоростных SerDe, как показано на рисунке ниже. 56G SerDes использует 7-нм техпроцесс с энергоэффективностью 4,5 п Дж/бит, 112G SerDes использует 5-нм техпроцесс с энергоэффективностью 3,7 п Дж/бит, а 224G SerDes использует 3-нм процесс с энергоэффективностью, дополнительно сниженной до 3,0 п Дж/бит. .

Если другие факторы остаются постоянными, более высокие скорости соответствуют большим вносимым потерям в канале, и SerDes будет потреблять больше энергии. Как пример на рисунке ниже, энергопотребление 200G Serdes примерно на 30% выше, чем у 100G Serdes.

Таким образом, принятие более низкой скорости сигнала и увеличение общей полосы пропускания за счет увеличения количества каналов и плотности межсоединений вместо увеличения скорости одноканального сигнала стало направлением снижения энергопотребления. В следующей таблице приведено сравнение XSR и UCIe. При использовании параллельного низкоскоростного соединения высокой плотности энергоэффективность UCIe может достигать менее 0,5 п Дж/бит, что составляет одну треть энергоэффективности XSR.

2. Разбейте сложную систему на мелкие части. Этот аргумент кажется интуитивным. Разбиение сложной системы на простые небольшие системы похоже на то, как мы решаем сложную проблему. Что касается системы межсетевых соединений, Давиде сравнил одноступенчатую систему с двухступенчатой ​​системой межсетевых соединений, как показано на рисунке ниже.

Потери в канале однокаскадной системы составляют 35 д Б, что требует использования LR Serdes, а ее энергоэффективность составляет 9 п Дж/бит. Если используется комбинация XSR+MR Serdes, XSR сначала используется для передачи сигнала на канал. модуль ближе к ASIC, а затем через MR Serdes. При передаче сигналов на удаленный чип ASIC, хотя общие вносимые потери все еще составляют 35 д Б, энергоэффективность XSR Serdes составляет 1 п Дж/бит, MR Энергоэффективность Serdes составляет 3 п Дж/бит, а общая энергоэффективность всей линии связи — 8 п Дж/бит, что лучше, чем у одноступенчатой ​​системы, которая напрямую использует LR Serdes. Двухуровневая система соответствует модулю NPO/CPO. На рисунке ниже показано сравнение энергоэффективности соответствующей системы. За счет уменьшения расстояния между ASIC и оптическим механизмом вносимые потери в линии связи уменьшаются, поэтому можно использовать SerDes с меньшими потерями, что снижает общее энергопотребление.

Давиде еще раз упомянул в отчете модуль LPO. Несмотря на то, что микросхема ретаймера в модуле удалена, на стороне хоста будет потребляться больше энергии для компенсации вносимых потерь всего канала, что не приведет к снижению энергопотребления системы. , босс не испытывает оптимизма по поводу модуля LPO. Конкретные детали обсуждались в предыдущей заметке и здесь не будут повторяться.

3. Выключайте свет, если вас нет в комнате. Эту точку зрения тоже легко понять. Выключайте свет, когда выходите из комнаты, и глушите двигатель, ожидая светофора. В соответствии с взаимосвязанной системой, если потери на линии связи невелики, ненужные функции адаптивно отключаются для снижения энергопотребления, что представляет собой так называемое адаптивное масштабирование мощности. В DSP есть три соответствующих направления оптимизации: 1) уменьшение или не активация использования эквалайзера, 2) уменьшение разрешения сигнала и 3) снижение напряжения питания. На рисунке ниже красная линия — это энергоэффективность LR SerDes без адаптивной функции, а зеленая линия соответствует ситуации, когда энергопотребление SerDes можно адаптивно регулировать. Контраст очень очевиден, и существует огромное пространство для оптимизации. Чтобы учесть использование в различных сценариях, все текущие микросхемы ASIC используют одну и ту же конфигурацию LR SerDes, и никаких усилий в этом направлении не предпринимается.

Выше приведено краткое изложение отчета Давиде. Мнение начальника очень простое, но если присмотреться, оно очень милое и точное. Оно дает указание снизить энергопотребление SerDes: принять низкое энергопотребление. схема скоростного параллельного соединения. Улучшите плотность полосы пропускания, внедрите многоуровневое соединение, разработайте адаптивный SerDes. Еще один очень важный момент заключается в том, что когда мы проводим сравнительный анализ, нам нужно сравнивать яблоко с яблоком при одних и тех же условиях или предположениях. Многие, казалось бы, разумные выводы можно сделать из сравнений в неравных условиях. Сравнивать яблоки и апельсины бессмысленно.

Если в статье есть ошибки или неточности,Я надеюсь, что вы все это укажете,Каждый может оставить сообщение для обсуждения. На данный момент все три группы Вичата заполнены.,Сяодуя открыла новую дискуссионную группу Вичат 4,Друзья, которым нужны технические обсуждения или бизнес-консалтинг, могут напрямую добавить мой профиль.Вичатphoton_walker

Ссылки: 1. Давиде Тониетто, «Будущее межсоединения ближнего радиуса действия», ESSCIRC, стр. 1–8, сентябрь 2022 г.

2. Davide Tonietto, "Connecting the Switch to the Fiber: the Energy Efficiency Challenge", OFC 2024

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода