Thunderbolt 5: как VPSMAC строит суперкомпьютерный кластер на межузловой связи 120 Гбит/с

Thunderbolt 5 поднимает пропускную способность одного порта до 120 Гбит/с — это не только апгрейд периферии, но и основа «межмашинной» связи узлов M4 внутри дата-центра. В статье разбираем, как VPSMAC использует TB5 для построения кластера с минимальной задержкой и максимальной пропускной способностью, где несколько машин работают как один суперкомпьютер.

Thunderbolt 5 120 Гбит/с и кластер M4

1. Почему Thunderbolt 5 — это «суперкомпьютерный» уровень связи

Thunderbolt 5 (TB5) опирается на стандарты USB4 v2 и PCIe 5.0: двунаправленная пропускная способность достигает 80 Гбит/с, в режиме «Bandwidth Boost» однонаправленная — до 120 Гбит/с. По сравнению с Thunderbolt 4 (40 Гбит/с) это скачок в 2–3 раза. На уровне дата-центра это означает, что несколько Mac mini или Mac Studio в одном шасси можно связать кабелями TB5 в единую сеть с высокой пропускной способностью и низкой задержкой, без опоры на классические 10G или 25G Ethernet-коммутаторы.

В архитектуре кластеров VPSMAC между узлами активно передаются артефакты сборки, распределённый кэш и веса моделей — от пропускной способности и задержки напрямую зависит эффективность планировщика задач. TB5 использует модуляцию PAM-3 и поддерживает симметричный режим 80 Гбит/с, что позволяет выжимать полную полосу в обоих направлениях и создаёт стабильную основу для мультимашинной координации.

2. 120 Гбит/с в сравнении с типовыми схемами межузловой связи

Чтобы оценить 120 Гбит/с, сравним с типичными вариантами в дата-центрах. Гигабитный Ethernet (1 Гбит/с): передача 10 ГБ данных между узлами — порядка 80 секунд. 10 Гбит/с — около 8 секунд, 25 Гбит/с — около 3 секунд. При 120 Гбит/с те же 10 ГБ проходят менее чем за секунду, а задержка падает с миллисекунд до микросекунд — это критично для распределённой сборки и конвейеров AI-инференса.

Схема связи Типичная полоса Время передачи 10 ГБ (теор.) Задержка Роль в кластере
Гигабитный Ethernet 1 Гбит/с ~80 с мс управление / бэкапы
10G Ethernet 10 Гбит/с ~8 с субмс обычная связь узлов
25G Ethernet 25 Гбит/с ~3 с субмс высокопроизводительные кластеры
Thunderbolt 5 80 Гбит/с двунапр. / 120 Гбит/с однонапр. < 1 с мкс прямая связь M4 в стойке VPSMAC

3. Как VPSMAC строит «суперкомпьютерный» кластер на TB5

В дата-центрах VPSMAC узлы M4 подключаются не только по обычному Ethernet. Для клиентов с высокими требованиями к вычислительной мощности мы разворачиваем топологию прямой связи внутри стойки на базе Thunderbolt 5: несколько Mac mini или Mac Studio в одной стойке соединяются кабелями TB5 и при необходимости коммутатором/расширителем, образуя компактную «TB-сеть». При распределённой сборке главный узел раздаёт задачи и фрагменты зависимостей по TB5 подчинённым узлам, те возвращают артефакты; в сценариях AI-инференса время переноса весов модели и промежуточных результатов между узлами сводится к минимуму, и совокупная пропускная способность приближается к ощущению «много карт в одной машине».

Технические моменты

4. Практика: распределённая сборка и синхронизация кэша

В распределённой сборке на Xcode или Bazel координатор постоянно обменивается объектными файлами, индексами и кэшем. При нехватке полосы между узлами координатор становится узким местом, и реальное ускорение оказывается заметно ниже теоретического. На кластере VPSMAC с межузловой связью TB5 мы сравнивали полную сборку iOS-проекта объёмом порядка 5 млн строк кода: при переходе с «только 10G Ethernet» на «прямую связь TB5 внутри стойки + 10G uplink» суммарное время сборки сократилось примерно на 18%, а задержки при попадании в кэш и обратной записи существенно снизились.

В сценариях AI-инференса при синхронизации весов большой модели между несколькими узлами канал 120 Гбит/с позволяет сократить время синхронизации с десятков минут до нескольких минут — «много машин, много карт» по ощущениям приближается к «одна машина, много карт», с выгодным соотношением эффективности и затрат по сравнению с простым наращиванием числа отдельных машин.

# Координатор и воркеры в кластере M4 с TB5 синхронизируются по высокоскоростному каналу
# Пример: удалённый кэш и распределённое выполнение Bazel
bazel build //app:ios --remote_cache=grpc://cache-node:9092 \
  --jobs=64 --experimental_remote_execution

5. Безопасность и изоляция: преимущества аренды физических машин

Связь по TB5 происходит внутри инфраструктуры VPSMAC и используется только между вашими арендованными узлами или в выделенной стойке; трафик других арендаторов не смешивается. Аренда физических машин по умолчанию даёт изоляцию сети и вычислительных ресурсов; в сочетании с высокой скоростью внутренней сети на TB5 вы получаете одновременно безопасную и предельно быструю среду кластера — подходящий вариант для команд и компаний с высокими требованиями к суверенитету данных и задержке.

6. Итог: 120 Гбит/с — не просто цифра

Thunderbolt 5 с пропускной способностью до 120 Гбит/с — это не только смена поколения интерфейса, но и аппаратная основа, на которой VPSMAC превращает «несколько M4» в один суперкомпьютер. Прямая связь TB5 внутри стойки позволяет запускать распределённую сборку, массовую синхронизацию кэша и конвейеры AI-инференса с минимальной задержкой и максимальной полосой. Если ваш проект упирается в межузловую пропускную способность или задержку, в VPSMAC можно оценить кластер M4 с межузловой связью на базе Thunderbolt 5.