Национальный суперкомпьютерный центр Китая в Шэньчжэне запустил машину LineShine мощностью 1,54 экзафлопса. Без единого GPU — только 2,45 миллиона процессорных ядер на базе архитектуры Armv9.
Процессор LX2, разработанный под эгидой Huawei, содержит 304 ядра с поддержкой матричных и векторных операций для задач ИИ. Каждый чип оснащён 32 ГБ памяти HBM прямо на корпусе с пропускной способностью 4 ТБ/с и ещё до 256 ГБ DDR5. Вся система состоит из 20 480 вычислительных узлов, в каждом — два таких процессора, соединённых фирменной сетью LQLink со скоростью 1,6 Тбит/с на узел.
Причина отказа от GPU очевидна: американские санкции закрыли Китаю доступ к ускорителям Nvidia. Вместо того чтобы ждать, страна пошла по пути японского суперкомпьютера Fugaku — он тоже работает на процессорах Arm и занимал первое место в мировом рейтинге TOP500.
На задаче обучения генеративной модели сжатия данных наблюдения за Землёй с 6,3 млрд параметров LineShine разогнался до 2,16 экзафлопса. Для сравнения: теоретический пик кластера xAI Colossus с сотнями тысяч GPU — около 498 экзафлопсов. Но реальный КПД GPU-систем тоже далёк от 100%, и LineShine при своих 15% утилизации показывает, что CPU-подход работает.
Главное преимущество архитектуры без GPU — единое адресное пространство памяти. Не нужно гонять данные между CPU и GPU, нет ограничений видеопамяти, нет зависимости от чужих программных стеков вроде CUDA.
Главный минус — энергоэффективность. GPU по-прежнему быстрее и «дешевле» на ватт для плотных матричных вычислений. Именно поэтому тот же Colossus при 15% утилизации выдаёт около 75 экзафлопсов — в 35 раз больше пика LineShine. Китай за последние годы развернул уже несколько CPU-only суперкомпьютеров — LineShine лишь последний из них.