IBM выпустила специализированный ускоритель для ИИ-инференса

Корпорация IBM объявила о скором старте продаж специализированных ускорителей Spyre Accelerator для задач ИИ-инференса. С конца текущего месяца устройства будут доступны в составе серверов z17 и LinuxONE 5, а в начале декабря ими начнут комплектоваться системы POWER11.

О разработке ускорителя Spyre Accelerator стало известно в августе прошлого года. Устройство создано исследовательским подразделением IBM Research и ориентировано на задачи инференса с низкой задержкой. Ускоритель особенно хорошо подходит для работы с генеративными приложениями и ИИ-агентами.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Технически Spyre Accelerator представляет собой плату расширения с интерфейсом PCIe 5.0 x16. В ее основе лежит нейропроцессор IBM с 32 ядрами и 128 Гбайт памяти LPDDR5. Ускоритель насчитывает 25,6 млрд транзисторов и выпускается по 5-нанометровой технологии. Энергопотребление устройства составляет 75 Вт.

IBM отмечает, что традиционные CPU и GPU сталкиваются со сложностями масштабирования и эффективности при решении ресурсоемких задач в области искусственного интеллекта. Ускорители Spyre созданы с учетом этих проблем. При необходимости можно объединить до 16 плат в кластер в системе POWER11 и до 48 плат в составе серверов z17.

В сочетании с процессорами Telum II, используемыми в z17 и LinuxONE 5, компании получат возможность одновременно запускать несколько ИИ-моделей. Важной особенностью является поддержка локального инференса, что минимизирует обращения к сторонним сервисам. Это не только сокращает задержки, но и повышает безопасность данных.

Среди потенциальных заказчиков нового ускорителя IBM называет финансовые организации, предприятия розничной торговли, государственные структуры, учреждения здравоохранения и промышленные предприятия. Для этих отраслей особенно важны низкие задержки при работе с ИИ-моделями и высокий уровень безопасности данных, что как раз обеспечивается решением IBM.

Появление Spyre Accelerator отражает тенденцию к созданию специализированных аппаратных решений для задач искусственного интеллекта, оптимизированных под конкретные сценарии использования.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.